PewDiePie đã dành nhiều tháng để huấn luyện AI. Ảnh: PewDiePie/YouTube.
YouTuber gaming nổi tiếng nhất thế giới PewDiePie mới đây đã khiến người hâm mộ và giới chuyên gia ngạc nhiên khi lấn sân sang lĩnh vực phát triển phần mềm. Nam YouTuber đã dành nhiều tuần để nghiên cứu và tinh chỉnh (fine-tune) một mô hình ngôn ngữ lớn (LLM) dựa trên mã nguồn mở.
Thay vì xây dựng từ con số 0, PewDiePie đã sử dụng mô hình mã nguồn mở "Qwen 2.5" để tinh chỉnh. Mục tiêu của anh là tự học cách huấn luyện AI và thử thách giới hạn của bản thân so với các sản phẩm thương mại hàng đầu.
Trong một video được tải lên mới đây, PewDiePie khẳng định mô hình AI của anh đã có thời điểm đạt được số điểm cao hơn đáng kể so với ChatGPT (GPT-4) của OpenAI hay Deepseek 2.5 trong các bài kiểm tra tiêu chuẩn (benchmarks).
Hệ thống máy tính trị giá 20.000 USD của Pewdiepie dùng để huấn luyện AI. Ảnh: PewDiePie/YouTube.
Để đánh giá năng lực, anh sử dụng bài kiểm tra có tên “Aider Polyglot”. Tại đây, các AI danh tiếng như DeepSeek 2.5 hay Llama 4 Maverick của Meta chỉ đạt điểm số hơn 18%. Ban đầu, mô hình của PewDiePie chỉ đạt 8%, nhưng sau khi thay đổi định dạng dữ liệu, con số này đã tăng lên 16%.
Quyết không dừng lại, nam YouTuber đã thu thập khoảng 100.000 mẫu dữ liệu (bao gồm bài toán và lời giải) từ GitHub và các nguồn công khai. Anh còn áp dụng kỹ thuật "suy luận" (reasoning) với 15.000 mẫu bổ sung để ép AI phải tư duy từng bước trước khi trả lời.
Kết quả ban đầu gây ngạc nhiên, khi mô hình đạt tới 19,6%, chính thức vượt qua GPT-4 vào thời điểm tháng 11. Tuy nhiên, PewDiePie sớm phát hiện ra sai sót khi dữ liệu huấn luyện bị trùng với câu hỏi kiểm tra, dẫn đến kết quả "ảo". Anh quyết định hủy bỏ kết quả và làm lại từ đầu.
Sau khi sửa lỗi và chuyển sang phiên bản AI chuyên dụng cho lập trình, điểm số của mô hình đã có sự bứt phá ngoạn mục qua từng giai đoạn tinh chỉnh. Từ mức khởi điểm thấp kỷ lục chỉ 4,4%, con số này đã vọt lên 25% ngay sau khi anh thực hiện các điều chỉnh cần thiết.
Hiệu suất tiếp tục chạm mốc 36% khi hệ thống được chạy đầy đủ các bài kiểm tra trên những ngôn ngữ lập trình phổ biến. Cuối cùng, hành trình huấn luyện khép lại ở con số ấn tượng 39,1% sau khi PewDiePie bổ sung thêm 1.500 mẫu dữ liệu chuyên sâu vào giai đoạn hậu huấn luyện.
Dù kết quả 39,1% là rất cao, ngay khi anh hoàn thành, phiên bản Qwen 3 mới ra mắt đã đạt mốc 40%, khiến thành quả của anh lại một lần nữa bị bám đuổi sát sao.
Để đạt được những con số ấn tượng trên, PewDiePie cũng đã phải trả giá không nhỏ. Nam YouTuber tiết lộ tổng số tiền đầu tư cho hệ thống máy tính tự lắp ghép phục vụ dự án này lên tới 20.000 USD (khoảng 500 triệu đồng).
Do hệ thống tiêu thụ hơn 2.000W điện để duy trì, anh đã liên tục gặp sự cố cháy dây nguồn và suýt cháy nhà. Thậm chí, một chiếc card đồ họa đắt tiền đã bị hỏng hoàn toàn, trong khi máy tính thường xuyên rơi vào tình trạng đình trệ do quá tải nhiệt.
Việt Anh