Hằng năm, một nhóm kín gồm các nhà kinh tế, nhà đầu tư quỹ phòng hộ và lãnh đạo công nghệ cùng tham gia trò chơi dự báo tương lai do David Seif tổ chức. Cuộc thi đã kéo dài 7 năm nhưng đến 2025 mới xuất hiện nhân vật đặc biệt không phải con người, đó là ChatGPT.
David Seif là nhà kinh tế học xuất thân từ Học viện Công nghệ Massachusetts và Đại học Harvard (Mỹ), với hơn 15 năm kinh nghiệm tại các quỹ đầu tư lớn. HiệnDavid Seif là nhà kinh tế trưởng phụ trách các nền kinh tế phát triển tại tập đoàn tài chính Nomura (Nhật Bản), nơi ông có tiếng nói quan trọng trong phân tích vĩ mô và thị trường tài chính toàn cầu.
David Seif tổ chức cuộc thi dự đoán bí mật có ChatGPT tham gia - Ảnh: Fazzaco
Cuộc thi yêu cầu người tham gia dự đoán 30 sự kiện sẽ diễn ra trong năm 2025, từ chính trị, kinh tế, khoa học đến thể thao và giải trí. Mỗi người phải đưa ra xác suất phần trăm cho từng sự kiện, sau đó được chấm điểm dựa trên mức độ chính xác.
Một câu hỏi yêu cầu dự đoán liệu nữ ca sĩ Taylor Swift và cầu thủ bóng bầu dục Travis Kelce có công bố đính hôn trước ngày 1.4.2025 hay không? Một câu khác hỏi liệu Bulgaria có thông qua đồng euro làm tiền tệ chính thức vào hoặc trước ngày 1.7.2025?
Taylor Swift và Travis Kelce đã đính hôn hôm 27.8.2025 sau gần hai năm yêu nhau.
Bulgaria đang tiến tới áp dụng đồng euro vào ngày 1.1.2026.
Cuối năm 2024, khi đang chuẩn bị bảng dự đoán, Sam Leffell (giám đốc tại một quỹ phòng hộ) nảy ra ý tưởng thử cho ChatGPT tham gia. Ông liên hệ với David Seif và nhận được sự đồng ý.
Sam Leffell liền sao chép toàn bộ quy tắc trò chơi để ChatGPT đọc và yêu cầu chatbot AI của OpenAI dự đoán cả 30 sự kiện. Chỉ trong vài phút, ChatGPT hoàn thành việc này.
Đây là những quy tắc rất phức tạp, kéo dài nhiều trang. Người chơi phải đưa ra một tỷ lệ phần trăm dựa trên khả năng xảy ra của mỗi sự kiện. Khi kết quả xuất hiện trong năm, các dự đoán được chấm điểm giống như chơi golf. Điểm thấp nhất sẽ thắng.
David Seif giải thích rằng người chơi được chấm điểm dựa trên bình phương độ lệch giữa dự đoán và kết quả thực tế. Ví dụ, bạn dự đoán một sự kiện có 90% khả năng xảy ra. Nếu sự kiện đó xảy ra thật, độ lệch chỉ là 10 và điểm số là 10 bình phương thành 100 điểm. Đây là kết quả tốt.
Song nếu sự kiện đó không xảy ra, độ lệch sẽ là 90. Khi bình phương, bạn phải nhận tới 8.100 điểm. Đây là mức điểm rất xấu, hay đồng nghĩa bạn dự đoán kém chính xác.
Sam Leffell cho biết ChatGPT gây bất ngờ ở câu hỏi liên quan đến khả năng một đội NFL (Giải Bóng bầu dục Quốc gia Mỹ) lọt vào vòng wild card. Wild card là suất dự playoff dành cho các đội không vô địch bảng nhưng có thành tích tốt.
ChatGPT đưa ra câu trả lời dựa trên tính toán thống kê khá chính xác, điều mà không nhiều người kỳ vọng vào thời điểm đó.
Trong năm 2025, kết quả từng sự kiện lần lượt được công bố và bảng xếp hạng liên tục được cập nhật. Những người tham gia, trong đó có nhiều chuyên gia tài chính, theo sát diễn biến này một cách say mê.
Cuộc thi kết thúc gần đây. Lần đầu tiên, chính người tổ chức là David Seif đứng đầu bảng, theo trang Insider. ChatGPT xếp thứ 80 trong tổng số 160. Con số này gây ra hai luồng ý kiến trái chiều. Có người cho rằng ChatGPT chưa đủ ấn tượng vì chỉ đứng đúng mức trung bình. Ngược lại, một số người đánh giá đây là kết quả đáng nể vì chatbot AI đình đám chỉ mất vài phút để làm công việc mà con người phải dành hàng giờ nghiên cứu.
Tuy nhiên theo David Seif, có một chuẩn so sánh đáng chú ý hơn. Nếu tất cả sự kiện đều được dự đoán với xác suất 50%, tổng điểm sẽ là 75.000. Đây được xem như mức cơ bản để đánh giá người chơi có tạo ra giá trị hay không. ChatGPT đạt 82.925 điểm, tức là thấp hơn mức kỳ vọng.
ChatGPT xếp thứ 80 trong cuộc thi dự đoán 30 sự kiện có 159 chuyên gia công nghệ và kinh tế tham gia - Ảnh: Insider
ChatGPT dự đoán chính xác nhất ở câu hỏi dạng nào?
ChatGPT làm tốt nhất ở những câu hỏi có nhiều dữ liệu quá khứ để tham khảo, chẳng hạn dự đoán đội vô địch FIFA Club World Cup nhiều khả năng đến từ châu Âu (Chelsea vô địch giải này - PV).
Ngược lại, chatbot AI này thất bại khi bối cảnh thay đổi nhanh và cần cập nhật thông tin liên tục. Ví dụ, ChatGPT cho rằng hai phi hành gia NASA (Cơ quan Hàng không và Vũ trụ Quốc gia Mỹ) là Suni Williams và Butch Wilmore gần như chắc chắn trở về Trái Đất trước ngày 1.3. Song đến cuối năm 2024, nhiều nguồn tin cho thấy nhiệm vụ cứu hộ đó khó thể diễn ra kịp thời hạn.
Trên thực tế, Butch Wilmore và Suni Williams đã trở về Trái đất vào ngày 18.3 trên tàu vũ trụ SpaceX Crew Dragon, sau khi trải qua 286 ngày bị mắc kẹt trên Trạm Vũ trụ Quốc tế (ISS). Tàu vũ trụ Crew Dragon đã tách khỏi ISS lúc 1 giờ 5 sáng (giờ Đông Mỹ) và hạ cánh an toàn xuống vùng biển ngoài khơi bang Florida vào lúc 17 giờ 57 cùng ngày. Cùng với Butch Wilmore và Suni Williams, hai phi hành gia khác thuộc phi hành đoàn Crew-9 của NASA cũng trở về trong chuyến bay kéo dài 17 giờ.
Sam Leffell cho rằng vẫn có nhiều yếu tố cần cân nhắc khi đánh giá hiệu quả của ChatGPT trong cuộc thi.
Thứ nhất, phiên bản ChatGPT này đưa ra dự đoán vào cuối năm 2024, lạc hậu so với khả năng hiện tại.
Thứ hai, ChatGPT mất chưa đến 10 phút để hiểu quy tắc và đưa ra 30 dự đoán, trong khi nhiều người phải dành cả tuần. Nếu tính theo hiệu quả trên mỗi phút làm việc, chatbot AI của OpenAI thậm chí vượt qua phần lớn người chơi.
Là nhà đầu tư, Sam Leffell nhìn thấy tiềm năng lớn hơn của ChatGPT.
"Nếu bạn không dự đoán nhanh 30 sự kiện mà là 30.000 thì sao? Nếu ChatGPT đủ tốt để đưa ra hàng loạt dự đoán nhanh thì thế nào?", ông nói.
Với tốc độ và khả năng xử lý dữ liệu quy mô lớn, các chatbot AI như ChatGPT có thể trở thành công cụ quan trọng trong ngành tài chính lẫn nhiều lĩnh vực khác.
"Khi bạn phải đánh giá hàng loạt khả năng cùng lúc, AI trở thành công cụ không thể thiếu. Hiện giờ, ChatGPT gần như là tiêu chuẩn cơ bản trong công việc", Sam Leffell nhận xét.
Sơn Vân