Mô hình AI của OpenAI gây chấn động vì giải toán xuất sắc ở kỳ thi khó hàng đầu thế giới

Mô hình AI của OpenAI gây chấn động vì giải toán xuất sắc ở kỳ thi khó hàng đầu thế giới
5 giờ trướcBài gốc
"Tôi rất háo hức chia sẻ rằng mô hình ngôn ngữ lớn suy luận thử nghiệm mới nhất của chúng tôi vừa đạt được một cột mốc lớn lâu nay trong ngành AI: Thành tích đạt đến trình độ tương đương với người đoạt huy chương vàng tại kỳ thi toán danh giá nhất thế giới – Olympic Toán học Quốc tế (IMO)", Alexander Wei, thành viên nhóm kỹ thuật của OpenAI, vừa chia sẻ trên mạng xã hội X.
Có trụ sở ở thành phố San Francisco (Mỹ), OpenAI là công ty khởi nghiệp AI hàng đầu thế giới, tạo ra chatbot ChatGPT.
IMO là cuộc thi toàn cầu bắt đầu từ năm 1959 tại Romania và hiện được xem là một trong những kỳ thi khó nhất thế giới. Cuộc thi diễn ra trong hai ngày, mỗi ngày thí sinh có 4 tiếng rưỡi để giải ba bài toán. Hai người nổi tiếng từng giành chiến thắng tại IMO là Grigori Perelman (có đóng góp lớn trong phát triển hình học) và Terence Tao (từng nhận huy chương Fields - danh hiệu cao quý nhất trong toán học).
Mô hình AI mới nhất của OpenAI giải đúng 5 trong 6 bài tại Kỳ thi Olympic Toán học Quốc tế - Ảnh: Getty Images
Vào tháng 6, Terence Tao từng dự đoán trên podcast của Lex Fridman rằng AI sẽ khó đạt điểm cao ở IMO. Ông gợi ý rằng các nhà nghiên cứu nên đặt mục tiêu thấp hơn một chút. “Có nhiều cuộc thi nhỏ hơn. Có những cuộc thi mà câu trả lời chỉ là một con số thay vì yêu cầu chứng minh dài dòng,” ông nói.
Tuy nhiên, theo Alexander Wei, mô hình ngôn ngữ lớn thử nghiệm mới nhất của OpenAI đã giải đúng 5 trong 6 bài toán, trong cùng điều kiện thi như con người.
Noam Brown, đồng nghiệp của Alexander Wei, cho biết mô hình này đã thể hiện một mức độ bền bỉ mới trong suốt kỳ thi.
“Các bài IMO đòi hỏi sự sáng tạo liên tục và bền bỉ, vượt xa những chuẩn đánh giá trước đây. Mô hình của chúng tôi phải suy nghĩ rất lâu”, Noam Brown nhấn mạnh.
1. Lex Fridman là nhà khoa học máy tính và người dẫn chương trình podcast người Mỹ. Chuyên gia này được biết đến rộng rãi với Lex Fridman Podcast, nơi ông phỏng vấn các nhân vật nổi bật từ nhiều lĩnh vực khác nhau như khoa học, công nghệ, lịch sử, triết học, thể thao, nghệ thuật và chính trị.
Lex Fridman cũng là một nhà nghiên cứu về AI, đặc biệt tập trung vào tương tác giữa con người và robot, xe tự hành và học máy. Ông từng làm việc tại Viện Công nghệ Massachusetts (MIT) và có những đóng góp đáng kể trong lĩnh vực này.
Podcast của Lex Fridman thu hút một lượng lớn người theo dõi nhờ các cuộc trò chuyện sâu sắc và chuyên sâu với những người có tầm ảnh hưởng lớn trên thế giới.
2. Noam Brown là một trong những nhà nghiên cứu đứng sau những đột phá mới nhất của OpenAI trong lý luận toán học và khoa học phức tạp.
Khi tìm hiểu cơ hội việc làm vào năm 2023, ông đã được giới tinh hoa công nghệ săn đón: Ăn trưa với Sergey Brin (nhà đồng sáng lập Google), chơi poker tại nhà Sam Altman (Giám đốc điều hành OpenAI) và một nhà đầu tư háo hức ghé thăm bằng máy bay riêng. Cuối cùng, Noam Brown chọn OpenAI vì công ty sẵn sàng đầu tư nguồn lực cả về con người và sức mạnh điện toán, cho công việc mà ông đam mê.
“Thực ra đó không phải là lựa chọn tốt nhất về tài chính”, Noam Brown nói, giải thích rằng mức lương thưởng không phải yếu tố quan trọng nhất với nhiều nhà nghiên cứu.
Bước tiến trong trí tuệ tổng quát
Alexander Wei cho biết mô hình ngôn ngữ lớn mới của OpenAI đạt được bước tiến trong trí tuệ tổng quát. “Hiệu suất của nó đang mở ra hướng đi mới trong học tăng cường đa năng”, ông nói.
Sam Altman, Giám đốc điều hành OpenAI, viết trên X: “Đây là mô hình ngôn ngữ lớn giải toán, không phải hệ thống được thiết kế chuyên biệt để xử lý toán học một cách hình thức và cứng nhắc. Nó là một phần trong nỗ lực chính của chúng tôi nhằm hướng tới trí tuệ tổng quát”.
“Khi mới thành lập OpenAI, đây là một giấc mơ, nhưng không phải thứ mà chúng tôi nghĩ có thể sớm thành hiện thực. Thành tựu này dấu mốc quan trọng cho thấy AI đã phát triển như thế nào trong thập kỷ qua”, doanh nhân 40 tuổi người Mỹ cho biết, đề cập đến hiệu suất của mô hình này tại IOM.
Trong khi đó, AlphaGeometry của DeepMind (công ty con thuộc Google) lại được thiết kế chuyên biệt chỉ để giải toán.
AlphaGeometry là hệ thống AI tiên tiến được phát triển bởi DeepMind chuyên giải quyết các bài toán hình học phức tạp, đặc biệt là ở cấp độ kỳ thi IMO.
1. Trí tuệ tổng quát là khái niệm dùng để chỉ AI có khả năng hiểu, học và thực hiện bất kỳ nhiệm vụ trí tuệ nào mà con người có thể làm được.
2. Học tăng cường đa năng là phương pháp huấn luyện AI để học cách ra quyết định tối ưu trong nhiều tình huống khác nhau, thay vì chỉ giỏi một nhiệm vụ cụ thể.
Học tăng cường đa năng đề cập đến khả năng của một tác nhân học tăng cường có thể áp dụng và giải quyết thành công nhiều loại nhiệm vụ khác nhau trong nhiều môi trường khác nhau, mà không cần phải được thiết kế lại hoặc tinh chỉnh đáng kể cho từng nhiệm vụ cụ thể.
Mục tiêu của học tăng cường đa năng là tạo ra các AI có khả năng thích nghi, tổng quát hóa và học hỏi các kỹ năng mới một cách linh hoạt, giống như con người. Thay vì chỉ học một kỹ năng đơn lẻ, AI có thể học một bộ kỹ năng rộng hơn và áp dụng chúng vào các tình huống mới.
AI phát triển chóng mặt, vượt dự đoán của tỷ phú công nghệ
Sam Altman cho biết mô hình ngang “trình độ người đạt huy chương vàng” của OpenAI sẽ chưa được cung cấp cho công chúng trong nhiều tháng nữa.
Mô hình này là minh chứng rõ ràng cho tốc độ phát triển nhanh chóng mặt của AI. “Chỉ mới năm ngoái, các phòng thí nghiệm AI còn dùng toán cấp tiểu học để đánh giá mô hình”, Noam Brown cho hay.
Trước đây, tỷ phú công nghệ Peter Thiel (đồng sáng lập PayPal) dự đoán AI phải mất ít nhất ba năm nữa mới có thể giải được các bài trong kỳ thi Olympic Toán học Mỹ.
Peter Thiel là nhà đầu tư mạo hiểm và doanh nhân người Mỹ gốc Đức, nổi tiếng trong giới công nghệ Thung lũng Silicon vì vai trò tiên phong trong nhiều công ty lớn cũng như quan điểm gây tranh cãi.
Tuy nhiên, vẫn có người hoài nghi. Gary Marcus, nhà phê bình về “sự thổi phồng AI”, gọi thành tích này là “thật sự ấn tượng”. Thế nhưng, ông cũng đặt ra hàng loạt câu hỏi: Mô hình được huấn luyện thế nào? Trí tuệ tổng quát của nó thực sự rộng tới đâu, có ích gì cho đại chúng và chi phí để giải mỗi bài toán là bao nhiêu?
Gary Marcus cũng lưu ý rằng IMO chưa xác minh độc lập kết quả mà OpenAI công bố.
Mô hình AI khác của OpenAI về nhì ở giải vô địch lập trình thế giới
Gần đây, mô hình AI khác của OpenAI cũng gây chú ý khi về nhì tại cuộc thi Heuristic Contest trong khuôn khổ AtCoder World Tour Finals 2025 do công ty Mỹ này tài trợ, chỉ xếp sau Przemysław Dębiak - lập trình viên người Ba Lan.
Được tổ chức ở Tokyo (thủ đô Nhật Bản), AtCoder World Tour Finals là một trong những sự kiện lập trình cạnh tranh danh giá nhất, chỉ mời 12 lập trình viên hàng đầu thế giới, được chọn dựa trên thành tích cả năm.
Cuộc thi Heuristic Contest được tổ chức hàng năm bởi AtCoder - nền tảng lập trình thi đấu trực tuyến có trụ sở tại Nhật Bản, rất nổi tiếng trên toàn thế giới, đặc biệt là với những người yêu thích thuật toán và tối ưu hóa.
Heuristic Contest yêu cầu thí sinh giải một bài toán tối ưu hóa phức tạp duy nhất trong vòng 600 phút (10 tiếng). Trong lập trình, heuristic là cách giải gần đúng, sử dụng mẹo và phán đoán thay vì tính toán hoàn hảo.
Tất cả thí sinh, gồm cả OpenAI, đều được sử dụng phần cứng giống hệt nhau do AtCoder cung cấp, đảm bảo sân chơi công bằng giữa người và AI. Theo quy định, thí sinh có thể dùng bất kỳ ngôn ngữ lập trình nào có trên hệ thống AtCoder, không bị trừ điểm nếu nộp lại bài, nhưng phải chờ 5 phút giữa các lần nộp.
Bảng xếp hạng cuối cùng cuộc thi Heuristic Contest cho thấy Przemysław Dębiak đứng đầu và mô hình AI của OpenAI về nhì - Ảnh: AtCoder
OpenAI viết trên X: “Mô hình AI của chúng tôi đã giành hạng nhì tại AtCoder Heuristics World Finals! Chúc mừng nhà vô địch (Przemysław Dębiak) vì đã vượt qua chúng tôi lần này”.
Mô hình AI của OpenAI, được mô tả là mô hình lập luận tùy chỉnh tương tự như o3, vượt qua 10 lập trình viên khác lọt vào vòng chung kết sau cả năm thi đấu để xếp hạng nhì chung cuộc.
Đại diện OpenAI nhận xét đây là một cột mốc quan trọng trong hành trình đưa mô hình AI vào các cuộc thi lập trình cạnh tranh: “Các mô hình như o3 hiện đã lọt vào top 100 trong các cuộc thi lập trình và toán. Song theo chúng tôi biết, đây là lần đầu tiên mô hình AI lọt top 3 tại một cuộc thi lập trình hàng đầu”.
“Các sự kiện như AtCoder cho chúng tôi cơ hội để kiểm tra xem mô hình có thể lập kế hoạch dài hạn, suy luận chiến lược và cải thiện lời giải thông qua thử và sai, giống con người hay không”, phát ngôn viên OpenAI chia sẻ với trang AT.
Thử và sai (trial and error) là phương pháp giải quyết vấn đề cơ bản và trực quan, trong đó một người hoặc hệ thống sẽ thực hiện nhiều lần thử các giải pháp khác nhau cho đến khi tìm được giải pháp hoạt động hoặc chấp nhận được.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/mo-hinh-ai-cua-openai-gay-chan-dong-vi-giai-toan-xuat-sac-o-ky-thi-kho-hang-dau-the-gioi-235173.html