AI chưa thể vượt qua thiếu niên thông minh
Lần đầu tiên trong lịch sử, các mô hình AI đã đạt được điểm vàng danh giá tại IMO, một trong những cuộc thi toán học hàng đầu thế giới. Thành công này là niềm tự hào không thể chối cãi cho những người ủng hộ công nghệ. Tuy nhiên, ngay cả những chương trình AI tiên tiến và thử nghiệm mới nhất của Google và OpenAI vẫn chưa thể vượt qua một thiếu niên cực kỳ thông minh.
Các chương trình AI tiên tiến và thử nghiệm mới nhất của Google và OpenAI vẫn chưa thể vượt qua một thiếu niên cực kỳ thông minh.
Nghe có vẻ nghịch lý, nhưng toán học phức tạp vẫn là một trong những rào cản lớn nhất của AI. Có nhiều phân tích về lý do tại sao điều này vẫn là một vấn đề, nhưng nói chung, nó liên quan đến cách hoạt động của công nghệ. Khi nhận được một câu hỏi, các AI như ChatGPT và Google Gemini phân tích từ và chữ cái thành các "mã thông tin" (tokens), sau đó phân tích và dự đoán câu trả lời phù hợp. Đối với AI, câu trả lời chỉ là chuỗi mã thông tin có khả năng cao nhất. Tuy nhiên, con người xử lý chúng dưới dạng từ, câu và ý nghĩ hoàn chỉnh.
Với những giới hạn này, AI không sở hữu khả năng "logic" cần thiết để xử lý các câu hỏi toán học phức tạp. Chủ yếu là vì các câu hỏi toán thường không có nhiều đáp án khả thi - chỉ có một giải pháp duy nhất, chính xác. Hôm nay, một chiếc máy tính bỏ túi sẽ luôn cho bạn kết quả đúng khi nhân 4596 với 4859 (22.331.964). Trong khi đó, ChatGPT có thể đưa ra đáp án sai như 22.325.364.
Kể từ năm 1959, IMO đã trở thành một trong những sự kiện hàng đầu thế giới dành cho các tài năng toán học trẻ tuổi. Nhiều nhà toán học cần nhiều thời gian hơn thời gian quy định để giải chỉ một bài toán của IMO - và hầu hết mọi người sẽ không thể giải được bài nào.
Gần đây nhất, Úc đã tổ chức cuộc thi IMO lần thứ 66 tại Queensland, nơi 641 thiếu niên từ 112 quốc gia tụ họp vào ngày 15/7 để giải 6 bài toán trong chưa đầy 4,5 giờ. Dù vậy, lần này, họ có thêm đối thủ: một cặp mô hình AI tư duy từ Google và OpenAI.
Các mô hình AI đã thể hiện tốt. Cả hai công ty đều công bố rằng chương trình của họ đạt điểm đủ cao trong bài kiểm tra IMO năm nay để giành huy chương vàng. Mỗi AI giải được 5 trong số 6 bài toán trong thời gian quy định, đạt 35/42 điểm tối đa. Năm nay, chỉ khoảng 10% thí sinh con người đạt điểm cấp vàng.
Cải tiến lớn và mối lo về năng lượng
Đây là một bước tiến lớn so với lần xuất hiện trước đó của Google tại IMO. Năm 2024, một phiên bản AI tư duy DeepMind của họ đạt huy chương bạc sau khi giải 4/6 bài toán, dù cần 2-3 ngày tính toán thay vì 4,5 giờ quy định.
Các mô hình trí tuệ nhân tạo như ChatGPT của OpenAI đã có những cải tiến lớn.
Theo chủ tịch IMO Gregor Dolinar, điểm nổi bật trong kết quả năm nay không chỉ là phép tính của các chương trình AI, mà còn là cách chúng giải thích quá trình "suy nghĩ" để đưa ra mỗi câu trả lời.
"Các giải pháp của chúng thật đáng kinh ngạc ở nhiều khía cạnh. Ban chấm thi IMO thấy chúng rõ ràng, chính xác và phần lớn dễ theo dõi", ông Dolinar nói qua thông báo của Google.
Vẫn còn một cột mốc cuối cùng tại IMO cho cả hai công ty: đạt điểm tuyệt đối. Năm nay, năm thiếu niên đã làm được điều đó. Và ngay cả khi Google hoặc OpenAI ngang bằng con người tại IMO trong những năm tới, chiến thắng này vẫn cần được xem xét trong bối cảnh cụ thể. Theo AFP, ban tổ chức IMO không thể xác nhận lượng sức mạnh tính toán mà mỗi mô hình AI yêu cầu, hoặc liệu có sự giám sát bổ sung nào từ con người trong quá trình tính toán hay không.
Dù bước tiến công nghệ mới nhất của AI rất ấn tượng, nó có thể đã tiêu tốn một lượng năng lượng và nước khổng lồ đáng lo ngại. Các công ty như Google, OpenAI và Microsoft đang đầu tư mạnh vào các dự án trung tâm dữ liệu để hỗ trợ các dự án AI - tất cả đều cần nguồn điện.
Trong một số trường hợp, điều này có thể bao gồm việc mở rộng sử dụng nhiên liệu hóa thạch. Các nhà quan sát trước đây ước tính rằng với tốc độ này, ngành công nghiệp AI có thể tiêu thụ lượng năng lượng tương đương với Argentina, nếu không muốn nói là nhiều quốc gia gộp lại. Đó là một vấn đề mà cả AI lẫn các nhà phát triển của nó chưa thể giải quyết.
Đức Bình