Giải mã Genie 3 - siêu trí tuệ và mô hình thế giới

Giải mã Genie 3 - siêu trí tuệ và mô hình thế giới
2 giờ trướcBài gốc
Hình ảnh Google Deepmind ra mắt Genie 3
Mô hình thế giới theo cách DeepMind định nghĩa
Genie 3 là mô hình AI mới của DeepMind, có khả năng tạo ra các thế giới 3D tương tác theo thời gian thực. DeepMind coi những mô hình thế giới như vậy là các khối nền tảng quan trọng để xây dựng siêu trí tuệ.
Sở dĩ DeepMind gọi Genie 3 là “mô hình thế giới” bởi vì nó tạo ra một thế giới ảo dựa trên chỉ dẫn từ prompt - hay chính xác hơn, là một khung cảnh 3D mô phỏng một phần của thế giới ảo. Prompt cho phép người dùng hoặc một tác nhân phần mềm tương tác ở mức độ nhất định, chẳng hạn di chuyển bên trong môi trường hoặc cầm nắm một vật thể. Mô hình sẽ phản hồi những hành động này bằng cách hiển thị trạng thái mới của thế giới sau khi thay đổi.
Tuy nhiên, trong nghiên cứu AI và robot, khái niệm “mô hình thế giới” thường được hiểu khác đi.
Mô hình thế giới trong nghiên cứu AI
Ngay cả khái niệm “trí tuệ” cũng chưa được định nghĩa rõ ràng, nên đương nhiên không tồn tại sự thống nhất về định nghĩa “siêu trí tuệ”. Dẫu vậy, nhiều quan điểm cho rằng một AI nên được đánh giá dựa trên năng lực thực hiện nhiệm vụ. Khi một hệ thống có thể làm việc tương đương con người, nó có thể được coi là thông minh. Loại trí tuệ nhân tạo tổng quát (AGI) này thường được xem là bước đầu tiên hướng tới siêu trí tuệ.
Hầu hết chuyên gia cũng đồng ý rằng các mô hình AI chỉ có thể hành xử một cách “thông minh” nếu chúng xây dựng được một sự hiểu biết trừu tượng về thế giới - tức mô hình thế giới. Mô hình thế giới chứa đựng kiến thức khái quát và trừu tượng hóa về các đối tượng và thực thể, nhưng quan trọng hơn là về mối quan hệ giữa chúng.
ChatGPT có sở hữu mô hình thế giới?
Câu hỏi này vẫn còn gây tranh cãi và có những bằng chứng thú vị ủng hộ lẫn phản đối. Bề ngoài, các mô hình ngôn ngữ lớn (LLM) chỉ là “cỗ máy thống kê” - tạo ra từ tiếp theo có xác suất cao nhất dựa trên dữ liệu huấn luyện, tức “những con vẹt ngẫu nhiên” (stochastic parrots).
Tuy nhiên, một số nhà nghiên cứu cho rằng dữ liệu huấn luyện vốn đã chứa rất nhiều kiến thức về thế giới và mô hình lưu trữ kiến thức này dưới dạng nén trong quá trình học, điều này đòi hỏi năng lực trừu tượng hóa.
Năm 2023, Kenneth Li (Đại học Harvard) cho thấy một mô hình ngôn ngữ lớn có thể học luật chơi cờ Othello chỉ từ các ví dụ. Nhưng kết quả này vẫn gây tranh luận vì các phép đo chưa đủ kết luận chắc chắn.
Hiện có một nghiên cứu mới về Othello với các mô hình ngôn ngữ nhỏ, vốn không đủ dung lượng để “ghi nhớ” toàn bộ trò chơi, nhưng vẫn tìm ra các nước đi hợp lý. Nhóm nghiên cứu cho rằng các mô hình này đã học luật chơi từ ví dụ, tức đã hình thành một mô hình thế giới nhỏ bên trong, mô phỏng vũ trụ Othello.
DeepMind cũng công bố nghiên cứu tương tự, huấn luyện mô hình chơi cờ vua ở trình độ khá cao. Ngược lại, nhà nghiên cứu phức hợp Melanie Mitchell và cộng sự đã thử nghiệm khả năng trừu tượng hóa của GPT-4 bằng các bài kiểm tra dạng hình ảnh (phi ngôn ngữ) từ năm 2023 và nhận thấy AI “không có dấu hiệu thể hiện khả năng trừu tượng hóa vững chắc ở mức con người”. Kết luận này vẫn đúng với các mô hình mới hơn và các phiên bản thử nghiệm mới.
Genie 3 và mối liên hệ với AGI
DeepMind từ lâu đã theo đuổi mục tiêu làm cho AI trở nên thông minh hơn bằng cách để chúng tự học cách giải quyết vấn đề. Phần mềm ban đầu sẽ thử nghiệm các hành động ngẫu nhiên để tìm lời giải, sau đó một vòng phản hồi sẽ thưởng cho các hành động thành công. Hệ thống vì vậy sẽ lặp lại nhiều hơn những hành động hiệu quả và dần cải thiện. Cách tiếp cận này được gọi là học tăng cường (reinforcement learning).
Về nguyên tắc, theo nhà nghiên cứu AI Matthew Botvinick (DeepMind, 2018), kiểu meta-learning này là “chìa khóa thiết yếu để đạt tới trí tuệ nhân tạo tổng quát”. Ông giải thích: “Thế giới của chúng ta có một đặc điểm đặc thù: Chúng ta không bao giờ trải qua cùng một tình huống hai lần, nhưng cũng không bao giờ gặp một tình huống hoàn toàn mới. Mọi hệ thống thông minh vì thế phải có khả năng tận dụng kinh nghiệm quá khứ và áp dụng vào nhiệm vụ mới một cách nhanh chóng và khéo léo”.
Thách thức lớn hiện nay là xây dựng các hệ thống có thể khám phá những khái niệm ngày càng trừu tượng. Botvinick tin rằng một yếu tố then chốt là tìm ra môi trường thích hợp để các hệ thống AI có thể huấn luyện, sinh tồn và học hỏi. Việc tìm kiếm môi trường này là một trong những mục tiêu lớn của nghiên cứu AI. Genie 3 có vẻ chính là nỗ lực nhằm tạo ra một môi trường phức tạp như vậy để huấn luyện các tác nhân AI tự trị (Autonomous AI agent là một hệ thống AI tiên tiến có khả năng thực hiện một loạt các nhiệm vụ phức tạp một cách độc lập để đạt được một mục tiêu cụ thể, với sự can thiệp tối thiểu từ con người).
Bùi Tú
Nguồn Một Thế Giới : https://1thegioi.vn/giai-ma-genie-3-sieu-tri-tue-va-mo-hinh-the-gioi-236251.html