Công cụ này mang tên Centaur, được công bố trên tạp chí Nature, có tiềm năng mở ra hướng nghiên cứu mới về cách con người ra quyết định.
Centaur được xây dựng bằng cách tinh chỉnh một mô hình ngôn ngữ lớn (LLM) - cụ thể là Llama của Meta - dựa trên dữ liệu khổng lồ từ 160 nghiên cứu tâm lý học, ghi nhận hơn 10 triệu lựa chọn của 60.000 người tham gia nhiều nhiệm vụ khác nhau, từ đánh bạc, trò chơi trí nhớ đến giải quyết vấn đề.
Khác với phần lớn mô hình trước đây chỉ chuyên về một tác vụ (như AlphaGo chỉ chơi cờ vây hoặc lý thuyết triển vọng chỉ dự đoán lựa chọn giữa mất mát và lợi ích), Centaur có thể mô phỏng hành vi con người trên nhiều dạng nhiệm vụ. Thậm chí, khi thử nghiệm với những tác vụ mà nó chưa từng được huấn luyện, Centaur vẫn dự đoán chính xác đáng kể lựa chọn của con người.
Nhóm nghiên cứu, dẫn đầu bởi Marcel Binz tại Viện Helmholtz về AI hướng con người (Munich, Đức), tin rằng Centaur có thể trở thành công cụ hỗ trợ đắc lực cho khoa học nhận thức. Ông Binz chia sẻ: “Bạn có thể tiến hành các thí nghiệm ảo thay vì phải mời người thật tham gia, nhất là khi việc tuyển người quá chậm hoặc khó khăn, ví dụ với trẻ nhỏ hay người mắc bệnh tâm thần”.
Trong quá trình đánh giá, Centaur được so sánh với Llama gốc và 14 mô hình nhận thức và thống kê khác. Kết quả cho thấy Centaur vượt trội ở 31 trong tổng số 32 nhiệm vụ - ngoại lệ duy nhất là bài kiểm tra phán đoán ngữ pháp câu. Ngoài ra, Centaur cũng hoạt động tốt khi gặp các phiên bản biến đổi của nhiệm vụ đã huấn luyện và những nhiệm vụ logic chưa từng thấy trước đó.
Theo Giáo sư Russell Poldrack, nhà thần kinh học nhận thức tại Đại học Stanford (Mỹ), thành công này chứng minh “hành vi con người có cấu trúc rất chặt chẽ” và “đặt ra tiêu chuẩn cao hơn cho các mô hình mà ngành tâm lý học cần hướng tới”.
Dù vậy, Centaur vẫn còn hạn chế. Hiện hệ thống này chủ yếu dựa trên các nhiệm vụ ngôn ngữ nên chưa thể dự đoán thời gian một người mất để đưa ra quyết định. Bên cạnh đó, phần lớn dữ liệu huấn luyện xuất phát từ các nhóm dân cư phương Tây, có thể làm giảm độ chính xác khi áp dụng cho cộng đồng đa dạng hơn.
Nhóm nghiên cứu đang mở rộng cơ sở dữ liệu lên gấp bốn lần hiện tại để khắc phục hạn chế này. Centaur đã được công bố miễn phí cho cộng đồng học thuật. Ông Binz nhấn mạnh: “Đây có lẽ là phiên bản kém nhất của Centaur mà chúng tôi từng có - và nó sẽ ngày càng tiến bộ hơn”.
Thanh Tùng (TTXVN)