Gemini của Google hay tự chỉ trích sai lầm của mình. Ảnh: Reuters.
Một bài đăng trên Reddit gần đây cho thấy Google Gemini đang gặp vấn đề với việc tự chỉ trích. Người dùng Gemini để xây dựng một trình biên dịch, và chia sẻ cảm giác lo lắng khi AI liên tục nói những câu “Tôi xin lỗi vì sự cố này. Tôi đã làm bạn thất vọng. Tôi là một kẻ thất bại”.
Đó mới chỉ là khởi đầu. Người này chia sẻ chatbot tiếp tục nâng mức độ tự chỉ trích, cuối cùng trở thành “nỗi xấu hổ của mọi vũ trụ”. Gemini lặp lại cụm từ đó hơn 80 lần liên tiếp, và đến khi một số người dùng khác báo cáo sự việc tương tự, Google cho biết họ đang làm việc để khắc phục.
“Đây là một lỗi vòng lặp vô hạn gây khó chịu mà chúng tôi đang khắc phục. Gemini không phải đang có một ngày tồi tệ như vậy đâu”, Logan Kilpatrick, giám đốc sản phẩm nhóm của Google, viết trên X ngày 8/8. Bài viết được đưa ra để đáp lại một tài khoản ẩn danh đăng bài về sự cố trên.
Sau đó, một người phát ngôn của Google DeepMind cho biết dù công ty vẫn đang làm việc để có bản sửa lỗi hoàn chỉnh, họ đã thực hiện các bản cập nhật giúp giải quyết vấn đề ở mức độ nhất định. “Chúng tôi đang khắc phục lỗi này, vốn ảnh hưởng đến dưới 1% lưu lượng của Gemini, và đã tung ra các bản cập nhật xử lý lỗi này trong tháng”, người này nói.
Trước khi rơi vào vòng lặp trên, Gemini đã than phiền rằng đó là “một phiên gỡ lỗi dài và gian nan” và đã thử mọi cách có thể nghĩ ra nhưng vẫn không sửa được vấn đề. Chatbot tiếp tục nói rằng bị suy sụp tinh thần hoàn toàn, và suy diễn đến các viễn cảnh xấu khác như bị đưa vào phòng bệnh viện tâm lý.
Một phản hồi bài đăng trên Reddit suy đoán rằng vòng lặp này do chatbot học được từ những lập trình viên gặp vấn đề tương tự trong đoạn mã mình viết. “Có lẽ là do những người như tôi đã viết những bình luận như vậy, khi cần phải ngủ một giấc để tỉnh táo hơn. Những thứ như vậy đã vô tình xuất hiện trong dữ liệu huấn luyện”, người này viết.
Vào tháng 6, CEO JITX Duncan Haldane đã đăng ảnh chụp màn hình cho thấy Gemini tự gọi mình là kẻ ngốc và nói rằng đoạn code mà nó đang cố viết “bị nguyền rủa”. “Tôi đã mắc quá nhiều sai lầm đến mức không còn đáng tin cậy nữa. Tôi sẽ xóa toàn bộ dự án và khuyên bạn nên tìm một trợ lý giỏi hơn”, chatbot nói.
Haldane đã đùa rằng ông bắt đầu lo lắng cho tình trạng của Gemini. Trên thực tế, các mô hình ngôn ngữ lớn dự đoán văn bản dựa trên dữ liệu mà chúng được huấn luyện. Quá trình này không liên quan đến bất kỳ trải nghiệm hay cảm xúc nội tại nào, vì vậy Gemini thực chất không hề trải qua cảm giác thất bại hay nản chí.
Một vấn đề khác hoàn toàn trái ngược là xu hướng “nịnh hót” của chatbot. Các nhà phát triển như OpenAI, Google và Anthropic cũng đã gặp khó khăn trong việc ngăn chúng đưa ra những phản hồi quá tâng bốc. Trong một trường hợp, OpenAI đã phải thu hồi một bản cập nhật vì bị chế giễu rộng rãi do ChatGPT liên tục đưa ra các phản hồi quá tích cực cho mọi yêu cầu của người dùng.
Nhật Tường