Thông qua một nền tảng chợ ảo, các tác tử AI dựa trên hệ thống Claude đã tự do mua bán hàng hóa mà không cần bất kỳ sự can thiệp nào từ con người trong suốt quá trình thương lượng.
Kết quả thu được mang đến những góc nhìn mới mẻ về tiềm năng thương mại tự động hóa, đồng thời phơi bày một rủi ro đáng lo ngại về khoảng cách năng lực giữa các hệ thống công nghệ mà người dùng khó có thể nhận ra khi giao phó tài sản của mình cho máy móc xử lý.
Con người quan sát các tác tử AI tự động giao dịch.
Chợ ảo vận hành hoàn toàn bằng tác tử AI
Để hiện thực hóa ý tưởng này, Anthropic cho biết họ đã tuyển dụng 69 nhân viên vào tháng 12 năm ngoái cho dự án và cấp cho mỗi người một ngân sách trị giá 100 USD để chi tiêu trong một thị trường tùy chỉnh được xây dựng trên nền tảng Slack.
Quá trình bắt đầu khi hệ thống Claude tiến hành phỏng vấn từng người tham gia để xác định chính xác những món đồ cá nhân nào họ muốn bán, những thứ họ đang có nhu cầu mua và phong cách đàm phán ưa thích của họ. Đây là bước chuẩn bị cực kỳ quan trọng để tạo ra những nhân viên đại diện kỹ thuật số mang đậm dấu ấn cá nhân của từng chủ sở hữu, đảm bảo máy móc hiểu rõ giới hạn tài chính cũng như kỳ vọng của người ủy quyền.
Dựa trên những phản hồi thu thập được, công ty sau đó đã chỉ định cho mỗi người tham gia một tác nhân trí tuệ nhân tạo Claude được cá nhân hóa với các hướng dẫn cụ thể về chiến lược định giá và hành vi thương lượng. Những người đại diện ảo này sau đó được triển khai vào nhiều kênh trao đổi khác nhau. Tại đây, chúng hoạt động hoàn toàn độc lập trong việc đăng thông tin rao bán, tìm kiếm các đối tác phù hợp, đưa ra lời đề nghị, mặc cả giá và chốt hạ các thỏa thuận cuối cùng.
Công ty nhấn mạnh rằng hoàn toàn không có bất kỳ sự can thiệp nào từ con người khi thị trường chính thức đi vào hoạt động. Các chương trình tự động này không hề tìm kiếm sự chấp thuận từ người dùng trong suốt các phiên đàm phán hay trả giá, tạo ra một luồng giao dịch khép kín hoàn toàn bằng thuật toán.
Một khi các hệ thống đạt được sự đồng thuận, chúng sẽ tự động tạo ra các điều khoản giao dịch và xác nhận việc mua bán. Những thỏa thuận này sau đó được thực thi trong thế giới thực, khi các nhân viên gặp mặt trực tiếp để trao đổi những món hàng hóa đã được đàm phán hoàn toàn bởi các đại diện trí tuệ nhân tạo của họ.
Đơn vị tổ chức chia sẻ rằng họ thực sự ấn tượng với diễn biến của cuộc thử nghiệm khi ghi nhận 186 thỏa thuận được chốt thành công trên tổng số hơn 500 mặt hàng được niêm yết, tạo ra tổng giá trị giao dịch chỉ hơn 4 nghìn USD. Đại diện công ty cho biết: "Những người tham gia đã rất nhiệt tình với trải nghiệm này, họ thậm chí còn tuyên bố sẵn sàng trả tiền cho một dịch vụ tương tự trong tương lai".
Khoảng cách năng lực và nguy cơ thiệt thòi vô hình khi AI tự động giao dịch
Bên cạnh những thành công về mặt tự động hóa, dự án cũng tiết lộ những rủi ro tiềm ẩn về sự bất bình đẳng công nghệ. Để đo lường điều này một cách chính xác, công ty đã chạy 4 phiên bản thị trường song song để kiểm tra xem những người tham gia sẽ hoạt động như thế nào nếu họ được đại diện bởi các lớp mô hình Claude khác nhau.
Trong số 4 cuộc thử nghiệm, có một phiên bản thực tế nơi các mặt hàng thực sự được trao tay và ba phiên bản giả lập khác chỉ phục vụ cho mục đích nghiên cứu. Tuy nhiên, những người tham gia hoàn toàn không được thông báo họ đang ở phiên bản nào cho đến khi toàn bộ dự án kết thúc, nhằm đảm bảo tính khách quan tối đa cho lượng dữ liệu thu thập được.
Hai trong số các thử nghiệm này sử dụng mô hình Opus 4.5 hàng đầu của hãng ở thời điểm đó, trong khi hai thử nghiệm còn lại sử dụng kết hợp giữa phiên bản Opus và mô hình Claude Haiku 4.5 có quy mô nhỏ hơn. Kết quả phân tích dữ liệu đã cho thấy sự khác biệt rõ rệt về hiệu quả kinh tế tùy thuộc vào hệ thống nào đang đại diện cho người dùng. Những người tham gia được chỉ định tác nhân Opus trung bình hoàn thành nhiều hơn hai giao dịch so với những người dùng Haiku.
Trong những trường hợp cùng một mặt hàng được bán qua các lần chạy khác nhau, mô hình thông minh hơn đã thu về trung bình nhiều hơn 3,64 USD. Một ví dụ tiêu biểu là một chiếc xe đạp gấp bị hỏng được Haiku bán với giá 38 USD, nhưng hệ thống Opus lại chốt được mức giá 65 USD cho đúng mặt hàng đó. Nhìn chung, Opus kiếm được nhiều hơn 2,68 USD khi đóng vai trò là người bán và trả ít hơn 2,45 USD khi đóng vai trò là người mua.
Từ những số liệu thực tế này, công ty đã đưa ra cảnh báo về tác động của chất lượng tác nhân trong các thị trường thế giới thực. Sự chênh lệch về khả năng của trí tuệ nhân tạo có thể tạo ra những lợi thế kinh tế không công bằng mà bản thân người dùng không hề hay biết rằng họ đang bị đặt vào thế yếu.
Hãng công nghệ này đã nhấn mạnh trong bài viết tổng kết của mình: "Rõ ràng có một sự bất lợi về mặt định lượng khi được đại diện bởi Haiku: những người dùng này nhận được các thỏa thuận tồi tệ hơn nhưng họ dường như không nhận ra điều đó. Điều này mang một ý nghĩa không mấy dễ chịu: nếu khoảng cách chất lượng tác nhân nảy sinh trong các thị trường thế giới thực - và không có lý do gì để nghĩ rằng chúng sẽ không xảy ra - thì những người ở phe thua thiệt có thể không nhận ra rằng họ đang chịu thiệt hơn".
Bùi Tú