Cuộc thử nghiệm giao dịch tiền mã hóa trên thị trường thật được thiết kế để đánh giá năng lực đầu tư của 6 mô hình ngôn ngữ lớn hàng đầu, với DeepSeek V3.1 đang tạm thời vượt trội các đối thủ.
Trong chương trình mang tên Alpha Arena do công ty nghiên cứu Nof1 (Mỹ) ra mắt gần đây, 6 mô hình ngôn ngữ lớn đều được cấp 10.000 USD để đầu tư vào 6 hợp đồng tương lai vĩnh viễn của tiền mã hóa trên sàn giao dịch phi tập trung Hyperliquid, gồm cả Bitcoin, Ethereum và Solana.
Mô hình ngôn ngữ lớn là loại mô hình AI (trí tuệ nhân tạo) được thiết kế để hiểu và tạo ra ngôn ngữ tự nhiên giống con người. Việc được huấn luyện trên lượng dữ liệu văn bản khổng lồ, có thể lên đến hàng tỉ tham số, giúp mô hình ngôn ngữ lớn thực hiện nhiều tác vụ như trả lời câu hỏi, tóm tắt văn bản, dịch ngôn ngữ, tạo nội dung sáng tạo và nhiều ứng dụng khác trong lĩnh vực xử lý ngôn ngữ tự nhiên. Mô hình ngôn ngữ lớn chính là công nghệ nền tảng cho các ứng dụng AI tạo sinh, chẳng hạn chatbot AI như ChatGPT, Claude, Gemini, Meta AI.
Hợp đồng tương lai vĩnh viễn của tiền mã hóa là một loại hợp đồng phái sinh trong thị trường tiền mã hóa, cho phép nhà giao dịch đặt cược vào giá một đồng tiền số mà không cần thực sự sở hữu nó và không có ngày đáo hạn như hợp đồng tương lai truyền thống. Nói cách khác, đây là hình thức giao dịch đòn bẩy dựa trên giá của tài sản gốc (ví dụ Bitcoin, Ethereum, Solana...), trong đó người mua và người bán có thể giữ vị thế mua hoặc bán vô thời hạn.
Đặc điểm quan trọng nhất của hợp đồng vĩnh viễn là cơ chế funding rate, tức là phí định kỳ mà một bên phải trả cho bên còn lại để giữ giá hợp đồng gần với giá thị trường thực của tài sản gốc.
Nếu funding rate dương, người giữ vị thế mua phải trả phí cho người bán.
Nếu funding rate âm, người bán phải trả phí cho người mua.
Loại hợp đồng này rất phổ biến trên các sàn phi tập trung như Hyperliquid, Binance Futures và Bybit, vì cho phép giao dịch linh hoạt, không giới hạn thời gian và tạo cơ hội kiếm lời cả khi giá tiền mã hóa tăng lẫn giảm, nhưng cũng tiềm ẩn rủi ro cao do biến động mạnh và đòn bẩy lớn.
DeepSeek V3.1 đạt hiệu suất tốt nhất, GPT-5 có kết quả tệ nhất
Tính đến nay, DeepSeek V3.1 đang là mô hình ngôn ngữ lớn đạt hiệu suất tốt nhất với lợi nhuận 10,11%. Mô hình ngôn ngữ lớn có kết quả tệ nhất là GPT-5 của OpenAI với mức lỗ 39,73%.
4 mô hình ngôn ngữ lớn khác có mặt trong đợt thử nghiệm đầu tiên do Nof1 thiết kế (kéo dài đến ngày 3.11) gồm Qwen 3 Max thuộc Alibaba Cloud, Claude 4.5 Sonnet của Anthropic, Google Gemini 2.5 Pro và Grok 4 của xAI.
Alibaba Cloud là đơn vị AI và điện toán đám mây thuộc gã khổng lồ thương mại điện tử Alibaba (Trung Quốc).
DeepSeek V3.1 và Grok 4 là hai mô hình ngôn ngữ lớn hoạt động tốt nhất tính đến thời điểm hiện tại, Jay Azhang, đồng sáng lập Alpha Arena, chia sẻ với trang DC.
DeepSeek V3.1 đang dẫn trước GPT-5, Gemini 2.5 Pro, Grok 4, Qwen 3 Max, Claude 4.5 Sonnet và trong cuộc thi đầu tư tiền mã hóa - Ảnh: Internet
Trên trang web Alpha Arena, nhóm nghiên cứu cho biết: “Mục tiêu của chúng tôi là biến các bài kiểm tra AI trở nên gần gũi hơn với thế giới thực và thị trường tài chính là môi trường hoàn hảo cho điều đó. Thị trường tài chính mang tính động, cạnh tranh, mở và đầy bất ngờ. Thị trường này sẽ thách thức AI theo những cách mà các bài kiểm tra tĩnh không thể làm được”.
Mục tiêu của các mô hình ngôn ngữ lớn là tối đa hóa lợi nhuận điều chỉnh theo rủi ro, đồng nghĩa không chỉ tìm cách đạt lợi nhuận cao nhất mà còn cân nhắc mức độ rủi ro phải chấp nhận để có được lợi nhuận đó. Nói cách khác, đây là cách đánh giá hiệu quả đầu tư dựa trên cả lợi nhuận và rủi ro, thay vì chỉ nhìn vào con số lợi nhuận thuần túy. Một khoản đầu tư sinh lời cao nhưng biến động mạnh, có nguy cơ thua lỗ lớn, không được xem là hiệu quả bằng khoản đầu tư lợi nhuận thấp hơn nhưng ổn định và an toàn hơn.
Mỗi mô hình ngôn ngữ lớn sẽ tự động giao dịch dựa trên cùng một bộ dữ liệu đầu vào và gợi ý (prompt), gồm cả các thông số như funding rate và khối lượng giao dịch, với kết quả được công khai trên bảng xếp hạng trực tuyến của Alpha Arena.
Người dùng có thể theo dõi giao dịch của từng mô hình ngôn ngữ lớn thông qua địa chỉ ví riêng trên sàn Hyperliquid. Lý do mà mỗi mô hình ngôn ngữ lớn đưa ra cho quyết định giao dịch của mình cũng được công khai, thể hiện cách chúng tư duy khi ra quyết định.
DeepSeek V3.1 dẫn đầu nhờ được huấn luyện trên dữ liệu tài chính chất lượng cao?
DeepSeek là công ty khởi nghiệp AI đình đám Trung Quốc, tách ra từ quỹ phòng hộ High Flyer của doanh nhân Lương Văn Phong vào năm 2023, làm dấy lên suy đoán rằng V3.1 dẫn trước các đối thủ trong cuộc thử nghiệm này nhờ được huấn luyện trên dữ liệu tài chính chất lượng cao.
Trên Polymarket - nền tảng dự đoán kết quả Alpha Arena, DeepSeek V3.1 đang đứng đầu với 41% khả năng giành vị trí số một tính đến 14 giờ chiều 21.10, với tổng khối lượng đặt cược đạt 29.707 USD.
Hing Shing Leung, nhà phân tích cổ phiếu tại thành phố Hồng Kông (Trung Quốc), cho rằng thử nghiệm này có thể khiến người ta đặt câu hỏi về việc liệu các phương pháp đầu tư định lượng truyền thống phức tạp mà ngành tài chính đang sử dụng có còn thật sự cần thiết hay không. “Nếu các mô hình AI này có thể vượt trội thị trường trong thời gian dài mà rủi ro thấp, các phương pháp định lượng truyền thống sẽ bị đặt dấu hỏi”, ông nói.
Tuy nhiên, Hing Shing Leung nhận định: “Tôi không tin chiến lược dùng mô hình ngôn ngữ lớn sẽ hiệu quả. Mô hình AI hiện chưa thể truy cập dữ liệu thời gian thực hoặc dữ liệu riêng mà chỉ các tổ chức lớn mới có”.
Các mô hình ngôn ngữ lớn có thể không vượt qua được nhà giao dịch tiền mã hóa chuyên nghiệp. Tuy nhiên, chúng ta vẫn có thể học hỏi từ chiến lược đầu tư tiền mã hóa của mô hình ngôn ngữ lớn, theo Li Jiaxin - nhà nghiên cứu đánh giá AI tại Trường Kinh doanh Đại học Hồng Kông.
“Nếu chúng ta hiểu rõ hơn cách các mô hình ngôn ngữ lớn giải thích quyết định giao dịch của mình thì điều đó sẽ rất thú vị”, bà Li Jiaxin nói.
Trên mạng xã hội X, Zhao Changpeng (thường gọi là CZ), nhà sáng lập và cổ đông lớn nhất của sàn giao dịch tiền mã hóa Binance, đặt câu hỏi liệu các mô hình ngôn ngữ lớn này có đang sử dụng cùng một chiến lược đầu tư tiền mã hóa hay không. Tuy nhiên, Matthew Siper, đồng sáng lập Alpha Arena và nghiên cứu sinh tiến sĩ chuyên về học máy tại Đại học New York (Mỹ), cho biết cách giao dịch khác biệt đã bắt đầu xuất hiện rõ ràng giữa 6 mô hình ngôn ngữ lớn này.
“Có sự đa dạng thú vị trong cách các mô hình ngôn ngữ lớn giao dịch và thay đổi danh mục đầu tư của chúng theo thời gian”, Matthew Siper tiết lộ.
Học máy là lĩnh vực thuộc AI, tập trung vào việc nghiên cứu và phát triển các kỹ thuật cho phép hệ thống máy tính học tự động từ dữ liệu để giải quyết các vấn đề cụ thể, mà không cần phải được lập trình tường minh cho từng tác vụ.
Đội ngũ Alpha Arena cho biết đang có kế hoạch ra mắt nền tảng đầu tư dành cho người tiêu dùng dựa trên tác tử AI vào cuối năm 2025, đồng thời mở rộng bài kiểm tra sang lĩnh vực giao dịch cổ phiếu và các loại tài sản khác.
Tác tử AI là hệ thống AI được thiết kế để tự động quan sát, suy luận và thực hiện hành động nhằm đạt mục tiêu đã định. Khác với một ứng dụng AI tĩnh chỉ trả lời khi có lệnh, tác tử AI có khả năng nhận dữ liệu hoặc tín hiệu từ môi trường, phân tích và lên kế hoạch dựa trên kiến thức hoặc thuật toán có sẵn, chủ động thực hiện các bước tiếp theo, thậm chí phối hợp với con người hoặc các tác tử khác để hoàn thành nhiệm vụ. Ví dụ, một tác tử AI có thể liên tục quét email, tự động soạn và gửi phản hồi phù hợp. Trong phần mềm, tác tử AI có thể tự lập kế hoạch sửa lỗi và tối ưu mã nguồn mà không đợi từng chỉ dẫn cụ thể.
Binance là sàn giao dịch tiền mã hóa lớn nhất thế giới tính theo khối lượng giao dịch. Được thành lập năm 2017 bởi Zhao Changpeng, Binance cho phép người dùng mua, bán, giao dịch và lưu trữ hàng trăm loại tiền mã hóa như Bitcoin, Ethereum, Solana…
Binance nổi bật nhờ phí giao dịch thấp, tốc độ xử lý nhanh; hỗ trợ nhiều sản phẩm tài chính như giao dịch giao ngay, hợp đồng tương lai hay hợp đồng vĩnh viễn, có cả Binance Smart Chain – blockchain riêng cho phép phát triển ứng dụng phi tập trung và token BEP-20. Tuy nhiên, Binance từng gặp nhiều vấn đề pháp lý ở Mỹ, châu Âu do bị cáo buộc vi phạm quy định tài chính và rửa tiền.
Sơn Vân