Mô hình Qwen-3-Max-Preview sở hữu hơn một nghìn tỷ tham số. Ảnh: Reuters.
Alibaba Group Holding vừa phát hành mô hình trí tuệ nhân tạo lớn nhất từ trước đến nay của công ty, đánh dấu bước tiến mới trong cuộc đua AI toàn cầu. Với tên gọi Qwen-3-Max-Preview, đây là mô hình đầu tiên của tập đoàn công nghệ Trung Quốc vượt ngưỡng một nghìn tỷ tham số, đưa Alibaba vào hàng ngũ các “ông lớn” như OpenAI, Google DeepMind hay Anthropic.
Mô hình mới được ra mắt ngày 5/9, hiện đã có mặt trên nền tảng dịch vụ đám mây Alibaba Cloud và chợ mô hình ngôn ngữ lớn OpenRouter. Qwen-3-Max-Preview tiếp nối dòng Qwen3, vốn được giới thiệu lần đầu hồi tháng 5 với các phiên bản dao động từ 600 triệu-235 tỷ tham số.
Trong lĩnh vực AI, tham số được coi là “trí thông minh” của hệ thống, là những biến số được điều chỉnh trong quá trình huấn luyện. Số lượng tham số càng lớn thường đồng nghĩa với khả năng mạnh mẽ hơn và cũng đòi hỏi sức mạnh tính toán khổng lồ. Để so sánh, GPT-4.5 của OpenAI, một trong những mô hình lớn nhất hiện nay, được ước tính có từ 5-7 nghìn tỷ tham số.
Theo công bố, Qwen-3-Max-Preview là mô hình xử lý văn bản, vượt trội hơn Qwen3-235B-A22B-2507. Trong các thử nghiệm nội bộ, Qwen-3-Max-Preview đạt kết quả cao hơn Kimi K2 của MoonShot AI, một phiên bản không có khả năng suy luận của Claude Opus 4 và DeepSeek V3.1 hỗ trợ định dạng của Anthropic. Tuy nhiên, những điểm chuẩn này chưa được đưa vào báo cáo kỹ thuật chính thức.
“Qwen-3-Max-Preview cho thấy những cải thiện đáng kể về khả năng tổng thể, từ hiểu văn bản tiếng Trung và tiếng Anh, thực hiện hướng dẫn phức tạp, xử lý tác vụ chủ quan, hỗ trợ đa ngôn ngữ cho đến khả năng sử dụng công cụ. Quá trình mở rộng vẫn đang diễn ra và bản phát hành chính thức sẽ còn mang lại nhiều bất ngờ", Alibaba cho biết trong thông cáo.
Những năm qua, Qwen đã giúp Alibaba nổi bật trong hệ sinh thái AI mã nguồn mở toàn cầu. Các mô hình này đã đạt hơn 20 triệu lượt tải xuống và tạo ra 100.000 mô hình phái sinh trên nền tảng Hugging Face. Tuy nhiên, Qwen-3-Max-Preview chưa được mở mã nguồn. Người dùng chỉ có thể truy cập qua Alibaba Cloud hoặc OpenRouter, tương tự như Qwen2.5-Max.
Trên mạng xã hội, Binyuan Hui, kỹ sư AI của Alibaba tiết lộ rằng phiên bản “có khả năng suy luận” của mô hình trên vẫn đang được phát triển.
Chi phí truy cập Qwen-3-Max-Preview trên Alibaba Cloud cũng thuộc hàng cao nhất trong họ Qwen. Giá khởi điểm là 0,861 USD cho một triệu token đầu vào và 3,441 USD cho một triệu token đầu ra. Trong khi đó, phiên bản Qwen3-235B-A22B-2507 chỉ có giá 0,287 USD cho mỗi triệu token đầu vào và 1,147 USD cho đầu ra.
Minh Hoàng