Các hãng AI hàng đầu Trung Quốc ra mô hình mới trước Tết, muốn có kỳ tích như DeepSeek

16 giờ trướcBài gốc

Các phòng thí nghiệm AI (trí tuệ nhân tạo) tiên tiến của Trung Quốc chạy đua để ra mắt mô hình mới trong những tuần cuối năm Ất Tỵ khi đất nước chuẩn bị chào đón năm Bính Ngọ.

Zhipu AI (có trụ sở tại thủ đô Bắc Kinh) và MiniMax (có trụ sở ở thành phố Thượng Hải, vừa niêm yết trên sàn giao dịch chứng khoán Hồng Kông) sẽ là những công ty tiếp theo cập nhật mô hình AI hàng đầu của họ với những cải tiến toàn diện, theo trang SCMP.

Được biết đến với tên gọi Z.ai trên phạm vi quốc tế, Zhipu AI dự kiến sẽ ra mắt GLM-5 (phiên bản thứ năm dòng mô hình GLM hàng đầu) trong hai tuần tới, trước khi Tết Nguyên đán bắt đầu.

GLM-5 dự kiến sẽ đi kèm với những cải tiến toàn diện và đáng kể trong khả năng viết sáng tạo, lập trình, suy luận cùng khả năng hoạt động như một tác tử AI, theo hai nguồn tin của SCMP.

Trong khi đó, MiniMax sẽ phát hành M2.2, bản cập nhật nhỏ cho mô hình M2.1 với những cải tiến tập trung vào lập trình, trước Tết Nguyên đán, theo các nguồn tin giấu tên của SCMP.

Alibaba và Moonshot AI đã khởi đầu làn sóng phát hành mô hình AI mới gần đây với phiên bản Qwen3-Max-Thinking và Kimi 2.5 vào tuần trước.

Các công ty muốn tạo kỳ tích như DeepSeek

Các công ty Trung Quốc dường như đang làm theo cách mà DeepSeek áp dụng năm ngoái.

Ngay trước Tết Nguyên đán, công ty có trụ sở ở thành phố Hàng Châu (Trung Quốc) tung ra mô hình suy luận R1 có hiệu năng cao ngang sản phẩm Mỹ như của OpenAI, Google, Anthropic nhưng chi phí huấn luyện thấp hơn rất nhiều. Động thái đó đã gây chấn động giới công nghệ toàn cầu khi Trung Quốc chuẩn bị bước vào kỳ nghỉ Tết Ất Tỵ.

R1 của DeepSeek từng gây chấn động giới công nghệ toàn cầu khi ra mắt trước Tết Nguyên đán năm ngoái - Ảnh: Getty Images

Bất chấp nhiều đồn đoán rằng DeepSeek sẽ ra mắt mô hình AI mới vào dịp Tết Nguyên đán sắp tới, công ty vẫn giữ im lặng về kế hoạch và được cho là không sẽ phát hành bản nâng cấp lớn như năm ngoái, theo một nguồn tin của SCMP. Thay vào đó, DeepSeek nhiều khả năng sẽ công bố một bản cập nhật nhỏ cho dòng mô hình nền tảng V3, vốn đã liên tục được nâng cấp suốt năm 2025.

Theo SCMP, sản phẩm AI chủ lực tiếp theo của DeepSeek dự kiến sẽ là mô hình nền tảng với hàng nghìn tỉ tham số. Việc kích thước mô hình AI tăng lên đã làm chậm quá trình huấn luyện và trì hoãn việc phát hành.

Tham số là các giá trị số mà mô hình AI học được và điều chỉnh trong suốt quá trình huấn luyện trên lượng lớn dữ liệu. Tham số là các biến nội bộ của mô hình AI, quyết định cách nó xử lý thông tin đầu vào và tạo kết quả đầu ra. Mục tiêu của quá trình huấn luyện là tìm ra bộ tham số tối ưu nhất để mô hình AI có thể thực hiện nhiệm vụ (dự đoán từ tiếp theo trong câu, dịch ngôn ngữ, trả lời câu hỏi...) chính xác nhất có thể dựa trên dữ liệu đã học.

Số lượng tham số thường là chỉ số về kích thước và khả năng của mô hình AI. Mô hình AI càng có nhiều tham số thì tiềm năng học được các mẫu phức tạp hơn càng lớn, nhưng cũng đòi hỏi nhiều dữ liệu, tài nguyên tính toán để huấn luyện.

Kimi 2.5 - mô hình AI mã nguồn mở tiên tiến nhất giúp Trung Quốc tiến gần các sản phẩm hàng đầu Mỹ

Trong tình hình hiện tại, Kimi 2.5 của Moonshot AI sẽ vẫn là mô hình AI mã nguồn mở tiên tiến nhất cho đến khi một phiên bản mới vượt qua nó, theo trang SCMP.

Kimi 2.5 của Moonshot, được gã khổng lồ công nghệ Alibaba hậu thuẫn, nhận sự hoan nghênh toàn cầu, với các bài kiểm tra chuẩn cho thấy nó đã đưa khả năng AI mã nguồn mở của Trung Quốc đến gần các hệ thống AI mã nguồn đóng hàng đầu Mỹ hơn bao giờ hết.

Hiện tại, Kimi 2.5 được xếp hạng thứ 5 trong chỉ số trí tuệ của Artificial Analysis, chỉ đứng sau 4 mô hình hàng đầu từ các công ty Mỹ. Kimi 2.5 là mô hình AI mã nguồn mở duy nhất và mô hình duy nhất của Trung Quốc trong top 5.

Artificial Analysis là công ty nghiên cứu và đánh giá độc lập chuyên theo dõi, so sánh và xếp hạng các mô hình AI như tạo văn bản, hình ảnh, video. Công ty này xây dựng các bảng đánh giá chuẩn để đo lường chất lượng, tốc độ, chi phí và hiệu năng của từng mô hình. Từ đó, doanh nghiệp, nhà phát triển và giới đầu tư sẽ hiểu rõ mô hình AI nào đang dẫn đầu, có lợi thế về giá hay khả năng mở rộng. Các báo cáo và xếp hạng của Artificial Analysis thường được truyền thông và giới công nghệ trích dẫn như một nguồn tham khảo đáng tin cậy trong lĩnh vực AI.

Cuộc đua giữa Mỹ và Trung Quốc nhằm giành vị thế thống trị trong ngành AI toàn cầu đã trở nên “phức tạp và khó dự báo”, theo nhận định của OpenAI - công ty khởi nghiệp Mỹ phát triển ChatGPT.

Trong bài đăng trên blog giữa tháng 1, OpenAI cho biết một “cú sốc địa chấn” khác từ Trung Quốc có thể sắp xảy ra, khi sự mong chờ tăng cao về việc DeepSeek phát hành mô hình AI mới vào dịp Tết Nguyên đán.

Bài viết này được xuất bản trước thềm kỷ niệm một năm DeepSeek ra mắt mô hình R1 gây chấn động thế giới vào ngày 20.1.2025.

“Mỹ tiếp tục dẫn đầu về khả năng của mô hình AI. Các mô hình AI của Mỹ cũng duy trì vị thế dẫn đầu đáng kể về khoa học và khả năng suy luận phức tạp hơn”, theo bài viết từ nhóm tình báo và điều tra của OpenAI.

“Điều thay đổi rõ rệt nhất không nằm ở việc ai dẫn đầu tuyệt đối, mà là chiều sâu và khả năng triển khai thực tế. Trung Quốc hiện sở hữu một hệ sinh thái rộng lớn các mô hình AI tiệm cận trình độ hàng đầu thế giới. Nhiều mô hình trong số đó có trọng số mở và được định giá rất cạnh tranh, nên dễ dàng được đưa vào sử dụng trên diện rộng trong doanh nghiệp và các hệ thống của chính phủ”, OpenAI cho biết thêm.

Đánh giá đó phản ánh việc xuất khẩu các công nghệ trong nước đóng vai trò quan trọng trong chiến lược AI của Trung Quốc.

Theo bài đăng của OpenAI, việc mã nguồn mở các mô hình AI “chỉ trong vài tuần, thay vì vài tháng” đã giúp các hãng công nghệ Trung Quốc, gồm cả Alibaba Cloud, thúc đẩy việc áp dụng toàn cầu và biến các sản phẩm này trở thành hệ thống mặc định cho nhiều nhà phát triển trong lẫn ngoài nước.

Alibaba Cloud là đơn vị cung cấp dịch vụ AI và điện toán đám mây của Alibaba.

Bài viết của OpenAI cũng cho biết các công ty Trung Quốc đang xuất khẩu những nền tảng “AI chủ quyền” sang nhiều thị trường Đông Nam Á và Trung Đông, gồm cả mô hình nền tảng trong nước, cơ sở hạ tầng đám mây và phần cứng.

DeepSeek đã tái định hình bức tranh AI toàn cầu

Trong một báo cáo công bố gần đây, Microsoft nhận định DeepSeek đã tái định hình bức tranh AI toàn cầu năm qua, khi đạt được sức lan tỏa đáng kể tại những thị trường chưa được các nhà cung cấp Mỹ phục vụ đầy đủ.

Báo cáo về mức độ ứng dụng AI trên toàn cầu cho thấy các mô hình AI miễn phí và có giấy phép cởi mở của DeepSeek đạt tỷ lệ sử dụng cao nhất tại những quốc gia bị hạn chế tiếp cận sản phẩm hàng đầu của Mỹ. Những thị trường này gồm Nga, Iran, Cuba, Belarus, cùng các khu vực kém phát triển hơn như nhiều quốc gia ở châu Phi.

“Việc không thu phí đăng ký hay không yêu cầu thanh toán đã hạ thấp rào cản tiếp cận với hàng triệu người dùng, đặc biệt tại những khu vực nhạy cảm về giá. Động lực này cho thấy AI mã nguồn mở có thể hoạt động như một công cụ địa chính trị, mở rộng ảnh hưởng của Trung Quốc tại những nơi mà các nền tảng phương Tây khó có thể hiện diện”, báo cáo của Microsoft nêu rõ.

Các mô hình AI mã nguồn mở của Trung Quốc từng chiếm gần 30% tổng mức sử dụng AI toàn cầu trên OpenRouter (nền tảng tổng hợp mô hình bên thứ ba) vào thời điểm đỉnh cao năm 2025, tăng mạnh từ mức chỉ 1,2% vào cuối năm 2024. OpenRouter công bố nghiên cứu này vào tháng trước.

Microsoft cảnh báo các công ty AI của Mỹ đang mất dần thị phần về tay Trung Quốc, trong cuộc chiến giành người dùng bên ngoài phương Tây.

Các gã khổng lồ công nghệ Trung Quốc bạo chi để quảng bá ứng dụng AI

Nhiều hãng công nghệ Trung Quốc đang tìm cách tận dụng mùa lễ hội, thời điểm quan trọng để quảng bá sản phẩm và thu hút người dùng cả nước.

Các hãng công nghệ lớn nhất Trung Quốc đang chi hàng tỉ USD để giúp ứng dụng chatbot AI của họ thu hút người dùng.

Gã khổng lồ mạng xã hội và game Tencent cho biết chatbot Yuanbao của họ sẽ tặng 1 tỉ nhân dân tệ (144 triệu USD) dưới dạng phong bao lì xì điện tử. Đây là phiên bản trực tuyến của phong bao tiền mừng may mắn truyền thống trong dịp lễ.

Baidu cũng làm điều tương tự với 500 triệu nhân dân tệ thông qua ứng dụng và trợ lý AI Wenxin của mình.

Trong khi đó, Alibaba hôm 2.2 công bố chiến dịch trị giá 3 tỉ nhân dân tệ nhằm quảng bá ứng dụng chatbot Qwen của mình.

Sơn Vân

Nguồn Một Thế Giới : https://1thegioi.vn/cac-hang-ai-hang-dau-trung-quoc-ra-mo-hinh-moi-truoc-tet-muon-co-ky-tich-nhu-deepseek-245621.html