Ảnh minh họa: Getty Images
Theo hãng tin CNA, sự vươn lên nhanh chóng này cho thấy lợi thế cạnh tranh mà các nhà phát triển Trung Quốc như Alibaba, Z.ai, Moonshot và MiniMax có được khi cung cấp những mô hình ngôn ngữ “mở” với chi phí thấp hơn nhiều so với các đối thủ Mỹ.
Xu hướng ấy cũng làm nổi bật hạn chế trong nỗ lực của Mỹ nhằm kìm hãm ngành công nghệ Trung Quốc thông qua các biện pháp kiểm soát xuất khẩu chip tiên tiến, bởi các nhà phát triển Trung Quốc vẫn tiếp cận gần như tương đương với năng lực của các “gã khổng lồ” công nghệ tại Thung lũng Silicon.
Tháng 10 vừa qua, Tổng giám đốc điều hành Airbnb, ông Brian Chesky, gây chú ý khi tiết lộ nền tảng cho thuê ngắn hạn của ông lựa chọn sử dụng Qwen của Alibaba thay vì ChatGPT của OpenAI, đồng thời ca ngợi mô hình Trung Quốc “nhanh và rẻ”.
Cũng trong tháng này, Tổng giám đốc điều hành Social Capital, ông Chamath Palihapitiya, cho biết công ty ông đã chuyển phần lớn công việc sang Kimi K2 của Moonshot vì mô hình này hiệu quả hơn nhiều và rẻ hơn rất nhiều so với các sản phẩm của OpenAI và Anthropic.
Trên mạng xã hội, các lập trình viên gần đây cũng chỉ ra bằng chứng cho thấy hai trợ lý lập trình phổ biến do Mỹ phát triển, Composer và Windsurf, được xây dựng dựa trên các mô hình Trung Quốc.
Các nhà phát triển của hai trợ lý này, Cursor và Cognition AI, chưa công khai xác nhận việc sử dụng công nghệ Trung Quốc và cũng không phản hồi yêu cầu bình luận.
Ông Nathan Lambert, nhà nghiên cứu học máy và là người sáng lập Dự án Atom (một sáng kiến thúc đẩy các mô hình mở tại Mỹ), cho rằng những ví dụ công khai hiện nay chỉ là “phần nổi của tảng băng chìm”.
“Các mô hình mở của Trung Quốc đã trở thành chuẩn mực thực tế đối với các startup ở Mỹ. Tôi từng nghe về nhiều trường hợp nổi bật khác, nơi các startup AI Mỹ được đánh giá cao nhất bắt đầu huấn luyện mô hình trên Qwen, Kimi, GLM hay DeepSeek”, ông Lambert nói, đồng thời nhận định nhiều công ty Mỹ vẫn ngần ngại công khai việc sử dụng công nghệ Trung Quốc.
Dù không thể định lượng chính xác mức độ sử dụng các mô hình AI khác nhau, dữ liệu ngành cho thấy sự phổ biến ngày càng tăng của các sản phẩm Trung Quốc.
Các công cụ AI Trung Quốc, gồm M2 của MiniMax, GLM 4.6 của Z.ai và V3.2 của DeepSeek, chiếm 7 trong số 20 mô hình được sử dụng nhiều nhất tuần trước, theo dữ liệu từ OpenRouter – nền tảng kết nối nhà phát triển với các mô hình AI.
Biểu tượng của Công ty OpenAI và ChatGPT trên màn hình ở Toulouse, Pháp. Ảnh: AFP/TTXVN
Trong 10 mô hình hàng đầu dùng cho lập trình, có 4 mô hình do các công ty Trung Quốc phát triển, theo OpenRouter.
Trong lĩnh vực mô hình mở, Trung Quốc dẫn đầu rõ rệt, với tổng số lượt tải xuống vượt 540 triệu tính đến tháng 10, theo phân tích của Dự án Atom dựa trên dữ liệu từ nền tảng lưu trữ Hugging Face.
Ông Rui Ma, nhà sáng lập Tech Buzz China, cho rằng các mô hình Trung Quốc đặc biệt hấp dẫn đối với các startup non trẻ, trong khi “các tổ chức có nguồn lực mạnh” thường lựa chọn các mô hình cao cấp của Mỹ.
“Đây thường là những công ty giai đoạn đầu, nhạy cảm với chi phí, thử nghiệm nhiều, và phần lớn sẽ không tồn tại lâu dài”, ông Ma nói với Al Jazeera.
Không giống các nền tảng hàng đầu của Mỹ như ChatGPT, các mô hình ngôn ngữ lớn trọng số mở của Trung Quốc công khai các tham số đã được huấn luyện – gọi là “trọng số”.
Dù các mô hình trọng số mở có thể tải về miễn phí và không tốn phí bản quyền, việc vận hành ở quy mô lớn vẫn tiêu tốn lượng lớn năng lực tính toán, vốn được các nhà phát triển cung cấp cho người dùng thông qua dịch vụ lưu trữ có thu phí.
Các nhà phát triển như Z.ai (Bắc Kinh) và DeepSeek (Hàng Châu) sử dụng chip thế hệ cũ (không nằm trong danh sách bị Mỹ kiểm soát xuất khẩu) với số lượng nhỏ, giúp giảm mạnh chi phí huấn luyện và vận hành so với các đối thủ tại Thung lũng Silicon.
Nhờ chi phí đầu vào thấp hơn và mô hình tiết kiệm năng lực tính toán, các công ty Trung Quốc có thể cung cấp dịch vụ lưu trữ rẻ hơn nhiều so với đối thủ Mỹ.
Theo phân tích của AllianceBernstein công bố hồi tháng 2, giá sử dụng mô hình DeepSeek khi đó được ước tính rẻ hơn OpenAI tới 40 lần.
Logo của deepseek. Ảnh: REUTERS/TTXVN
Ông Toby Walsh, chuyên gia AI tại Đại học New South Wales, nhận xét: “Thành công của các mô hình Trung Quốc cho thấy kiểm soát xuất khẩu không thể hạn chế Trung Quốc. Thực tế, điều này còn khuyến khích các công ty Trung Quốc sáng tạo hơn và xây dựng những mô hình nhỏ hơn, vận hành và huấn luyện trên phần cứng thế hệ cũ”.
Một số nhà phân tích so sánh cách tiếp cận AI của Trung Quốc với chiến lược từng được các công ty nước này áp dụng trong ngành năng lượng Mặt Trời: đưa ra sản phẩm giá rẻ để phủ kín thị trường.
“Đây là ‘sách lược pin Mặt Trời’ chạy trên phần mềm”, ông Poe Zhao, chuyên gia công nghệ tại Bắc Kinh, viết trên bản tin Substack Hello China Tech tuần trước.
Giáo sư Greg Slabaugh, chuyên gia nghiên cứu AI tại Đại học Queen Mary London, cho rằng tiến bộ AI của Trung Quốc bị đánh giá thấp một phần vì tín hiệu còn rời rạc.
“Phần lớn việc sử dụng mô hình Trung Quốc diễn ra trong nước. Quy mô nghiên cứu và số bằng sáng chế AI của Trung Quốc đã hiển hiện từ lâu; sự xuất hiện của các mô hình trọng số mở chỉ khiến khả năng này trở nên dễ tiếp cận hơn trên phạm vi toàn cầu”, ông nói.
Dù các mô hình AI Trung Quốc thâm nhập thị trường nhờ giá rẻ, các tập đoàn công nghệ Mỹ vẫn chiếm ưu thế ở phân khúc cao cấp và những lĩnh vực chịu quản lý nghiêm ngặt, nơi các yếu tố như an ninh quốc gia đóng vai trò then chốt, theo giới phân tích.
Ông Ma nhận định sự phát triển của AI có thể đi theo quỹ đạo tương tự Android và iPhone, trong đó nền tảng đầu có lượng người dùng toàn cầu gấp ba lần nền tảng sau.
“Về lâu dài – thậm chí có thể nhanh hơn thời đại di động – việc áp dụng AI hoàn toàn có thể đi theo các động lực kinh tế tương tự. Trên thế giới, có nhiều người đặt chi phí lên hàng đầu thay vì lựa chọn các tùy chọn cao cấp”, ông Ma nói. “Tuy vậy, điều đó không có nghĩa lợi nhuận lớn nhất hay giá trị vốn hóa thị trường sẽ thuộc về phân khúc giá thấp; giá trị vẫn có thể tập trung ở những sản phẩm tạo ra khác biệt, hiệu suất và độ tin cậy vượt trội”.
Bình luận về khả năng các mô hình Trung Quốc được sử dụng rộng rãi hơn trong doanh nghiệp lớn, Giáo sư Slabaugh cho rằng: “Trong các công ty Fortune 500 và các lĩnh vực chịu quản lý nghiêm ngặt, việc áp dụng diện rộng có lẽ chưa sớm diễn ra”.
“Nếu có một ‘sự tỉnh giấc bất ngờ’, yếu tố đó có lẽ sẽ đến từ giá thành và tính linh hoạt, chứ không phải từ việc thay thế đột ngột các mô hình Mỹ”, ông nói.
Hải Vân/Báo Tin tức và Dân tộc