V4 Pro, mô hình AI chủ lực mới nhất của DeepSeek, được xếp vào nhóm tốt nhất thế giới xét theo tiêu chí “mức độ thông minh trên mỗi USD”, vượt xa các đối thủ Mỹ như OpenAI và Anthropic về hiệu quả chi phí sau khi chương trình giảm giá 75% được áp dụng vĩnh viễn.
Công ty khởi nghiệp AI DeepSeek (Trung Quốc) thông báo duy trì vĩnh viễn mức giá mới cho mô hình V4 Pro hôm 23/5.
Trình làng hôm 24/4, DeepSeek V4 gồm mô hình chủ lực V4 Pro với 1.600 tỉ tham số và phiên bản nhẹ hơn là V4 Flash có 284 tỉ tham số. Cả hai đều hỗ trợ cửa sổ ngữ cảnh lên tới 1 triệu token, được phát hành dưới dạng trọng số mở theo giấy phép MIT, cho phép doanh nghiệp tự do sử dụng, chỉnh sửa và thương mại hóa.
Động thái giảm giá sâu cho thấy DeepSeek đang cạnh tranh trong cuộc đua mô hình AI toàn cầu bằng cách tiếp cận khác so với các đối thủ Mỹ, vốn cung cấp những mô hình tiên tiến nhất với mức giá cao.
Theo công ty đánh giá độc lập Artificial Analysis, việc DeepSeek giảm giá 75% đã đưa V4 Pro lên nhóm dẫn đầu toàn cầu về hiệu quả chi phí, dựa trên thước đo “mức độ thông minh” mà người dùng có thể khai thác trên mỗi USD bỏ ra.
Artificial Analysis là nền tảng đánh giá độc lập chuyên theo dõi, so sánh và xếp hạng các mô hình AI như tạo văn bản, hình ảnh, video. Công ty này xây dựng các bảng đánh giá chuẩn để đo lường chất lượng, tốc độ, chi phí và hiệu năng của từng mô hình. Từ đó, doanh nghiệp, nhà phát triển và giới đầu tư sẽ hiểu rõ mô hình AI nào đang dẫn đầu, có lợi thế về giá hay khả năng mở rộng.
Trong bối cảnh nguồn cung năng lực tính toán toàn cầu khan hiếm khiến chi phí sử dụng các mô hình AI tiên tiến tăng mạnh, phương pháp so sánh AI theo tiêu chí “đáng tiền” thay vì chỉ xếp hạng hiệu năng thuần túy ngày càng phổ biến những tháng gần đây.
Giá giao diện lập trình ứng dụng (API) chính thức của DeepSeek V4 Pro hiện chỉ còn 0,0036 USD cho mỗi 1 triệu token đầu vào được lưu trong bộ nhớ đệm và 0,87 USD cho mỗi 1 triệu token đầu ra.
Điều này đồng nghĩa V4 Pro chỉ cần khoảng 268 USD để chạy bộ bài kiểm tra chuẩn Intelligence Index của Artificial Analysis, vốn là hệ thống đánh giá tổng hợp nhiều chỉ số hiệu năng khác nhau. Trong khi đó, các mô hình AI chủ lực mới nhất của OpenAI và Anthropic là GPT-5.5 và Claude Opus 4.7 có chi phí cao hơn lần lượt khoảng 12 lần và 19 lần để thực hiện cùng nhiệm vụ.
Các bài kiểm tra của bên thứ ba như vậy đảm bảo so sánh giữa các mô hình AI tốt hơn bằng cách áp dụng phương pháp đánh giá tiêu chuẩn hóa. Lý do vì giá cả chính thức và điểm chuẩn do chính các nhà cung cấp mô hình AI báo cáo có thể khác nhau về phương pháp luận và độ chính xác.
DeepSeek V4 Pro nằm trong nhóm mô hình AI dẫn đầu thế giới về mức độ thông minh trên mỗi USD chi phí sau khi đợt giảm giá 75% được áp dụng vĩnh viễn. Ảnh: SV
Các mô hình AI Trung Quốc dẫn đầu về hiệu quả chi phí cùng với DeepSeek V4 Pro
Phần lớn các mô hình AI khác nằm trong bảng xếp hạng “trí thông minh trên mỗi USD” của Artificial Analysis cũng đến từ Trung Quốc, gồm M2.7 của MiniMax và MiMo V2.5 Pro của Xiaomi.
Các gã khổng lồ công nghệ Trung Quốc đang đi theo xu hướng này. Alibaba hôm 20/5 đã giảm 50% giá API chính thức cho mô hình mới nhất Qwen3.7 Max trong chương trình khuyến mãi kéo dài đến ngày 22/6.
Artificial Analysis xếp Qwen3.7 Max là mô hình AI Trung Quốc mạnh nhất xét về hiệu năng thuần túy, song thứ hạng “trí thông minh trên mỗi USD” của nó hiện chưa được xác lập theo mức giá mới.
Những bước tiến về hiệu quả chi phí của các mô hình Trung Quốc đã góp phần kéo giảm mạnh rào cản tiếp cận AI vài năm gần đây. Đáng chú ý, mô hình V4 Flash của DeepSeek được phát hành với mức giá tương đương V2 ra mắt từ hai năm trước.
Hôm 24/4, DeepSeek cho biết rằng giá dòng V4 sẽ “giảm đáng kể” trong nửa cuối năm khi các siêu nút Ascend 950PR của Huawei được xuất xưởng với quy mô lớn.
Siêu nút là nút tính toán có hiệu năng đặc biệt cao trong mạng máy tính hoặc hệ thống điện toán. Trong lĩnh vực điện toán hiệu năng cao hay AI, siêu nút thường là khối phần cứng lớn, bên trong chứa nhiều bộ xử lý tăng tốc (GPU, NPU) cùng bộ nhớ dung lượng lớn và các liên kết truyền dữ liệu tốc độ cực cao. Siêu nút có thể đứng độc lập để xử lý khối lượng điện toán khổng lồ, hoặc đóng vai trò đầu mối kết nối trong cụm máy tính siêu nút.
Chip Huawei Ascend 950 “cháy hàng” nhờ DeepSeek V4
Nhu cầu với dòng Huawei Ascend 950 tăng vọt sau khi mô hình DeepSeek V4 ra mắt hôm 24/4 và tương thích với chip AI mới của gã khổng lồ công nghệ Trung Quốc.
Các công ty internet lớn nhất Trung Quốc, gồm ByteDance, Tencent và Alibaba, đang liên hệ với Huawei để đặt hàng chip mới Ascend 950, theo các nguồn tin của Reuters.
Các công ty chuyên về điện toán đám mây và dịch vụ cho thuê GPU cũng đang chạy đua để đặt hàng Ascend 950.
Dù có hiệu năng vượt trội so với Nvidia H20, Ascend 950PR (phiên bản thuộc dòng Ascend 950) vẫn kém hơn H200, chip AI tiên tiến hơn của Nvidia đang vướng vào tình trạng pháp lý chưa rõ ràng.
H20 từng là chip AI mạnh nhất mà Nvidia được phép bán tại Trung Quốc trước khi bị chặn nhập khẩu năm ngoái. Trong khi đó, Nvidia H200 dù được Mỹ phê duyệt xuất khẩu nhưng vẫn chưa thể vào thị trường Trung Quốc, tạo cơ hội cho Huawei mở rộng thị phần chip AI.
Ascend 950PR được xem là bước đột phá của Huawei sau nhiều năm gặp khó khăn trong việc giành đơn hàng lớn từ các gã khổng lồ công nghệ Trung Quốc. Theo Reuters, các bài thử nghiệm Ascend 950PR trong năm nay diễn ra thuận lợi, với ByteDance và Alibaba dự kiến đặt hàng sau khi nhận mẫu vào tháng 1.
Cuộc đua giành Ascend 950PR cho thấy việc DeepSeek ra mắt mô hình V4 đã thúc đẩy mạnh nhu cầu chip AI nội địa, trong bối cảnh Mỹ tiếp tục hạn chế xuất khẩu chip tiên tiến nhất của Nvidia. Đây cũng là sự thừa nhận về hiệu năng ngày càng tăng của chip Huawei.
Việc DeepSeek tối ưu hóa V4 cho chip Huawei đánh dấu bước chuyển chiến lược, giảm phụ thuộc vào chip Mỹ và hướng nhiều hơn tới công nghệ AI nội địa. Đây là ưu tiên của Trung Quốc trong tham vọng dẫn đầu công nghệ.
Tháng trước, Huawei cho biết cơ sở hạ tầng siêu nút Ascend của hãng, được xây dựng trên dòng chip Ascend 950, sẽ hỗ trợ đầy đủ DeepSeek V4. Toàn bộ dòng sản phẩm siêu nút Ascend đã được điều chỉnh để phục vụ quá trình suy luận V4. Suy luận đề cập đến quy trình sử dụng mô hình AI đã được huấn luyện để trả lời các truy vấn và thực hiện các tác vụ.
Trong các nhà sản xuất chip Trung Quốc, dòng Ascend 950 của Huawei, đặc biệt là 950PR, là chip nội địa duy nhất có thể xử lý các phép tính AI bằng dạng số được nén gọn hơn. Nhờ đó, Ascend 950 có thể thực hiện nhiều phép tính hơn mỗi giây và giảm chi phí vận hành.
Tuy nhiên, Huawei thừa nhận rằng tình trạng hạn chế nguồn cung sẽ còn kéo dài cho đến khi sản lượng Ascend 950 được mở rộng, phản ánh sự thiếu hụt chip AI nội địa cao cấp.
Sản lượng Ascend 950 dự kiến vẫn không đáp ứng đủ nhu cầu do các hạn chế xuất khẩu của Mỹ với thiết bị sản xuất chip tiên tiến. Điều này khiến Trung Quốc khó tiếp cận công nghệ sản xuất chip hàng đầu lâu nay.
Theo nguồn tin của Reuters, Huawei dự kiến sản xuất khoảng 750.000 Ascend 950PR trong năm 2026. Huawei bắt đầu sản xuất hàng loạt chip AI này từ tháng 4 và triển khai giao hàng quy mô lớn từ nửa cuối năm 2026.
Sơn Vân