Nhiều năm qua, Huawei và các công ty Trung Quốc khác phải vật lộn để bắt kịp Nvidia trong việc phát triển các chip cao cấp dành cho huấn luyện mô hình AI – giai đoạn mà dữ liệu được đưa vào các thuật toán nhằm giúp chúng học cách ra quyết định chính xác.
Tuy nhiên, các mô hình AI của DeepSeek tập trung vào suy luận (tức giai đoạn đưa ra kết luận), tối ưu hóa hiệu suất tính toán thay vì chỉ dựa vào sức mạnh xử lý thuần túy.
Đây là một trong những lý do khiến các mô hình AI của DeepSeek được kỳ vọng sẽ giúp thu hẹp một phần khoảng cách giữa các chip AI Trung Quốc với các sản phẩm mạnh mẽ hơn từ Mỹ, theo nhận định của các chuyên gia.
Những tuần gần đây, Huawei và các nhà sản xuất chip AI Trung Quốc khác như Hygon, EnFlame (được Tencent hậu thuẫn), Tsingmicro, Moore Threads đều khẳng định sản phẩm của họ sẽ hỗ trợ các mô hình AI DeepSeek, dù có rất ít thông tin chi tiết được công bố.
Huawei từ chối bình luận. Moore Threads, Hygon, EnFlame và Tsingmicro cũng không trả lời các câu hỏi từ Reuters để tìm hiểu thêm thông tin.
Các giám đốc trong ngành đang dự đoán rằng bản chất mã nguồn mở và chi phí đào tạo mô hình thấp của DeepSeek có thể thúc đẩy việc áp dụng AI cũng như phát triển các ứng dụng thực tế cho công nghệ này. Qua đó giúp các công ty Trung Quốc vượt qua các hạn chế xuất khẩu của Mỹ với những chip mạnh nhất.
Ngay cả trước khi DeepSeek trở thành tâm điểm trong năm nay, một số chip AI Trung Quốc, điển hình là Huawei Ascend 910B, đã được khách hàng đánh giá là phù hợp hơn cho các tác vụ suy luận ít đòi hỏi sức mạnh tính toán hơn. Đây là giai đoạn sau khi đào tạo, khi các mô hình AI có thể thực hiện dự đoán hoặc hoàn thành nhiệm vụ, chẳng hạn thông qua chatbot.
Tại Trung Quốc, hàng chục công ty, từ các hãng sản xuất ô tô đến nhà cung cấp viễn thông, đã công bố kế hoạch tích hợp mô hình AI DeepSeek vào sản phẩm và hoạt động của họ.
"Sự phát triển này hoàn toàn phù hợp với năng lực của các nhà cung cấp chip AI Trung Quốc. Chip AI Trung Quốc gặp khó khăn trong việc cạnh tranh với GPU (bộ xử lý đồ họa) Nvidia trong quá trình huấn luyện AI, nhưng các tác vụ suy luận AI không đòi hỏi phần cứng mạnh mà cần được tinh chỉnh để phù hợp với dữ liệu và nhu cầu của địa phương, lĩnh vực cụ thể", Lian Jye Su, chuyên gia phân tích chính tại công ty nghiên cứu công nghệ Omdia, nhận định.
Tuy nhiên, nhà phân tích Lin Qingyuan của công ty nghiên cứu và dịch vụ tài chính Bernstein cho rằng, dù chip AI Trung Quốc có lợi thế về chi phí trong suy luận, nhưng điều đó chỉ giới hạn ở nước này. Lý do vì GPU Nvidia vẫn tốt hơn ngay cả trong các tác vụ suy luận.
Trong khi Mỹ cấm xuất khẩu các chip đào tạo AI tiên tiến nhất của Nvidia đến Trung Quốc, công ty này vẫn được phép bán các chip kém mạnh hơn mà khách hàng có thể sử dụng cho các tác vụ suy luận.
Hôm 13.2, Nvidia đăng bài viết trên blog về khoảng thời gian suy luận đang tăng lên như một quy luật mới và nêu rằng chip của họ sẽ là cần thiết để giúp DeepSeek cùng các mô hình lý luận khác trở nên hữu ích hơn.
CUDA góp phần giúp Nvidia thống trị thị trường chip AI
Ngoài sức mạnh tính toán, Nvidia CUDA đã trở thành một thành phần quan trọng trong sự thống trị của hãng. CUDA là nền tảng tính toán song song cho phép các nhà phát triển phần mềm sử dụng GPU Nvidia cho các tác vụ tính toán tổng quát, không chỉ riêng AI hay đồ họa.
Trước đây, nhiều công ty chip AI Trung Quốc không trực tiếp thách thức Nvidia bằng cách yêu cầu người dùng từ bỏ CUDA, mà thay vào đó tuyên bố rằng chip của họ tương thích với CUDA.
Huawei là công ty quyết liệt nhất trong nỗ lực tách khỏi Nvidia bằng cách cung cấp một nền tảng tương đương với CUDA có tên Compute Architecture for Neural Networks (CANN). Tuy nhiên, các chuyên gia cho rằng Huawei đang đối mặt với nhiều trở ngại trong việc thuyết phục các nhà phát triển từ bỏ CUDA.
"Hiệu suất phần mềm của các công ty chip AI Trung Quốc vẫn còn hạn chế ở giai đoạn này. CUDA có thư viện phong phú và hàng loạt khả năng phần mềm đa dạng, điều này đòi hỏi sự đầu tư đáng kể trong dài hạn", Lian Jye Su cho hay.
Sự trỗi dậy của DeepSeek mang lại cơ hội tốt hơn cho một số nhà sản xuất chip AI Trung Quốc để cạnh tranh trên thị trường nội địa với Nvidia - Ảnh: SCMP
Việc DeepSeek trỗi dậy đặt ra câu hỏi về tính hiệu quả từ các hạn chế xuất khẩu chip tiên tiến mà Mỹ áp đặt để ngăn cản quá trình đào tạo mô hình AI của Trung Quốc. Có thể Mỹ sẽ gia tăng các biện pháp hạn chế bán dẫn hơn nữa, nhưng cũng xuất hiện sự nhận thức ngày càng tăng về khả năng của Trung Quốc trong việc lách lệnh trừng phạt bằng cách đổi mới để vượt qua các rào cản phần cứng.
Tuy nhiên, chip AI của Nvidia vẫn rất quan trọng. High-Flyer đã mua hàng chục ngàn bộ xử lý đồ họa (GPU) của Nvidia trước khi chúng bị hạn chế bán tại Trung Quốc và sử dụng để đào tạo các mô hình AI của DeepSeek. Công ty khởi nghiệp này có khả năng sẽ phải tiếp tục dựa vào chip AI Nvidia vài năm nữa, vì các nhà sản xuất GPU Trung Quốc vẫn đang gặp khó khăn trong việc vượt qua những hạn chế công nghệ hiện tại.
Các hồ sơ cho thấy DeepSeek là một trong những đơn vị có nguồn lực mạnh nhất Trung Quốc để đào tạo AI. Ngay từ năm 2019, Liang Wenfeng (nhà sáng lập High-Flyer và DeepSeek) đã chi 200 triệu nhân dân tệ (27,8 triệu USD) để mua 1.100 GPU nhằm đào tạo các thuật toán giao dịch chứng khoán. High-Flyer cho biết trung tâm điện toán của DeepSeek vào thời điểm đó có diện tích tương đương một sân bóng rổ, khoảng 436,6 mét vuông.
Năm 2021, High-Flyer đã chi 1 tỉ nhân dân tệ để phát triển cụm siêu máy tính Fire-Flyer 2, được kỳ vọng đạt công suất 1.550 petaflop, theo trang web của quỹ. Hiệu suất này tương đương với một số siêu máy tính mạnh nhất thế giới.
Petaflop là một đơn vị đo lường hiệu suất tính toán của siêu máy tính, viết tắt của Peta Floating Point Operations Per Second (nghìn nghìn tỉ phép toán dấu phẩy động mỗi giây).
Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) vào tháng 5.2023, Liang Wenfeng cho biết High-Flyer đã mua gần 10.000 GPU Nvidia, gồm cả dòng A100 tiên tiến nhất vào thời điểm đó, trước khi Mỹ áp đặt hạn chế xuất khẩu loại chip này sang Trung Quốc.
Một số nhà phân tích xác định rằng việc High-Flyer chi tiêu mạnh vào phần cứng là yếu tố quan trọng giúp DeepSeek trở thành "ngựa ô" trong cuộc đua AI toàn cầu.
Trong một báo cáo, hãng nghiên cứu SemiAnalysis (Mỹ) ước tính rằng tổng chi tiêu phần cứng của DeepSeek "vượt xa mức 500 triệu USD trong suốt lịch sử công ty", gồm cả chi phí nghiên cứu và phát triển cũng như tổng chi phí sở hữu phần cứng.
Theo SemiAnalysis, tổng chi tiêu vốn cho máy chủ của DeepSeek có thể đã lên đến 1,6 tỉ USD với khoảng 50.000 GPU Nvidia Hopper, gồm cả chi phí vận hành 944 triệu USD cho các cụm tính toán.
Dù vậy, các nhà phân tích lưu ý rằng sự đổi mới của DeepSeek trong lĩnh vực phần mềm đã chứng minh rằng hiệu suất mô hình không tỷ lệ thuận với số tiền mà công ty chi cho GPU đắt tiền.
Theo DeepSeek, mô hình ngôn ngữ lớn V3 của họ (ra mắt vào tháng 12.2024) đã được huấn luyện bằng 2.048 GPU Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Trong một bài viết về V3, DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, chỉ bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.
R1, mô hình lập luận mã nguồn mở của DeepSeek được phát hành vào ngày 20.1, thể hiện năng lực tương đương sản phẩm tiên tiến từ OpenAI, Anthropic và Google, nhưng chi phí đào tạo thấp hơn đáng kể. Tuy nhiên, bài viết của DeepSeek về R1 không đề cập đến chi phí phát triển.
Các mô hình DeepSeek có chi phí thấp và hiệu suất mạnh mẽ làm dấy lên nghi ngờ về sự cần thiết của khoản đầu tư khổng lồ từ các gã khổng lồ công nghệ Mỹ, đặc biệt là vào chip AI đắt đỏ. Điều này đã dẫn đến đợt bán tháo lớn cổ phiếu Nvidia hôm 27.1, khiến vốn hóa hãng chip AI hàng đầu của Mỹ giảm gần 600 tỉ USD chỉ trong một ngày.
Sơn Vân