Nhiều năm qua, các nhà phát triển chip Trung Quốc vô cùng ngưỡng mộ Nvidia khi “gã khổng lồ” Mỹ thiết lập vị trí “vô đối” trong ngành công nghiệp nhờ năng lực phần cứng và bộ công cụ CUDA độc quyền mà kỹ sư dùng để phát triển ứng dụng trên bộ xử lý đồ họa (GPU) của công ty.
Dù vậy, sau sự ra đời của DeepSeek V3 và R1, họ đang được tiếp thêm động lực để rời xa quỹ đạo của Nvidia.
DeepSeek tiếp động lực để doanh nghiệp chip Trung Quốc giảm lệ thuộc vào Nvidia. Ảnh: Bloomberg
Infinigence AI, nhà cung cấp nền tảng hạ tầng điện toán, cho biết đang cùng 7 nhà phát triển chip hàng đầu Trung Quốc: Biren Technology, Hygon Information Technology, Moore Threads, MetaX, Enflame, Iluvatar CoreX và Ascend làm điều này.
Trong chuyến thăm Trung Quốc hồi tháng 1, CEO Nvidia Jensen Huang cho biết khoảng 1,5 triệu nhà phát triển trong nước đang sử dụng CUDA. Công ty cũng hợp tác với hơn 3.000 startup để giúp thiết lập ngành công nghiệp công nghệ tại đây.
Chính xác DeepSeek dùng bao nhiêu chip để đào tạo mô hình V3 và R1 còn là một ẩn số, tuy nhiên đã có suy đoán chip Huawei đóng vai trò quan trọng trong thành công của startup.
Theo trang Tom’s Hardware, các mô hình chạy trên Huawei Ascend 910C có thể đạt 60% hiệu suất suy luận của Nvidia H100. Sự phụ thuộc vào hệ sinh thái phần mềm Nvidia có khả năng giảm khi suy luận AI ngày càng quan trọng hơn trong tương lai.
Trong khi đó, các nhà sản xuất chip Trung Quốc tăng cường nỗ lực để đáp ứng DeepSeek và giúp giảm lệ thuộc vào chip Mỹ. Bản tin của Đài truyền hình trung ương Trung Quốc (CCTV) cho thấy ít nhất 15 nhà sản xuất chip nội đã điều chỉnh sản phẩm để phù hợp hơn với việc đào tạo và vận hành DeepSeek, qua đó việc sử dụng các mô hình DeepSeek có thể thực hiện trên “hạ tầng điện toán phát triển trong nước”.
Kunlun Xin, hãng chip AI của Baidu, mất chưa tới 1 tuần để điều chỉnh phần cứng theo mô hình nguồn mở của DeepSeek, nhanh hơn đáng kể so với các mô hình nguồn mở, theo CEO Ouyang Jian.
Tuần trước, công ty chia sẻ đã bắt đầu hỗ trợ mô hình DeepSeek V3 và R1, cho phép nhà phát triển nhanh chóng triển khai ứng dụng với chi phí thấp.
Các mô hình AI của DeepSeek được xem là dấu hiệu cho thấy sự linh hoạt của Trung Quốc trước các biện pháp kìm kẹp của Mỹ. Một số dự đoán đột phá của startup sẽ giúp thúc đẩy sự phát triển AI trong nhiều ngành công nghiệp trong nước.
Công ty thiết kế chip Loongson Technology đã hỗ trợ mô hình DeepSeek để người dùng có thể chạy chúng ngay trên máy tính. Bộ phận điện toán đám mây của Huawei cũng bắt tay với startup hạ tầng AI SiliconFlow để cung cấp mô hình DeepSeek V3 và R1 trên dịch vụ đám mây Ascend. Huawei khẳng định hiệu suất tương đương với việc chạy mô hình trên các GPU cao cấp.
(Theo SCMP)
Du Lam