Nỗ lực dùng chip nội địa thất bại, DeepSeek lùi ngày ra mắt mô hình AI mới

6 giờ trướcBài gốc

Biểu tượng mô hình trí tuệ nhân tạo Deepseek. Ảnh: REUTERS/TTXVN

Theo ba nguồn tin thân cận, sau khi DeepSeek ra mắt mô hình R1 vào tháng 1, các cơ quan chức năng đã khuyến khích công ty này sử dụng bộ xử lý Ascend của Huawei thay cho hệ thống của Nvidia.

Tuy nhiên, các nguồn tin cho biết công ty khởi nghiệp này đã liên tục gặp phải các vấn đề kỹ thuật trong quá trình huấn luyện mô hình R2 bằng chip Ascend. Điều này buộc họ phải chuyển sang sử dụng chip Nvidia cho giai đoạn huấn luyện và chỉ dùng chip của Huawei cho giai đoạn suy luận. Huấn luyện là quá trình mô hình học hỏi từ một bộ dữ liệu lớn, trong khi suy luận là bước sử dụng mô hình đã được huấn luyện để đưa ra dự đoán hoặc tạo ra phản hồi, chẳng hạn như trong một truy vấn chatbot.

Theo hai nguồn tin, Huawei đã cử một đội ngũ kỹ sư đến văn phòng của DeepSeek để hỗ trợ công ty sử dụng chip AI của họ nhằm phát triển mô hình R2. Tuy nhiên, các nguồn tin cho hay, dù có sự hỗ trợ trực tiếp từ đội ngũ này, DeepSeek vẫn không thể thực hiện thành công một chu trình huấn luyện nào trên chip Ascend. Các nguồn tin cũng cho biết thêm, DeepSeek vẫn đang hợp tác với Huawei để mô hình R2 có thể tương thích với chip Ascend cho giai đoạn suy luận.

Một người am hiểu tình hình cho biết, những vấn đề này là nguyên nhân chính khiến việc ra mắt mô hình R2 bị trì hoãn so với kế hoạch ban đầu vào tháng 5, làm cho DeepSeek mất đi lợi thế cạnh tranh so với các đối thủ. Nhiều bài báo trên truyền thông Trung Quốc cho rằng mô hình này có thể sẽ được phát hành trong vài tuần tới. DeepSeek và Huawei chưa có bình luận gì về vấn đề này.

Những khó khăn mà DeepSeek gặp phải cho thấy chip của Trung Quốc vẫn còn thua kém so với các đối thủ từ Mỹ trong các tác vụ quan trọng. Điều này nêu bật những thách thức mà Trung Quốc đang đối mặt trên con đường tự chủ về công nghệ.

Những người trong ngành cho biết chip của Trung Quốc gặp phải các vấn đề về độ ổn định, tốc độ kết nối giữa các chip chậm hơn và phần mềm kém hơn so với sản phẩm của Nvidia.

Ông Ritwik Gupta, một nhà nghiên cứu AI tại Đại học California, Berkeley, và cũng là người chuyên theo dõi hệ sinh thái AI của Huawei, cho rằng công ty đang phải đối mặt với "những khó khăn ban đầu" trong việc sử dụng chip Ascend cho quá trình huấn luyện.

Dù vậy, ông kỳ vọng rằng “nhà vô địch” công nghệ của Trung Quốc cuối cùng sẽ thích ứng được. Ông nói rằng việc chúng ta chưa thấy các mô hình hàng đầu được huấn luyện trên chip Huawei ngày hôm nay không có nghĩa là điều đó sẽ không xảy ra trong tương lai, đó chỉ là vấn đề thời gian.

Khánh Ly/ TTXVN (Theo Financial Times)

Nguồn Tin Tức TTXVN : https://baotintuc.vn/khoa-hoc-cong-nghe/no-luc-dung-chip-noi-dia-that-bai-deepseek-lui-ngay-ra-mat-mo-hinh-ai-moi-20250817144114108.htm