DeepSeek V3.1 dẫn đầu lập trình ở Trung Quốc, bị chê về suy luận và tạo văn bản

16 giờ trướcBài gốc

Điều này khiến giới quan sát đặt câu hỏi liệu công ty khởi nghiệp Trung Quốc có đang thay đổi trọng tâm nghiên cứu.

DeepSeek những tháng gần đây chỉ tung ra một vài bản cập nhật nhỏ, trong khi các đối thủ đã liên tục ra mắt mô hình trí tuệ nhân tạo (AI) mới.

Tối 19.8, DeepSeek lặng lẽ giới thiệu V3.1 thông qua một tin nhắn ngắn trong nhóm WeChat.

V3.1 được mở rộng cửa sổ ngữ cảnh lên 128k, cho phép mô hình AI lưu giữ nhiều thông tin hơn trong các cuộc trò chuyện với người dùng, tương đương cuốn sách khoảng 300 trang.

Công ty có trụ sở ở thành phố Hàng Châu không công bố thông tin này trên các kênh mạng xã hội công khai, gồm cả tài khoản X.

Là bản cập nhật lớn đầu tiên cho V3 kể từ tháng 3, V3.1 hiện đã có mặt trên Hugging Face - cộng đồng AI mã nguồn mở lớn nhất thế giới. Một số thử nghiệm bên thứ ba cho thấy V3.1 đã cải thiện khả năng lập trình.

Theo Aider Benchmark - bộ đánh giá khả năng lập trình của mô hình AI, DeepSeek V3.1 đứng đầu trong số các hệ thống Trung Quốc. Song khi so với các đối thủ quốc tế, V3.1 vẫn xếp sau Claude Opus 4, vốn được công nhận là một trong những mô hình AI lập trình tốt nhất hiện nay.

Dù vậy, một số người dùng bày tỏ thất vọng với bản cập nhật này của DeepSeek.

Liu Cong, nhà nghiên cứu khoa học máy tính ở thành phố Nam Kinh (thủ phủ tỉnh Giang Tô, Trung Quốc), cho rằng V3.1 không có cải thiện nào về khả năng suy luận so với mô hình R1-0528 của DeepSeek (trình làng cuối tháng 5). Ông gợi ý rằng V3.1 dường như là mô hình AI lai, hỗ trợ cả tác vụ suy luận lẫn không suy luận.

Người dùng Hugging Face có nickname smile1030 nhận xét chất lượng tạo văn bản của V3.1 đã suy giảm.

DeepSeek V3.1 đứng đầu về khả năng lập trình trong số các mô hình AI Trung Quốc, theo Aider Benchmark - Ảnh: Internet

Điểm đáng chú ý là DeepSeek đã xóa mọi đề cập tới mô hình suy luận R1 khỏi tính năng Deep Think (suy luận sâu hay nâng cao) của chatbot, làm dấy lên nghi vấn về tiến độ phát triển mô hình suy luận R2 vốn rất được mong đợi.

Công ty kín tiếng này chưa từng công bố lộ trình phát triển hoặc kế hoạch cho các mô hình AI tiếp theo.

Được doanh nhân Lương Văn Phong sáng lập như một dự án phụ từ công ty giao dịch định lượng của ông, DeepSeek thu hút sự chú ý toàn cầu với việc ra mắt mô hình V3 vào tháng 12.2024 và R1 hồi tháng 1, tạo ra làn sóng ứng dụng AI mã nguồn mở tại Trung Quốc.

Mức độ phổ biến của hai mô hình mã nguồn mở V3 và R1 từng thách thức OpenAI, Google, Anthropic.

DeepSeek chứng minh các công ty Trung Quốc có thể đạt được những bước tiến trong lĩnh vực AI với chi phí đào tạo mô hình thấp hơn rất nhiều các đối thủ Mỹ. V3 cùng R1 từng đạt hiệu suất ngang ngửa nhiều đối thủ phương Tây về các chỉ số.

Theo DeepSeek, V3 được huấn luyện chỉ bằng 2.048 chip Nvidia H800. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.

DeepSeek mất dần người dùng

Vài tháng gần đây, DeepSeek đã mất dần người dùng, khi các mô hình mã nguồn mở từ các hãng công nghệ lớn Trung Quốc như Alibaba, ByteDance, Tencent, Baidu ngày càng được ưa chuộng trong giới doanh nghiệp và người tiêu dùng.

Một trong những nguyên nhân là DeepSeek vẫn chỉ cung cấp mô hình AI dựa trên văn bản, trong khi các công ty khác đã mở rộng khả năng đa phương thức (xử lý nhiều loại dữ liệu như văn bản, hình ảnh, video, âm thanh) và lập trình.

Theo dữ liệu từ nền tảng điện toán đám mây PPIO (Trung Quốc), DeepSeek từng chiếm hơn 99% lượng sử dụng mô hình AI mã nguồn mở tại Trung Quốc vào quý 1/2025. Song đến tháng 6, thị phần này giảm xuống còn khoảng 80%. Trong khi đó, mức sử dụng các mô hình Qwen của Alibaba trên PPIO đã vượt DeepSeek cuối tháng 5.

Kimi-K2-Instruct, mô hình AI mã nguồn mở do công ty khởi nghiệp MoonShot AI (được Alibaba hậu thuẫn) phát triển, cũng đang nhanh chóng được đón nhận trên thế giới.

DeepSeek hoãn phát hành R2 vì cố dùng chip AI Huawei thay Nvidia

Không ít người hâm mộ DeepSeek vẫn đang chờ đợi sự ra mắt của R2. Truyền thông địa phương đổ lỗi cho sự tính toán cầu toàn của Lương Văn Phong (Giám đốc điều hành DeepSeek) là nguyên nhân gây ra sự chậm trễ này.

Thế nhưng, trang FT cho biết DeepSeek phải hoãn phát hành R2 sau khi không thể huấn luyện mô hình suy luận này bằng chip AI của gã khổng lồ công nghệ Huawei (Trung Quốc).

Sau khi R1 gây tiếng vang toàn cầu, DeepSeek đã được chính quyền Trung Quốc khuyến khích sử dụng chip AI Ascend của Huawei thay vì sản phẩm Nvidia, theo ba nguồn tin của FT am hiểu sự việc.

Tuy nhiên, DeepSeek gặp phải các vấn đề kỹ thuật kéo dài trong quá trình huấn luyện R2 bằng chip AI Ascend. Điều đó buộc công ty phải dùng chip AI Nvidia cho giai đoạn huấn luyện và chip Huawei ở giai đoạn suy luận, các nguồn tin cho biết.

Theo một người am hiểu tình hình, những vấn đề này là lý do chính khiến việc ra mắt R2 bị lùi lại từ tháng 5, khiến DeepSeek mất lợi thế trước các đối thủ.

Huấn luyện là giai đoạn mô hình AI học từ một tập dữ liệu lớn. Suy luận là bước sử dụng mô hình AI đã được huấn luyện để đưa ra dự đoán hoặc tạo phản hồi, chẳng hạn trả lời câu hỏi thông qua chatbot.

Những khó khăn của DeepSeek cho thấy chip Trung Quốc vẫn tụt hậu so với đối thủ Mỹ, đặc biệt là Nvidia (hãng chip AI số 1 thế giới), ở các tác vụ quan trọng, phản ánh thách thức mà cường quốc châu Á phải đối mặt trong mục tiêu tự chủ công nghệ.

Tuần trước, Trung Quốc đã yêu cầu các hãng công nghệ nước này giải trình các đơn đặt hàng chip H20 của Nvidia, nhằm khuyến khích họ sử dụng sản phẩm thay thế của Huawei và Cambricon, FT đưa tin.

Theo giới chuyên gia trong ngành, chip Trung Quốc gặp vấn đề về độ ổn định, tốc độ kết nối giữa các chip chậm hơn và phần mềm kém hơn so với sản phẩm của Nvidia.

Hai nguồn tin cho biết Huawei đã cử một nhóm kỹ sư tới văn phòng DeepSeek để hỗ trợ sử dụng chip AI của hãng nhằm phát triển R2. Song dù có đội hỗ trợ tại chỗ, DeepSeek vẫn không thể thực hiện thành công một lần huấn luyện R2 trên chip Ascend, theo FT.

Các nguồn tin của FT nói thêm rằng DeepSeek vẫn đang hợp tác với Huawei để giúp R2 tương thích với chip Ascend trong giai đoạn suy luận.

Những nguồn tin này cũng cho biết Lương Văn Phong đã bày tỏ sự không hài lòng với tiến độ của R2 và đang thúc ép nhân viên dành thêm thời gian để xây dựng một mô hình AI tiên tiến hơn, có thể duy trì vị thế hàng đầu của công ty trong lĩnh vực AI ở Trung Quốc.

Việc ra mắt R2 bị chậm lại còn do quá trình gán nhãn dữ liệu cho R2 mất nhiều thời gian hơn dự kiến, theo một nguồn tin khác của FT. Truyền thông Trung Quốc loan tin DeepSeek có thể tung ra R2 trong vài tuần tới.

“Các mô hình AI là loại sản phẩm có thể dễ dàng bị thay thế. Nhiều nhà phát triển đang dùng Qwen3 của Alibaba, vốn mạnh mẽ và linh hoạt”, Ritwik Gupta, nhà nghiên cứu AI tại Đại học California – Berkeley (Mỹ), nhận xét.

Ritwik Gupta lưu ý rằng Qwen3 áp dụng các khái niệm cốt lõi của DeepSeek, chẳng hạn thuật toán huấn luyện giúp mô hình AI có khả năng suy luận, nhưng đã làm cho chúng hiệu quả hơn khi sử dụng.

Theo dõi hệ sinh thái AI của Huawei, Ritwik Gupta cho rằng hãng công nghệ hàng đầu Trung Quốc này đang phải đối mặt với "những khó khăn ban đầu" khi sử dụng chip Ascend để đào tạo mô hình. Thế nhưng, ông tin Huawei sẽ thích nghi theo thời gian.

“Việc hiện tại chưa thấy các mô hình AI hàng đầu được huấn luyện trên chip Huawei không có nghĩa điều đó sẽ không xảy ra trong tương lai. Vấn đề chỉ là thời gian”, Ritwik Gupta nhận xét.

Đang ở trung tâm cuộc đối đầu địa chính trị Trung - Mỹ, Nvidia gần đây đã đồng ý chia sẻ 15% doanh thu với chính phủ Mỹ để có thể nối lại việc bán chip H20 cho Trung Quốc.

H20 là chip AI trung tâm dữ liệu mạnh nhất hiện nay của Nvidia dành cho thị trường Trung Quốc, chuyên dùng huấn luyện các mô hình.

“Các nhà phát triển sẽ đóng vai trò then chốt trong việc xây dựng hệ sinh thái AI chiến thắng. Từ bỏ toàn bộ thị trường cùng các nhà phát triển Trung Quốc chỉ làm tổn hại tới kinh tế và an ninh quốc gia Mỹ”, Nvidia nói về các công ty Trung Quốc đang dùng chip của hãng.

Sơn Vân

Nguồn Một Thế Giới : https://1thegioi.vn/deepseek-v3-1-dan-dau-lap-trinh-o-trung-quoc-bi-che-ve-suy-luan-va-tao-van-ban-236478.html