Lý do DeepSeek 7 lần cập nhật mô hình AI nhưng không gây chấn động như R1

Lý do DeepSeek 7 lần cập nhật mô hình AI nhưng không gây chấn động như R1
2 ngày trướcBài gốc
Cổ phiếu nhiều hãng công nghệ hàng đầu phương Tây đã lao dốc khi thị trường rơi vào trạng thái hoảng loạn trước viễn cảnh mô hình AI (trí tuệ nhân tạo) mới từ công ty AI của Trung Quốc còn khá xa lạ, thách thức giả định về sự thống trị của Mỹ trong lĩnh vực này.
Chỉ trong ngày 27.1.2025, cổ phiếu Nvidia giảm mạnh 17%, khiến hãng chip AI số 1 thế giới mất gần 600 tỉ USD vốn hóa thị trường. Cổ phiếu nhà sản xuất chip Broadcom (Mỹ) cũng giảm 17%. Trong khi cổ phiếu ASML (Hà Lan), hãng cung cấp thiết bị sản xuất chip hàng đầu thế giới, giảm 7% chỉ trong một ngày.
11 tháng sau, những công ty đó không chỉ phục hồi mà còn tiếp tục tăng trưởng. Nvidia trở thành công ty đầu tiên đạt vốn hóa thị trường 5.000 tỉ USD vào cuối tháng 10.2025. Cổ phiếu Broadcom và ASML lần lượt tăng 49% và 36% trong năm 2025.
“R1 đã khiến thị trường phải định giá lại trên diện rộng, vì làm thay đổi cách thế giới nhìn nhận về chi phí phát triển các mô hình AI tiên tiến cũng như năng lực cạnh tranh của Trung Quốc. Quan trọng hơn, điều này tác động trực tiếp đến câu chuyện tăng trưởng của ngành chip và các công ty hạ tầng đám mây quy mô lớn”, bà Haritha Khandabattu, Giám đốc phân tích cấp cao tại Gartner, nhận định. Gartner là công ty nghiên cứu và tư vấn hàng đầu thế giới trong lĩnh vực CNTT lẫn chuyển đổi số.
Kể từ đó, DeepSeek đã phát hành 7 bản cập nhật mô hình AI mới, song không phiên bản nào gây chú ý mạnh mẽ như R1 hồi tháng 1.2025. Tại sao thị trường lại không phản ứng như trước?
Không còn yếu tố gây sốc
Được thành lập vào năm 2023, DeepSeek tung ra mô hình ngôn ngữ lớn mã nguồn mở miễn phí V3 vào cuối năm 2024. Công ty có trụ sở ở thành phố Hàng Châu (Trung Quốc) cho biết V3 được huấn luyện chỉ bằng 2.048 GPU (bộ xử lý đồ họa) Nvidia H800 trong khoảng hai tháng và chi phí là 5,6 triệu USD, thấp hơn nhiều so với các mô hình AI của OpenAI và Google.
H800 không phải là loại chip AI hàng đầu của Nvidia, ban đầu được phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Tháng 1.2025, DeepSeek trình làng R1, đạt hiệu suất ngang hoặc vượt trội hơn nhiều mô hình AI hàng đầu thế giới. Đến tháng 9.2025, DeepSeek gây sốc khi tiết lộ R1 có chi phí huấn luyện chỉ 294.000 USD và sử dụng 512 GPU Nvidia H800.
DeepSeek hé lộ chỉ mất 294.000 USD để huấn luyện R1, thấp hơn 19 lần so với mức 5,6 triệu USD dành cho V3 - Ảnh: Internet
“Việc DeepSeek công bố R1 vào tháng 1.2025 thực sự gây bất ngờ cho thị trường. Thời điểm đó, người ta cho rằng Trung Quốc đang tụt hậu so với Mỹ từ 9 đến 12 tháng trong lĩnh vực AI”, Alex Platt, nhà phân tích cấp cao tại công ty đầu tư D.A. Davidson, nói với hãng tin CNBC.
Viễn cảnh một mô hình AI đạt kết quả tương tự các hệ thống tiên tiến nhất nhưng sử dụng ít năng lực tính toán hơn để huấn luyện làm dấy lên lo ngại rằng nhu cầu hạ tầng AI sẽ bị ảnh hưởng, kéo theo doanh thu của những công ty như Nvidia suy giảm, theo Brian Colello - nhà phân tích cổ phiếu cấp cao tại hãng Morningstar.
“Thay vào đó, chúng tôi không thấy sự chậm lại trong chi tiêu vào năm 2025. Khi nhìn về phía trước, chúng tôi dự đoán sẽ có sự tăng tốc trong chi tiêu vào 2026 và những năm tiếp theo”, Brian Colello nhận định.
Một yếu tố khác là loại sản phẩm DeepSeek tung ra kể từ tháng 1.2025: Tất cả đều là bản cập nhật cho V3 và R1, chứ không phải mô hình AI hoàn toàn mới.
Trong khi các phiên bản mô hình AI gần đây của DeepSeek là “bước tiến đáng kể” về hiệu suất và khả năng, thị trường lại xem chúng như là “sự tiếp nối và củng cố hơn là làn sóng đột phá mới”, theo Haritha Khandabattu.
Hạn chế về năng lực tính toán
Một phần lý do DeepSeek chưa phát hành mô hình AI mới có thể là do hạn chế về năng lực tính toán, các nhà phân tích nói với CNBC.
“Năng lực tính toán là một nút thắt cổ chai lớn. Nếu thiếu năng lực tính toán, bạn chỉ có thể thực hiện lượng nghiên cứu thuật toán nhất định và tìm ra một số lượng sáng tạo kiến trúc nhất định”, Alex Platt nhận xét.
DeepSeek đã trì hoãn việc phát hành R2, ban đầu được lên kế hoạch vào tháng 5.2025, do những thách thức trong việc huấn luyện mô hình AI này trên chip Ascend của Huawei, tờ Financial Times đưa tin hồi tháng 8.2025.
Chính quyền Trung Quốc khuyến khích DeepSeek sử dụng chip Ascend để giảm sự phụ thuộc vào công nghệ Mỹ, nhất là khi nước này siết chặt xuất khẩu các chip AI cao cấp nhất của Nvidia.
“Trung Quốc đã bị hạn chế về lượng sức mạnh tính toán mà nước này có thể tiếp cận vài năm qua, phần lớn là do các hạn chế của Mỹ với việc bán chip. Nếu muốn xây dựng các mô hình AI tiên tiến, bạn cần có quyền tiếp cận sức mạnh tính toán mạnh mẽ”, Chris Miller, tác giả cuốn sách Chip War (Cuộc chiến chip), nói với CNBC.
Trong một bài nghiên cứu được công bố đầu tháng 1.2026, DeepSeek thừa nhận “một số hạn chế nhất định khi so sánh với các mô hình mã nguồn đóng tiên tiến” như Gemini 3, gồm cả tài nguyên tính toán.
Niềm tin vào vị thế dẫn đầu của Mỹ
Thị trường (các nhà đầu tư và doanh nghiệp) cảm thấy yên tâm hơn về vị thế dẫn đầu của Mỹ trong lĩnh vực AI, vì các công ty hàng đầu nước này liên tục ra mắt những mô hình mới tiên tiến.
Hồi tháng 8.2025, OpenAI đã phát hành GPT-5. Đến tháng 11.2025, Google ra mắt Gemini 3 và Anthropic tung ra Claude Opus 4.5.
“Các công ty này cạnh tranh rất gay gắt, liên tục ra mắt mô hình AI mới và cải thiện dần năng lực của chúng. Do đó, nỗi lo rằng mô hình AI làm giảm giá trị và trở thành sản phẩm phổ thông nhanh chóng đã lắng xuống”, nhà phân tích Arun Chandrasekaran của Gartner chia sẻ với CNBC.
Song có những dấu hiệu cho thấy DeepSeek đang chuẩn bị cho việc phát hành một mô hình AI quan trọng hơn thời gian tới. Đêm 31.12.2025 vừa qua, DeepSeek đã công bố bài báo chi tiết về cách huấn luyện mô hình AI lớn hơn với chi phí thấp hơn, trong đó Giám đốc điều hành Lương Văn Phong là đồng tác giả.
Chuyên gia phân tích Dan Ives của hãng Wedbush Securities cho rằng sẽ còn nhiều cú sốc nữa trên thị trường. “Một số khoảnh khắc như chúng ta đã thấy sẽ còn tiếp diễn trong năm 2026. Sẽ có một DeepSeek khác”, ông nói với CNBC.
DeepSeek thêm tính năng “suy nghĩ” nâng cao cho chatbot khi người dùng hoạt động hằng tháng tăng 90%
DeepSeek vừa cập nhật giao diện chatbot bằng cách thêm tính năng “suy nghĩ” nâng cao trong bối cảnh ứng dụng của họ ghi nhận mức tăng 90% người dùng hoạt động hàng tháng (MAU) trong tháng 12.2025, lên gần 131,5 triệu người.
Các bản nâng cấp, gồm cả chế độ nghiên cứu sâu tương tự sản phẩm cùng tên của OpenAI, được nhà phân tích đánh giá là cải tiến hiếm thấy cho người dùng chatbot DeepSeek, đúng thời điểm thị trường đang háo hức chờ đợi các mô hình thế hệ mới của họ.
Trang web và ứng dụng di động của DeepSeek đều bắt đầu cung cấp chức năng tìm kiếm nâng cao gọi là “suy nghĩ xen kẽ”, trong đó mô hình AI thực hiện nghiên cứu nhiều bước với các giai đoạn “suy nghĩ” đan xen xuyên suốt quá trình.
Trước đây, mô hình AI sẽ “suy nghĩ” một lần dựa trên yêu cầu từ người dùng trước khi tạo ra phản hồi qua giao diện chatbot DeepSeek. Với cơ chế “xen kẽ”, mô hình AI có thể “suy nghĩ” giữa từng bước hành động, từ đó nâng cao khả năng nghiên cứu của mình.
Quy trình này là cốt lõi của những công cụ nghiên cứu mạnh mẽ như Deep Research của OpenAI, có thể xử lý các truy vấn phức tạp. Ví dụ, sau khi mở một trang web, mô hình AI có thể cần “suy nghĩ” về độ tin cậy của thông tin trước khi quyết định tham khảo tài liệu khác để xác minh kết quả.
Một thử nghiệm của báo SCMP cho thấy DeepSeek không phải lúc nào cũng bật chế độ “nghiên cứu sâu”, trừ khi nhận được các truy vấn phức tạp. Khi tính năng này được kích hoạt, người dùng có thể thấy từng bước trong quá trình “suy nghĩ xen kẽ”.
Một số công ty khởi nghiệp AI Trung Quốc khác, chẳng hạn Moonshot AI và MiniMax, gần đây cũng đã thêm các tính năng tương tự vào chatbot của họ.
Một bổ sung khác cho chatbot DeepSeek là giao diện dòng thời gian, cho phép người dùng chuyển đổi giữa các câu hỏi. Đây là chức năng chỉ thấy ở vài chatbot khác, trong đó có Grok của công ty khởi nghiệp xAI do Elon Musk điều hành.
DeepSeek không chính thức công bố các bản nâng cấp, nhưng “suy nghĩ xen kẽ” đã được giới thiệu như một tính năng trong mô hình mới nhất V3.2, ra mắt đầu tháng 12.2025. Công ty cho biết V3.2 có khả năng suy luận tương đương Gemini 3 Pro của Google.
Nhiều người kỳ vọng DeepSeek phát hành mô hình AI mới trước Tết Nguyên đán - Ảnh: Internet
Theo Aicpb - trang chuyên theo dõi các sản phẩm AI, chatbot DeepSeek là ứng dụng AI tăng trưởng nhanh nhất Trung Quốc trong tháng 12, với MAU tăng lên mức gần 131,5 triệu người.
Mức tăng mạnh này đảo ngược xu hướng giảm người dùng trong nhiều tháng trước đó, khi DeepSeek (nổi tiếng với trọng tâm nghiên cứu lõi) tụt sau các đối thủ trong nước về cải thiện trải nghiệm cho người dùng suốt năm 2025, theo Li Bangzhu - người sáng lập Aicpb.
Ví dụ, chatbot DeepSeek vẫn chưa hỗ trợ đa phương thức, trong khi Doubao của ByteDance (ứng dụng AI phổ biến nhất Trung Quốc) đã có thể xử lý và tạo ra văn bản, giọng nói, hình ảnh lẫn video.
Các nâng cấp giao diện có thể giúp số lượng người dùng DeepSeek tăng thêm, theo Delta Wu - lãnh đạo Unique Research (công ty nghiên cứu AI Trung Quốc). R1 từng gây chú ý vì là mô hình AI đầu tiên công khai quá trình suy nghĩ của mình với người dùng - tính năng sau đó được các đối thủ áp dụng.
“Tuy nhiên, tôi nghĩ sản phẩm DeepSeek vẫn là sân chơi thử nghiệm cho các mô hình của họ, nơi thu thập phản hồi và tiến hành các vòng cải tiến. Đến nay, DeepSeek dường như không quá quan tâm đến số lượng người dùng cuối, với sứ mệnh cốt lõi vẫn là đạt được AI tổng quát (AGI hay AI có khả năng tương đương con người - PV)”, Delta Wu bình luận.
Nhiều người kỳ vọng DeepSeek sẽ ra mắt mô hình lớn tiếp theo trước kỳ nghỉ Tết Nguyên đán vào giữa tháng 2 sắp tới, tương tự năm ngoái.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/ly-do-deepseek-7-lan-cap-nhat-mo-hinh-ai-nhung-khong-gay-chan-dong-nhu-r1-243314.html