DeepSeek V4 trình làng: Cửa sổ ngữ cảnh 1 triệu token và chiến lược giá gây áp lực lên OpenAI

DeepSeek V4 trình làng: Cửa sổ ngữ cảnh 1 triệu token và chiến lược giá gây áp lực lên OpenAI
4 giờ trướcBài gốc
DeepSeek vừa công bố mô hình ngôn ngữ lớn thế hệ thứ tư (V4) dưới dạng bản xem trước (Preview), đánh dấu bước tiến mới trong cuộc đua trí tuệ nhân tạo toàn cầu. Điểm nhấn lớn nhất của lần nâng cấp này là cửa sổ ngữ cảnh được mở rộng lên tới một triệu token, cho phép hệ thống xử lý các tập dữ liệu khổng lồ trong một lần truy vấn duy nhất.
Sức mạnh kỹ thuật của DeepSeek V4 Pro
Phiên bản DeepSeek V4 Pro sở hữu hệ thống định tuyến chuyên gia (Mixture-of-Experts - MoE) cấu trúc 16×16. Theo dữ liệu công bố, mô hình này đạt 88,5% trên thang đo MMLU (Massive Multitask Language Understanding), cải thiện đáng kể so với mức 85,5% của phiên bản V3 tiền nhiệm.
Một đột phá quan trọng khác của V4 Pro là khả năng phân tích trực tiếp khối lượng tài liệu hoặc mã nguồn quy mô lớn mà không cần thông qua lớp truy xuất tăng cường (RAG). Điều này giúp tối giản hóa quy trình xử lý dữ liệu cho các doanh nghiệp và lập trình viên khi làm việc với các dự án phức tạp.
DeepSeek ra mắt mô hình V4 thách thức OpenAI và Google (Nguồn: Internet)
V4 Flash: Giải pháp tối ưu tốc độ và chi phí
Bên cạnh bản Pro, DeepSeek cũng giới thiệu biến thể V4 Flash. Đây là mô hình được tối ưu hóa cho các tác vụ cần tốc độ xử lý nhanh và tiết kiệm tài nguyên. V4 Flash sở hữu tổng cộng 284 tỷ tham số, trong đó có 13 tỷ tham số hoạt động (active parameters) cho mỗi lượt xử lý.
Biến thể này được định vị để cạnh tranh trực tiếp với các mô hình "mini" từ phương Tây như GPT-4o-mini của OpenAI hay Claude Haiku của Anthropic. Với cấu trúc tham số thông minh, V4 Flash duy trì được sự cân bằng giữa hiệu năng suy luận và khả năng phản hồi thời gian thực.
So sánh chi phí sử dụng giữa các mô hình
Chi phí vẫn là lợi thế cạnh tranh cốt lõi của các dòng sản phẩm từ DeepSeek. Dưới đây là bảng so sánh mức giá niêm yết cho mỗi triệu token:
Mức giá này được đánh giá là thấp hơn đáng kể so với các mô hình tương đương từ OpenAI hay Google. Trước đó, vào đầu năm 2025, DeepSeek từng gây chấn động khi cung cấp dịch vụ với chi phí rẻ hơn tới 96,4% so với mô hình OpenAI o1, gây ra những biến động lớn trên thị trường công nghệ và buộc các tập đoàn lớn như Nvidia hay Meta phải điều chỉnh chiến lược.
Cục diện cuộc đua AI giữa Trung Quốc và Hoa Kỳ
Sự kiện ra mắt DeepSeek V4 diễn ra chỉ vài giờ sau khi OpenAI công bố GPT-5.5 – mô hình được kỳ vọng là thông minh nhất hiện nay với khả năng tư duy sắc bén và xử lý ít token hơn. Trong khi OpenAI tập trung vào khả năng nghiên cứu khoa học và thực hiện các tác vụ phức tạp trên máy tính cá nhân, DeepSeek lại khẳng định vị thế ở mảng mã nguồn mở và hiệu quả kinh tế.
Hiện tại, trong các bảng xếp hạng hiệu năng toàn cầu, DeepSeek V4 Pro đang giữ vị trí sát sao với Gemini-Pro-3.1 của Google. Dù vẫn có khoảng cách nhỏ về mặt điểm số thuần túy, nhưng lợi thế về chi phí và cửa sổ ngữ cảnh 1 triệu token khiến mô hình từ Trung Quốc trở thành lựa chọn hấp dẫn cho cả người dùng cá nhân lẫn doanh nghiệp trong việc triển khai các ứng dụng AI thực tiễn.
PHỐ HỘI
Nguồn Đà Nẵng : https://baodanang.vn/deepseek-v4-trinh-lang-cua-so-ngu-canh-1-trieu-token-va-chien-luoc-gia-gay-ap-luc-len-openai-3334454.html