Cuộc đua AI đang cạnh tranh quyết liệt không chỉ giữa các hãng mà còn giữa các quốc gia
Động thái trên được cho là sẽ vượt ra ngoài một tuyên bố công nghệ đơn thuần và làm gia tăng cuộc cạnh tranh giành vị thế dẫn đầu AI giữa Mỹ và Trung Quốc.
Ernie 5.0 tự tin nhỉnh hơn ChatGPT 4.5
Baidu dự kiến chính thức ra mắt mô hình AI tạo sinh thế hệ mới có tên là Ernie 5.0 vào nửa cuối năm nay. Ernie 5.0 được biết đến là có khả năng hỗ trợ các chức năng đa phương thức, có thể hiểu và tạo ra nhiều dạng dữ liệu khác nhau như văn bản, hình ảnh, âm thanh và video.
Hiện tại, Baidu đang vận hành một mô hình chuyên về suy luận có tên là Ernie X1 cùng với mô hình Ernie 4.5. Ernie X1 có cấu trúc tương tự như mô hình R1 mà DeepSeek đã công bố hồi tháng 1 năm nay, còn Ernie 4.5 được đánh giá là có hiệu năng tương đương hoặc thậm chí cao hơn so với GPT-4.5 của OpenAI.
Baidu đặt mục tiêu không chỉ chiếm lĩnh hệ sinh thái AI trong nước mà còn hướng tới thị trường toàn cầu thông qua dòng sản phẩm Ernie. Trước đó, điều khiến thị trường chú ý chính là bước đi của DeepSeek.
DeepSeek đã gây chú ý chỉ sau một đêm bằng cách công khai mã nguồn mô hình DeepSeek-R1 – vốn có hiệu suất tiệm cận GPT-4. Chi phí huấn luyện chỉ khoảng 6 triệu USD, DeepSeek gây chấn động lớn trong và ngoài ngành vì đạt được hiệu quả cao với chi phí cực thấp so với các mô hình lớn của Mỹ.
Sau tuyên bố đó, cổ phiếu công nghệ Mỹ tiếp tục lao dốc. Đặc biệt, cổ phiếu của Nvidia – “gã khổng lồ” trong lĩnh vực bộ xử lý đồ họa (GPU), vốn là trung tâm của các hoạt động AI tạo sinh – đã giảm khoảng 17%, khiến vốn hóa thị trường của công ty này bốc hơi khoảng 60 tỉ USD.
Chiến lược phát triển AI của Trung Quốc
Các hành động của Trung Quốc không chỉ dừng lại ở cấp độ doanh nghiệp, mà còn gắn liền với các chiến lược cấp quốc gia. Chính phủ Trung Quốc đã xác định AI là một ngành chiến lược chủ chốt quốc gia, và ngoài Baidu, các tập đoàn công nghệ lớn như Tencent, Alibaba và ByteDance cũng đã phát triển hoặc thương mại hóa các mô hình LLM riêng của mình.
Những mô hình này đang được ứng dụng nhanh chóng trong nhiều lĩnh vực như giáo dục, tài chính, pháp luật và chăm sóc khách hàng, đáp ứng nhu cầu trong nước. Đồng thời, các công ty cũng đang tích cực theo đuổi khả năng phản hồi đa ngôn ngữ nhằm chuẩn bị cho việc mở rộng ra thị trường toàn cầu.
Cuối tuần qua, Alibaba đã chính thức ra mắt Qwen VLo, một mô hình ngôn ngữ lớn đa phương thức mới. Mô hình này được thiết kế để nâng cao đáng kể khả năng hiểu và tạo nội dung hình ảnh, mang đến cho người dùng trải nghiệm sáng tạo trực quan tiên tiến hơn.
Hiện tại Qwen VLo đang ở giai đoạn xem trước, đã thể hiện được nhiều chức năng đáng chú ý và hứa hẹn tiềm năng lớn trong lĩnh vực sáng tạo nội dung bằng AI. Các kết quả đo lường so sánh cho thấy mô hình Qwen đặc biệt vượt trội trong các tác vụ trích xuất dữ liệu chi tiết như hiểu tài liệu và trả lời câu hỏi dựa trên hình ảnh. Trong khi đó, các đối thủ như LLaMA 3.2 lại mạnh hơn ở khả năng hiểu ngữ cảnh và xử lý nhanh hơn. Khi được so sánh với GPT-4 Vision, QwenVL đã vượt trội trong 5 trên 7 bài kiểm tra chuẩn.
Về phần mình, giới quan sát cũng đang theo dõi xem liệu các mô hình mới của Trung Quốc có thể làm lung lay cấu trúc cạnh tranh AI toàn cầu hiện nay hay không. Một chuyên gia trong ngành nhận định: “Tốc độ phát triển công nghệ AI của Trung Quốc đang vượt ngoài dự đoán”.
Vị này dự đoán: “Nếu Trung Quốc không chỉ nâng cao năng lực công nghệ, mà còn tăng cường hiệu quả chi phí và khả năng bản địa hóa dịch vụ, thì họ sẽ bắt đầu cạnh tranh trực diện với các công ty Mỹ trên thị trường toàn cầu”.
Anh Tú