Đâu sẽ là DeepSeek tiếp theo của Trung Quốc?

Đâu sẽ là DeepSeek tiếp theo của Trung Quốc?
5 phút trướcBài gốc
Mô hình AI Doubao của ByteDance là đối thủ nặng ký của DeepSeek. Ảnh: CFOTO.
Theo Bloomberg, Trung Quốc đang gieo mầm cho một số dự án và công ty khởi nghiệp AI đầy triển vọng. Trong khi đó, những ông lớn công nghệ hàng đầu của quốc gia tỉ dân đã dành nhiều năm đầu tư cũng như phát triển cơ sở hạ tầng nhằm hỗ trợ các dự án mới.
Sau khi DeepSeek khuynh đảo giới công nghệ toàn cầu, nhiều chuyên gia đã nghi vấn về năng lực AI thật sự của Trung Quốc. Đặc biệt, quốc gia châu Á vẫn đang chịu lệnh hạn chế nhập khẩu phần cứng tiên tiến từ phía Mỹ. Tuy nhiên, một số dự án trí tuệ nhân tạo dưới đây có thể tiếp tục khiến thế giới bất ngờ trong thời gian tới.
Nhóm AI của các "ông lớn"
Alibaba, công ty hàng đầu về thương mại điện tử và điện toán đám mây của Trung Quốc đã tung ra Qwen 2.5 Max, mô hình AI mới nhất sau khi DeepSeek tạo nên làn sóng trên toàn cầu. Dưới thời CEO Eddie Wu, ông lớn công nghệ này đang tập trung lại vào các thế mạnh cốt lõi của mình, trong đó điện toán đám mây và trí tuệ nhân tạo là những dự án quan trọng trong kế hoạch phát triển.
Các ông lớn công nghệ như Alibaba, ByteDance đều đang đầu tư mạnh cho AI. Ảnh: Reuters.
Với mô hình Doubao 1.5 Pro, ByteDance đã xác định họ đang nghiêm túc bắt kịp các đối thủ khác trong lĩnh vực AI và đưa nó trở thành ưu tiên hàng đầu. Doubao được xây dựng bằng cách sử dụng Mixture of Experts (MoE), một phương pháp học máy rất phổ biến trong một số mô hình AI của Trung Quốc.
Hiện tại, Doubao đã đạt được sức hút tại quốc gia tỉ dân nhờ vào phản hồi dí dỏm giống con người cùng giao diện thân thiện với người dùng. Ngoài ra, chức năng tóm tắt cuộc họp và tạo hình ảnh của mô hình này cũng thu hút lượng lớn người dùng trẻ tuổi.
Gần đây, ByteDance cũng gây chú ý với mô hình OmniHuman-1, cho phép tạo video chỉ từ một bức ảnh và dòng lệnh. AI tạo video của công ty sở hữu TikTok sẽ cạnh tranh với Sora của OpenAI và Veo của Google.
Video tạo từ một bức ảnh của ByteDance ByteDance, công ty sở hữu TikTok vừa công bố công cụ AI có thể tạo video chỉ từ một bức ảnh và dòng lệnh.
Những cái tên tiềm năng
Ngoài các ông lớn công nghệ, nhiều mô hình AI đang được phát triển tại Trung Quốc thuộc về những nhà nghiên cứu từng làm tại các dự án AI ở Mỹ, hoặc startup. Đây có thể là những cái tên đáng chú ý, khi chính DeepSeek cũng có xuất phát điểm từ High Flyer, một công ty tài chính.
Moonshot được thành lập bởi trợ lý giáo sư Yang Zhilin của Đại học Thanh Hoa, người từng làm việc trong các dự án AI của Meta và Google. Bản phát hành mới nhất của Moonshot tận dụng năng lực tự học để tăng tốc và mở rộng quy mô đào tạo.
Được công bố cùng ngày với mô hình suy nghĩ sâu (R1) của DeepSeek, công nghệ của Moonshot có cơ chế hoạt động tương tự. Trong đó, các mô hình lý luận sử dụng phương pháp tiếp cận chuỗi suy nghĩ để tìm và tinh chỉnh câu trả lời cho một truy vấn.
Zhipu đã phát hành một loạt ứng dụng và công cụ, bao gồm tác nhân tự động mô phỏng hành động của người dùng trên smartphone hoặc trình duyệt web. Mô hình AI giọng nói của công ty bao gồm tái tạo giọng điệu, cảm xúc và sự không hoàn hảo của con người, chẳng hạn như thêm từ đệm hay ngắt quãng.
Công ty này đã bị Bộ Thương mại Mỹ đưa vào danh sách đen trong những ngày cuối cùng của chính quyền Tổng thống Joe Biden. Mặc dù vậy, Đại học Thanh Hoa vẫn ghi nhận thành công của Zhipu là nhờ cựu sinh viên Tang Jie, người đi đầu trong việc phát triển mô hình của công ty. Tang đồng thời là cố vấn cho Yang Zhilin trong dự án Moonshot.
Nhiều công ty AI Trung Quốc nuôi mộng trở thành DeepSeek thứ hai, tạo ra sản phẩm gây chú ý trên toàn cầu. Ảnh: Reuters.
Mô hình mới nhất của Baichuan áp dụng một kỹ thuật được gọi là suy nghĩ sâu sắc, có thể lý luận phức tạp và mô phỏng cách con người giải quyết vấn đề. Công ty cung cấp một công cụ theo dõi y tế dựa trên việc thu thập dữ liệu và nghiên cứu tài liệu chăm sóc sức khỏe cho các chuyên gia trong ngành. Ngoài ra, người sáng lập Wang Xiaochuan đã bán công cụ tìm kiếm web Sogou cho Tencent trước khi thành lập Baichuan.
Minimax sử dụng cơ chế Lightning Attention để phân chia hiệu quả các chuỗi dữ liệu lớn thành các ô nhỏ để dễ quản lý hơn. Mô hình được thiết kế để ưu tiên các phần quan trọng nhất của một đoạn văn bản dài mà không gặp tình trạng “dư thừa thông tin”.
Nhà sáng lập Yan Junjie đã nhận bằng tiến sĩ tại Viện Hàn lâm Khoa học Trung Quốc và tiếp tục theo học chương trình cao hơn tại Đại học Thanh Hoa. Ông là phó chủ tịch tại SenseTime trước khi rời đi để thành lập Minimax.
Giống cơ chế mã nguồn mở của DeepSeek, 01.AI đã phát hành mô hình Yi-Lightning Mixture of Experts vào tháng 10/2024, chỉ xếp hạng ngay sau các mô hình mã nguồn đóng của OpenAI và Google.
Công ty khởi nghiệp này tuyên bố đào tạo mô hình AI với chi phí thấp hơn nhiều so với các doanh nghiệp đầu ngành. Họ đang tiến xa trong việc thương mại hóa dịch vụ của mình và xây dựng một số giải pháp để ứng dụng đa ngành. Đầu tháng 1, 01.AI đã công bố một dự án mới phát triển chung với Alibaba.
Sản phẩm mới nhất của Stepfun là mô hình ngôn ngữ lớn với một nghìn tỷ tham số dựa trên kỹ thuật MoE. CEO Jiang Daxin trước đây đã dẫn đầu các nỗ lực nghiên cứu của Microsoft tại châu Á. Ngoài ra, quỹ phát triển do chính quyền Thượng Hải tài trợ là một trong những đơn vị đầu tiên ủng hộ dự án này.
Minh Hoàng
Nguồn Znews : https://znews.vn/lan-song-ai-trung-quoc-sap-xuat-hien-o-at-post1529817.html