Ngôi vương AI của Mỹ bị lung lay

3 ngày trướcBài gốc

AI đang và đã trở thành chiến trường mới nhất giữa Mỹ và Trung Quốc khi cả hai cường quốc đều coi đây là công nghệ chiến lược.

Phía Washington thậm chí còn tìm mọi cách để ngăn chặn khả năng tiếp cận và sản xuất chip của Trung Quốc đối với các ứng dụng trí tuệ nhân tạo (AI) và quân sự.

Tuy nhiên, nỗ lực này đang trên bờ vực thất bại khi những chuyên gia và các nhà phân tích công nghệ nhận định với CNBC rằng các mô hình ngôn ngữ lớn (LLM) của Trung Quốc đã rất phổ biến và đang bắt kịp, hay thậm chí là vượt qua phiên bản của nước Mỹ về mặt hiệu suất.

Sự thống trị của Trung Quốc với các LLM

LLM là các thuật toán AI học sâu có thể nhận dạng, tóm tắt, dịch, dự đoán và tạo nội dung bằng cách sử dụng các tập dữ liệu khổng lồ.

Tuy nhiên, không giống như mô hình của OpenAI hỗ trợ cho chatbot ChatGPT, nhiều công ty Trung Quốc đang phát triển các LLM mã nguồn mở để các nhà phát triển có thể tải xuống và xây dựng miễn phí mà không cần yêu cầu cấp phép nghiêm ngặt từ nhà phát hành.

Điều này đã giúp những LLM Trung Quốc đang trở nên phổ biến hơn bao giờ hết. Theo SCMP, nhóm mô hình ngôn ngữ lớn (LLM) của Alibaba đã được xếp hạng trong số 10 mô hình mở hàng đầu thế giới do cộng đồng nhà phát triển Hugging Face công bố.

LLM Trung Quốc đang trở nên phổ biến hơn bao giờ hết. Ảnh: Shutterstock.

Trong đó, 3/4 dự án AI của Trung Quốc được xếp hạng cao nhất đều đến từ chương trình Tongyi Qianwen, được phát triển bởi gã khổng lồ thương mại điện tử và điện toán đám mây Alibaba.

Trong đó, chương trình LLM Qwen-72B-Instruct của Alibaba đứng đầu danh sách trên với điểm trung bình là 43,02, dựa vào 6 tiêu chuẩn đánh giá.

Mô hình Qwen này được đào tạo trên 72 tỷ tham số, giúp hệ thống sở hữu khả năng tạo dữ liệu đầu ra đáng ngưỡng mộ.

“Qwen đang nhanh chóng trở nên phổ biến nhờ hiệu suất vượt trội trong các tiêu chuẩn cạnh tranh”, Tiezhen Wang, một kỹ sư máy học của Hugging Face nói với CNBC.

Theo Wang, Qwen sở hữu “mô hình cấp phép rất thuận lợi”, đồng nghĩa với việc các công ty có thể sử dụng LLM mà không cần “xem xét pháp lý rộng rãi”.

Các mô hình tham số lớn sẽ có sức mạnh tính toán mạnh hơn, nhưng sẽ khiến chi phí cho các phép tính toán cao hơn. Trong khi đó, các mô hình có kích thước nhỏ hơn sẽ rẻ hơn khi chạy. Với Qwen, người dùng có thể chọn cả hai khi có nhiều kích cỡ hoặc tham số khác nhau.

“Bất kể bạn chọn kích thước nào, Qwen có thể là một trong những mô hình có hiệu suất tốt nhất hiện nay”, Wang nói thêm.

DeepSeek - một trong những startup mới về AI gần đây cũng tạo nên làn sóng với một mô hình có tên DeepSeek-R1.

Tháng trước, DeepSeek cho biết mô hình R1 của họ hoàn toàn có thể cạnh tranh trực tiếp với o1 của OpenAI — LLM được thiết kế để suy luận hoặc giải quyết các nhiệm vụ phức tạp hơn so với GPT-4o.

Không chỉ cạnh tranh với mô hình mới nhất của cha đẻ ChatGPT, startup này còn tuyên bố các mô hình của họ có thể đứng ngang hàng với các dịch vụ mã nguồn mở khác như Meta Llama cũng như các LLM đóng như OpenAI trên nhiều chức năng khác nhau.

Tham vọng vươn ra toàn cầu

Việc mở nguồn công nghệ phục vụ nhiều mục đích, bao gồm thúc đẩy sự đổi mới khi ngày càng nhiều nhà phát triển có thể tiếp cận công nghệ đó cũng như xây dựng cộng đồng xung quanh sản phẩm.

Chương trình LLM Qwen-72B-Instruct của Alibaba hiện được đánh giá có hiệu suất vượt trội trong ngành. Ảnh: Alibaba.

Không chỉ các công ty Trung Quốc theo đuổi những LLM nguồn mở. Meta, công ty mẹ của Facebook, cũng như startup Mistral của châu Âu cũng đều đã có các phiên bản mô hình AI mã nguồn mở.

Tuy nhiên, khi ngành công nghệ bị cuốn vào cuộc chiến địa chính trị giữa Washington và Bắc Kinh, các chương trình LLM nguồn mở mang đến cho các công ty Trung Quốc một lợi thế khác: Đưa mô hình AI của họ ra toàn cầu.

“Các công ty Trung Quốc muốn thấy mô hình của họ được sử dụng bên ngoài Trung Quốc, vì vậy đây chắc chắn là cách để các công ty này trở thành những thế lực toàn cầu trong lĩnh vực AI”, Paul Triolo, đối tác tại công ty tư vấn toàn cầu DGA Group chia sẻ với CNBC.

Sự công nhận đối với LLM của Alibaba cho thấy mức độ tiến bộ nhanh chóng của công ty trong lĩnh vực AI nhờ vào cam kết mạnh mẽ đối với việc phát triển hệ thống mã nguồn mở. Tongyi Qianwen đã được mở cho các nhà phát triển bên thứ ba trong vài tháng qua.

Mã nguồn mở cũng cung cấp quyền truy cập công khai vào chương trình, cho phép các nhà phát triển phần mềm của bên thứ ba sửa đổi và chia sẻ thiết kế, thay thế các liên kết bị hỏng hoặc mở rộng khả năng của chương trình.

Theo SCMP, các hệ thống mã nguồn mở đã đóng góp rất lớn vào ngành công nghệ tại Trung Quốc trong vài thập kỷ qua.

Hội nghị Trí tuệ nhân tạo thế giới tại Thượng Hải vào tháng 7/2023. Ảnh: Future Publishing.

Nên nhớ, những thành tựa mà Trung Quốc đạt được đang đến trong bối cảnh nước này vẫn đang bị Mỹ áp đặt các hạn chế xuất khẩu thiết bị sản xuất chip và bán dẫn tiên tiến.

Tuy nhiên, bất chấp những hạn chế này, các công ty Trung Quốc vẫn có thể tung ra các mô hình AI tiên tiến.

“Các nền tảng công nghệ lớn của Trung Quốc hiện có đủ khả năng tiếp cận sức mạnh tính toán để tiếp tục cải thiện các mô hình. Điều này là do họ đã tích trữ một lượng lớn GPU Nvidia và cũng đang tận dụng GPU trong nước từ Huawei và các công ty khác”, ông Triolo giải thích.

Theo CNBC, các công ty Trung Quốc đã và đang thúc đẩy nỗ lực tạo ra các giải pháp thay thế khả thi cho Nvidia.

Huawei hiện là một trong những công ty hàng đầu theo đuổi mục tiêu này tại Trung Quốc, trong khi các ông lớn công nghệ khác như Baidu và Alibaba cũng đã đầu tư vào thiết kế chất bán dẫn.

Anh Tuấn

Nguồn Znews : https://znews.vn/ngoi-vuong-ai-cua-my-bi-lung-lay-post1519646.html