Viện AI Mỹ ra mắt các mô hình hoàn toàn mở, thách thức sự thống trị của Trung Quốc

Viện AI Mỹ ra mắt các mô hình hoàn toàn mở, thách thức sự thống trị của Trung Quốc
một giờ trướcBài gốc
Ai2, tổ chức phi lợi nhuận Mỹ có trụ sở tại thành phố Seattle, đã phát hành loạt mô hình AI hoàn toàn mở Olmo mới nhất, công khai toàn bộ dữ liệu huấn luyện và quy trình xây dựng để công chúng kiểm tra, nhằm thách thức sự thống trị của Trung Quốc trong lĩnh vực AI mở.
Động thái này vượt ra ngoài thông lệ chung của các nhà phát triển AI Trung Quốc, vốn thường chỉ công bố trọng số mô hình để người khác xem và chỉnh sửa.
Ai2 cho biết sự minh bạch cao hơn có thể giúp tăng cường niềm tin của người dùng vào thời điểm các mô hình AI ngày càng được triển khai bởi các tổ chức để cung cấp dịch vụ quan trọng.
Mô hình Olmo 3-Think chủ lực của Ai2, có 32 tỉ tham số, đã thu hẹp khoảng cách về hiệu suất so với các sản phẩm Trung Quốc hàng đầu với quy mô tương tự, chẳng hạn Qwen3-32B thuộc Alibaba Cloud, dù được huấn luyện dựa trên lượng token ít hơn khoảng 6 lần, theo Ai2.
Alibaba Cloud là đơn vị điện toán đám mây và AI của gã khổng lồ thương mại điện tử Alibaba. Token là đơn vị cơ bản mà mô hình AI xử lý, không nhất thiết là từ đầy đủ, mà có thể là một phần của từ, một ký tự hoặc một từ nguyên.
Ai2 phát hành loạt mô hình Olmo mới nhất nhằm thách thức sự thống trị nguồn mở của Trung Quốc - Ảnh: Shutterstock
Kích thước tương đối nhỏ của các mô hình Olmo, từ 7 tỉ đến 32 tỉ tham số, cho phép chúng chạy trực tiếp trên phần cứng tiêu dùng thông thường. Điều này diễn ra trong bối cảnh các mô hình mở của Trung Quốc đã được áp dụng rộng rãi trên toàn cầu vì chi phí rẻ hơn so với sản phẩm Mỹ độc quyền hàng đầu như của OpenAI hay Google.
Hiện Trung Quốc thống trị lĩnh vực mô hình AI mã nguồn mở. Điều đáng chú ý là nhiều công ty khởi nghiệp ở Mỹ dùng các mô hình AI Trung Quốc để tiết kiệm chi phí.
Theo tờ The Stanford Review, các mô hình AI Trung Quốc đã trở thành lựa chọn mặc định tại nhiều tổ chức trung tâm của ngành AI Mỹ, thậm chí các lớp học khoa học máy tính tại Đại học Stanford (Mỹ) cũng phụ thuộc rất nhiều vào mô hình Qwen thuộc Alibaba Cloud.
Tuy nhiên, các mô hình này cũng đối mặt với chỉ trích vì tiềm ẩn rủi ro bảo mật và đưa ra kết quả bị kiểm duyệt. Chính quyền Trump từng kêu gọi Mỹ phát triển các mô hình mở “dựa trên các giá trị của Mỹ”.
“Trọng số mở chứ không phải mã nguồn mở thực sự”
Trong thông báo của mình, Ai2 gọi các mô hình AI Trung Quốc là trọng số mở chứ không phải “mã nguồn mở thực sự”. Lý do vì các công ty Trung Quốc thường chỉ công bố trọng số mô hình AI chứ không phải toàn bộ dữ liệu huấn luyện và mã nguồn.
Ngược lại, Ai2 cho biết mô hình Olmo 3 được huấn luyện trước trên bộ dữ liệu 9.300 tỉ token, loại trừ các nội dung đằng sau tường phí (phải trả phí để xem). Ai2 cũng công bố “luồng mô hình”, mô tả chi tiết về toàn bộ vòng đời tạo ra hệ thống.
Tại Trung Quốc, công ty khởi nghiệp AI hàng đầu DeepSeek đã thúc đẩy sự minh bạch hơn, khi công bố bài viết được bình duyệt trên tạp chí Nature (Anh) vào tháng 9, mô tả quá trình huấn luyện mô hình suy luận mã nguồn mở R1.
Tuần trước, công ty khởi nghiệp Deep Cogito (có trụ sở tại thành phố San Francisco, Mỹ) đã phát hành Cogito v2.1, được quảng bá là “mô hình ngôn ngữ lớn trọng số mở tốt nhất của một công ty Mỹ”. Điểm đáng chú ý là Cogito v2.1 được xây dựng dựa trên mô hình nền tảng của DeepSeek.
"Olmo 3 32B có thể sản phẩm tạo ảnh hưởng lớn nhất trong bộ mô hình mới"
Trên mạng xã hội X, Nathan Lambert (nhà nghiên cứu tại Ai2) cho biết mô hình nền tảng Olmo 3 32B có thể là “sản phẩm tạo ảnh hưởng lớn nhất” trong bộ mô hình mới. Ông lưu ý rằng Alibaba chưa công khai mã nguồn mô hình nền tảng Qwen3 32B tương đương “có lẽ vì lý do cạnh tranh”.
Nathan Lambert là nhà nghiên cứu tại Ai2 và lãnh đạo dự án ATOM - Ảnh: X
Các nhà phát triển thường tùy chỉnh mô hình nền tảng với trường hợp sử dụng cụ thể của mình, cho phép dữ liệu được lưu trữ và xử lý tại chỗ thay vì gửi lên đám mây.
“Là các nhà khoa học, chúng tôi không muốn đánh giá chất lượng công việc dựa trên nguồn gốc địa lý, nhưng đây là cân nhắc rất thực tế với nhiều doanh nghiệp muốn sử dụng mô hình mở như giải pháp AI đáng tin cậy cùng dữ liệu nhạy cảm”, Nathan Lambert viết.
Được thành lập năm 2014 bởi Paul Allen (đồng sáng lập Microsoft), Ai2 thực hiện nghiên cứu nền tảng về AI mở và robot.
Dự án ATOM: Mỹ chỉ cần 100 triệu USD mỗi năm để xây dựng và duy trì mô hình AI mã nguồn mở tiên tiến
Hồi tháng 8, Nathan Lambert khởi động dự án ATOM (American Truly Open Models - Mô hình mở thực sự của Mỹ) để thúc đẩy các mô hình mở phát triển tại Mỹ nhằm đối phó với sự thống trị của Trung Quốc.
Nathan Lambert lập ra dự án này để cảnh báo rủi ro nếu Mỹ tụt hậu trong nguồn mở. Theo ông, Mỹ cần các mô hình mở tiên tiến một phần vì việc phụ thuộc vào mô hình nước ngoài có thể trở thành vấn đề nếu nó đột ngột bị ngừng phát triển hoặc đóng mã nguồn.
Ông cho rằng mô hình mở còn thúc đẩy đổi mới và thử nghiệm giữa các công ty khởi nghiệp cùng giới nghiên cứu. Ngoài ra, các công ty có dữ liệu nhạy cảm cần mô hình mở để chạy trên hạ tầng riêng. “Mô hình mở là một thành phần nền tảng của nghiên cứu, lan tỏa, đổi mới AI, và Mỹ nên đóng vai trò dẫn dắt thay vì chạy theo các quốc gia khác”, Nathan Lambert nói.
Dự án ATOM đưa ra lập luận thuyết phục về việc cần nhiều sự cởi mở hơn và cho thấy các mô hình mở của Trung Quốc đã vượt Mỹ vài năm gần đây.
Một số người khác cho rằng những cách tiếp cận táo bạo về chia sẻ dữ liệu có thể giúp Mỹ lấy lại đà tiến trong lĩnh vực AI.
Andrew Trask, Giám đốc điều hành OpenMined - công ty phát triển phương pháp huấn luyện AI theo kiểu liên kết liên bang, mới đây kêu gọi chính phủ Mỹ xây dựng chương trình giúp doanh nghiệp tiếp cận các bộ dữ liệu huấn luyện không công khai. Ông ví chương trình này với ARPANET, mạng lưới do Bộ Quốc phòng Mỹ tài trợ và sau đó trở thành nền tảng của internet.
Andrew Trask nói việc tiếp cận lượng dữ liệu đó có thể mang tính quyết định cho bước nhảy vọt tiếp theo của AI. Ở điểm này, Trung Quốc có thể có lợi thế nếu chính phủ buộc nhiều công ty phải chia sẻ dữ liệu cho các nhóm phát triển mô hình.
“Hiện có khoảng 180 zettabyte (1 tỉ TB) dữ liệu ngoài kia”, Andrew Trask nói. Trong khi đó, các mô hình AI mạnh nhất ngày nay chỉ được huấn luyện dựa trên vài trăm TB.
Nathan Lambert cho biết một số công ty đã bắt đầu tỏ ý muốn hỗ trợ nỗ lực xây dựng các mô hình mở tiên tiến. “Điều quan trọng nhất ở đây là chi phí để Mỹ cạnh tranh với các mô hình mở của Trung Quốc thực ra rất thấp”, ông nói.
Dự án ATOM ước tính Mỹ cần khoảng 100 triệu USD mỗi năm để xây dựng và duy trì một mô hình AI mã nguồn mở tiên tiến. Trong thế giới AI, con số đó không lớn. Thậm chí, 100 triệu USD chỉ bằng khoản tiền mà Giám đốc điều hành Mark Zuckerberg sẵn sàng trả cho một nhân tài AI để tham gia nỗ lực xây dựng siêu trí tuệ mới của Meta Platforms.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/vien-ai-my-ra-mat-cac-mo-hinh-hoan-toan-mo-thach-thuc-su-thong-tri-cua-trung-quoc-241475.html