Đó chính là điều mà Modular, công ty khởi nghiệp được thành lập bởi cựu chuyên gia phần mềm từ Apple và Google, đang cố gắng thực hiện.
Chris Lattner và Tim Davis, hai nhà đồng sáng lập Modular, đã dành hàng thập kỷ để xây dựng nền tảng phần mềm cơ bản cho ngành công nghệ hiện đại. Chris Lattner nổi tiếng với việc tạo ra ngôn ngữ lập trình Swift của Apple. Ông cũng là người xây dựng phần mềm hỗ trợ TPU (chip AI của Google) cùng với Tim Davis.
Giờ đây, họ đang nhắm mục tiêu vào CUDA. Nỗ lực này có vẻ điên rồ, nhưng đó là dự án táo bạo có thể làm thay đổi ngành công nghiệp AI (trí tuệ nhân tạo).
"Nhiều người cho rằng điều đó hơi điên rồ. Đó là lợi thế của Chris Lattner: Anh ấy đủ thông minh để biết cách làm và cũng đủ liều lĩnh để bắt tay vào thực hiện", Kylan Gibbs, Giám đốc điều hành công ty khởi nghiệp Inworld AI và cựu quản lý sản phẩm tại Google DeepMind, chia sẻ với trang Insider.
Chris Lattner, đồng sáng lập kiêm Giám đốc điều hành Modular - Ảnh: Chloe Jackman
CUDA vững mạnh, sự cạnh tranh bị phân mảnh
CUDA ra đời cách đây gần 20 năm như một cách để lập trình chip đồ họa. Ngày nay, CUDA đã phát triển thành một hệ sinh thái phần mềm đa tầng, ngôn ngữ, thư viện, trình biên dịch, hệ thống suy luận, mà hầu hết công ty AI đều dựa vào.
Thành công đó đi kèm với một cái giá: Hầu hết ngành công nghiệp hiện nay đều được tối ưu hóa dựa trên phần cứng của Nvidia. CUDA ràng buộc các tác vụ AI với GPU (bộ xử lý đồ họa) của Nvidia. Điều đó rất tốt cho Nvidia, nhưng lại hạn chế sâu sắc với tất cả nhà cung cấp khác.
Thoạt nhìn, dường như có rất nhiều đối thủ cạnh tranh với Nvidia: AMD bán GPU, Google có TPU, Amazon tạo ra chip AI Trainium và hàng loạt công ty khởi nghiệp đang xây dựng phần cứng tương tự .
Vấn đề là mỗi chip đều đi kèm với một bộ phần mềm riêng được tối ưu hóa chỉ dành cho thành phần đó. Thay vì phát triển bộ phần mềm từ đâu, việc sử dụng CUDA và GPU của Nvidia sẽ đơn giản hơn.
Tuy nhiên, các nhà phát triển AI lại khao khát tính linh hoạt: Khả năng sử dụng bất kỳ sự kết hợp nào giữa GPU từ nhiều nhà cung cấp khác nhau mà không cần phải thay đổi nhiều bộ phần mềm.
“Hiện không ai tạo ra phần mềm có thể dùng cho nhiều loại chip khác nhau. Ai lại muốn phát triển phần mềm cho nhiều chip trong khi chính dự án chip đó đã có phần mềm riêng?”, Chris Lattner, Giám đốc điều hành Modular, nói trong cuộc phỏng vấn với trang Insider.
Nvidia có thể mở rộng CUDA để hoạt động tốt trên các chip AI của đối thủ. Song như vậy sẽ làm suy yếu lợi thế cạnh tranh lớn nhất của Nvidia: Mối liên kết khép kín giữa phần mềm và GPU của hãng.
GPU được sử dụng để xây dựng, huấn luyện và vận hành mô hình AI cùng các sản phẩm liên quan. Ban đầu, GPU được thiết kế để xử lý các tác vụ đồ họa phức tạp, như kết xuất hình ảnh 3D trong game hoặc phần mềm thiết kế. Tuy nhiên ngày nay, GPU được sử dụng rộng rãi trong nhiều lĩnh vực vượt xa đồ họa, đặc biệt là AI và học máy.
Lý do là vì GPU có kiến trúc xử lý song song với hàng nghìn lõi tính toán nhỏ, cho phép thực hiện đồng thời rất nhiều phép tính ma trận và vector - những thứ mà AI và mô hình ngôn ngữ cần để huấn luyện và suy luận. Trong khi đó, CPU (bộ xử lý trung tâm) thường chỉ có ít lõi hơn và tối ưu cho các tác vụ tuần tự.
Nghịch lý mang đến cơ hội lớn
Với Chris Lattner, nghịch lý này lại mang đến cơ hội lớn.
"Chúng tôi nhận ra rằng không ai trong ngành thực sự có động lực để làm điều này. Nó rất tốn kém, rất khó khăn, nhưng đồng thời mọi người đều muốn điều này", Chris Lattner nói.
Đó là điều đã truyền cảm hứng cho Chris Lattner - Tim Davis rời Google và thành lập Modular vào 2022, năm mà ChatGPT gây tiếng vang lớn trên toàn thế giới.
Kể từ đó, Modular đã huy động được 380 triệu USD từ các nhà đầu tư gồm Greylock, General Catalyst và GV (quỹ đầu tư mạo hiểm của Google). Vòng gọi vốn mới nhất vào tháng 9 đã định giá công ty khởi nghiệp này ở mức 1,6 tỉ USD. Modular không phải cái tên duy nhất nỗ lực phá vỡ thế độc quyền của CUDA. Trước đó có ZLUDA - dự án mã nguồn mở được AMD tài trợ, và gần đây hơn là công ty khởi nghiệp Spectral Compute, đã huy động được 6 triệu USD.
Chris Lattner đã sử dụng một phần số tiền này để thuê các lập trình viên tài năng từ Google, Apple và các hãng công nghệ khác. Họ đã dành ba năm làm việc trong điều kiện khá kín tiếng để tạo ra những nền tảng cơ bản cho một bộ phần mềm AI mới.
Chris Lattner đứng trên sân khấu cùng Tim Davis (phải), đồng sáng lập kiêm Chủ tịch Modular - Ảnh: Chloe Jackman
Bộ phần mềm AI mới của Modular mở ra cơ hội để so sánh GPU Nvidia với chip khác
Nền tảng này bắt đầu với một ngôn ngữ lập trình hoàn toàn mới, có tên Mojo, cung cấp khả năng điều khiển chuyên sâu để giúp các chip AI hoạt động hiệu quả nhất có thể.
Modular đã thiết kế ngôn ngữ này để hoạt động tương tự Python, ngôn ngữ lập trình phổ biến và dễ sử dụng. Thế nhưng, Mojo cũng có tốc độ và sức mạnh của các ngôn ngữ phức tạp hơn, chẳng hạn C++, rất cần thiết cho việc phát triển AI. Mojo cũng hoạt động tốt với PyTorch, một khung phát triển mã nguồn mở thường được sử dụng khi xây dựng các mô hình và ứng dụng AI.
Carles Gelada, cựu nhà nghiên cứu OpenAI, nhận xét: "Có một số dự án thú vị nhằm tạo ra các khung và nền tảng không phụ thuộc vào GPU, thách thức CUDA. Mojo là dự án thú vị nhất".
MAX là lớp quan trọng tiếp theo trong kiến trúc phần mềm mới của Modular. Nó cung cấp sức mạnh cho suy luận AI, tức là cách các mô hình được vận hành. Phần này tương thích với GPU Nvidia, GPU AMD và các chip tương tự từ Apple. Modular hy vọng sẽ bổ sung thêm nhiều chip AI trong tương lai.
Trên cùng là lớp Mammoth, giúp các nhà phát triển AI quản lý các cụm GPU.
Cuối tháng 9, Modular thông báo đã đạt được hiệu năng tối ưu với GPU Blackwell B200 của Nvidia và GPU MI355X mới nhất của AMD trên cùng một nền tảng phần mềm.
Chris Lattner cho biết Modular đã giúp các GPU AMD hoạt động tốt hơn khoảng 50% so với khi các chip này chạy bằng phần mềm riêng của AMD.
Quan trọng hơn, khả năng chạy các GPU khác nhau trên cùng một nền tảng phần mềm giờ đây mở ra cơ hội hấp dẫn để so sánh sản phẩm Nvidia với chip AI của đối thủ trên sân chơi công bằng hơn.
"Câu hỏi hiển nhiên là liệu MI355X có thể cạnh tranh với Blackwell không? Những dấu hiệu ban đầu cho thấy câu trả lời là có", Modular viết trong một bài đăng trên blog khi công bố kết quả.
“Chúng tôi đạt được hiệu suất tuyệt vời”
Kylan Gibbs (CEO Inworld AI) đã thử nghiệm phần mềm của Modular trong môi trường thực tế.
Inworld AI phát triển công nghệ AI đàm thoại tốc độ cao, thời gian thực, hỗ trợ các sản phẩm từ các công ty lớn, gồm cả Disney, NBCUniversal và Niantic Labs.
Đầu năm nay, khi thiết kế một mô hình AI chuyển văn bản thành giọng nói mới và được tiếp cận sớm với GPU Nvidia Blackwell B200, Inworld đã đưa ra thách thức cho Modular: “Giảm chi phí của chúng tôi 60% và giảm độ trễ 40%, chúng tôi sẽ hợp tác với các bạn”.
“Chỉ trong khoảng bốn tuần, chúng tôi đạt được hiệu suất tuyệt vời này. Tôi đặt cược bằng ví tiền của mình”, Kylan Gibbs nói và nhanh chóng ký hợp tác với Modular.
Dù Inworld AI bị thu hút bởi những cải tiến về hiệu năng của Modular trên các GPU Nvidia mới nhất, Kylan Gibbs thích tính linh hoạt khi có thể dùng nhiều chip AI khác nhau trong tương lai nếu cần.
"Điều đáng mừng là chúng ta sẽ có thể chuyển sang phần cứng mới. Giả sử AMD phát triển mạnh, giả sử TPU thành công với Google, hoặc có thể có những phần cứng mới khác xuất hiện. Vì vậy, thật tốt khi có nhiều lựa chọn như vậy", ông nhấn mạnh.
"Nvidia không nhất thiết phải biến mất"
Trên thực tế, các TPU của Google đang có bước tiến. Google gần đây đã phát hành một mô hình AI Gemini 3 và nhận được nhiều đánh giá tích cực. Gemini 3 được huấn luyện và vận hành bằng TPU. Một số công ty AI khác đã ký kết thỏa thuận sử dụng TPU để thay thế hoặc kết hợp với GPU Nvidia.
Điều đó đã đẩy Nvidia vào thế phòng thủ. Một dự án như Modular, với lời hứa về khả năng tương thích trên nhiều phần cứng AI khác nhau, càng làm tăng thêm áp lực này.
Theo Kylan Gibbs, Nvidia có thể phá dự án của Modular chỉ trong một ngày. Ông nói Nvidia chỉ cần chỉnh sửa CUDA một chút là có thể làm Modular mất đi lợi thế về tính di động giữa các loại GPU.
Thế nhưng, Chris Lattner nói rằng Modular không cố gắng hủy hoại Nvidia. Trên thực tế, ông lập luận rằng Nvidia sẽ tiếp tục phát triển mạnh mẽ ngay cả khi Modular thành công rực rỡ.
"Chúng tôi đang cố xây dựng thứ gì đó giống Android, nhưng cho phần cứng AI", Chris Lattner chỉa sẻ với Insider, đề cập đến hệ điều hành di động của Google đang được sử dụng trên hầu hết smartphone trên thế giới.
Dù hàng tỉ người sử dụng thiết bị Android, nhưng thành công này không làm iOS (hệ điều hành di động của Apple) biến mất. iPhone vẫn thống trị thị trường smartphone Mỹ và nhiều nơi trên thế giới.
Chris Lattner nói rằng điều tương tự sẽ xảy ra trong lĩnh vực AI khi phần mềm của Modular giúp các phần cứng khác cạnh tranh hơn, mang lại cho các nhà phát triển sự tự do hơn và từng bước phá vỡ thế độc quyền của một nhà cung cấp duy nhất trong ngành.
"Vì vậy, Nvidia không nhất thiết phải biến mất, nhưng chúng tôi muốn có nhiều sự cạnh tranh hơn. Chúng tôi muốn có nhiều đổi mới hơn. Tôi nghĩ điều đó tốt cho thế giới", ông nhấn mạnh.
Sơn Vân