Nvidia hiện là ông vua không thể tranh cãi trong lĩnh vực chip AI (trí tuệ nhân tạo). Song chính nhờ AI mà Nvidia góp phần tạo ra, vị thế đó có thể sớm đối mặt với cạnh tranh ngày càng lớn.
Phần lớn mô hình AI ngày nay đang được vận hành trên GPU (bộ xử lý đồ họa) do Nvidia thiết kế. Đây là động lực giúp Nvidia trở thành công ty có vốn hóa thị trường lớn nhất thế giới (4.900 tỉ USD). Với mỗi thế hệ GPU mới, Nvidia giúp các công ty huấn luyện mô hình AI mới mạnh mẽ hơn bằng cách kết nối hàng trăm hoặc hàng nghìn bộ xử lý trong các trung tâm dữ liệu khổng lồ.
Một trong những lý do giúp Nvidia thành công là cung cấp nền tảng phần mềm CUDA, hỗ trợ lập trình cho từng thế hệ GPU mới. Tuy nhiên, lợi thế này có thể sớm không còn quá khác biệt.
Công ty khởi nghiệp Wafer đang huấn luyện mô hình AI để thực hiện một trong những công việc khó và quan trọng nhất: tối ưu mã sao cho chạy hiệu quả nhất trên từng kiến trúc chip cụ thể.
Emilio Andere, đồng sáng lập kiêm Giám đốc điều hành Wafer, cho biết công ty sử dụng học tăng cường trên các mô hình AI mã nguồn mở để dạy chúng viết kernel code (mã lõi), tức phần mềm tương tác trực tiếp với phần cứng trong hệ điều hành. Ngoài ra, Wafer còn bổ sung các công cụ đặc biệt vào những mô hình AI lập trình như Claude Code của Anthropic và Codex của OpenAI, nhằm tăng cường khả năng viết mã có thể chạy trực tiếp trên chip.
Hiện nay, nhiều hãng công nghệ lớn đã có chip riêng. Apple từ lâu đã sử dụng chip tùy chỉnh để cải thiện hiệu năng và hiệu quả cho phần mềm chạy trên laptop, máy tính bảng, smartphone. Ở quy mô lớn hơn, Google và Amazon cũng tự phát triển chip AI để nâng cao hiệu suất nền tảng điện toán đám mây. Meta gần đây cho biết sẽ triển khai 1 gigawatt năng lực tính toán với một chip mới được phát triển cùng Broadcom. Việc triển khai chip tùy chỉnh cũng đòi hỏi phải viết rất nhiều mã để đảm bảo phần mềm chạy trơn tru và hiệu quả trên chip đó.
Wafer đang hợp tác với các công ty như AMD và Amazon để tối ưu phần mềm chạy hiệu quả trên chip của họ. Công ty khởi nghiệp này đến nay đã huy động được 4 triệu USD vốn đầu tư ban đầu từ Jeff Dean (nhà khoa học trưởng Google), Wojciech Zaremba (đồng sáng lập OpenAI) và những người khác.
Wafer đang huấn luyện mô hình AI để tối ưu mã sao cho chạy hiệu quả nhất trên từng kiến trúc chip cụ thể, thách thức sự thống trị của Nvidia - Ảnh: Getty Images
“Wafer có thể thách thức sự thống trị của Nvidia”
Emilio Andere tin rằng Wafer có thể thách thức sự thống trị của Nvidia. Hiện nay, nhiều chip cao cấp đã có sức mạnh tính toán cơ bản (đặc biệt là các phép tính số thập phân) tương đương với những GPU tốt nhất của Nvidia. Đây là thước đo quan trọng trong ngành.
“Chip tốt nhất của AMD, Trainium của Amazon hay TPU của Google đều có số FLOPS lý thuyết tương đương GPU Nvidia. Chúng tôi muốn tối đa hóa trí tuệ trên mỗi watt điện”, ông nói.
FLOPS là số phép tính số thập phân mà chip có thể thực hiện trong 1 giây.
Theo Emilio Andere, các kỹ sư hiệu năng có đủ kỹ năng để tối ưu mã chạy ổn định và hiệu quả trên các chip này rất đắt đỏ và khan hiếm, trong khi hệ sinh thái phần mềm Nvidia giúp việc viết và bảo trì mã cho chip của họ dễ dàng hơn. Vì vậy, ngay cả các hãng công nghệ lớn cũng khó tự làm mọi thứ mà không dựa vào Nvidia.
Chẳng hạn, khi hợp tác với Amazon để xây dựng mô hình AI dựa trên chip Trainium, Anthropic phải viết lại toàn bộ mã của mô hình từ đầu để chạy hiệu quả nhất trên phần cứng này.
Claude Code hiện là một trong nhiều mô hình AI có khả năng viết mã vượt trội so với con người. Vì vậy, Emilio Andere cho rằng sẽ không lâu nữa AI có thể làm suy giảm lợi thế phần mềm của Nvidia.
“Lợi thế cạnh tranh nằm ở khả năng lập trình của chip. Tôi nghĩ đã đến lúc phải xem xét lại liệu đó có thực sự là một lợi thế cạnh tranh mạnh mẽ hay không”, Emilio Andere nói, ám chỉ các thư viện và công cụ phần mềm giúp tối ưu mã cho phần cứng Nvidia.
AI giúp thiết kế chip dễ dàng hơn
Ngoài việc giúp tối ưu mã cho nhiều loại kiến trúc chip khác nhau, AI cũng có thể sớm giúp việc thiết kế chip trở nên dễ dàng hơn.
Ricursive Intelligence, công ty khởi nghiệp do hai cựu kỹ sư Google là Azalia Mirhoseini và Anna Goldie sáng lập, đang phát triển các phương pháp mới để thiết kế chip bằng AI. Nếu công nghệ này thành công, sẽ có nhiều công ty hơn tham gia vào thiết kế chip, tạo ra chip tùy chỉnh giúp phần mềm của họ chạy hiệu quả hơn.
“Chúng tôi đang nhắm vào những khâu khó nhất của thiết kế chip - thiết kế vật lý và kiểm định thiết kế”, Azalia Mirhoseini, hiện là trợ lý giáo sư tại Đại học Stanford, cho biết.
Thiết kế chip là một trong những công việc quan trọng nhưng cũng cực kỳ phức tạp. Các kỹ sư phải xác định cách sắp xếp một số lượng lớn các thành phần trên một miếng silicon để tối ưu chức năng. Sau khi thiết kế ban đầu hoàn tất, hiệu năng của chip phải được kiểm tra và xác minh qua nhiều vòng lặp trước khi gửi sang nhà máy sản xuất.
Azalia Mirhoseini và Anna Goldie trước đây đã phát triển phương pháp dùng AI để tối ưu bố trí các thành phần quan trọng trên chip tại Google. Cách tiếp cận này đã thay đổi cách Google thiết kế chip và hiện được sử dụng rộng rãi trong ngành.
Tuy nhiên, Ricursive Intelligence muốn tiến xa hơn bằng cách tự động hóa nhiều khâu trong thiết kế chip và tích hợp các mô hình ngôn ngữ lớn vào quy trình. Mục tiêu là cho phép kỹ sư sử dụng ngôn ngữ tự nhiên để mô tả thay đổi hoặc đặt câu hỏi về chip. Giống như việc lập trình ứng dụng bằng ngôn ngữ tự nhiên, trong tương lai nhiều khả năng sẽ có thiết kế chip bằng ngôn ngữ tự nhiên.
Ricursive Intelligence vẫn đang phát triển công nghệ, nhưng Azalia Mirhoseini cho biết công ty đã chứng minh có thể tối ưu thêm nhiều khía cạnh của thiết kế chip.
Triển vọng tự động hóa thiết kế chip theo cách này đang khiến giới đầu tư rất hào hứng: Ricursive Intelligence đã huy động được 335 triệu USD với định giá công ty 4 tỉ USD chỉ trong vài tháng.
Anna Goldie cho rằng cuối cùng AI có thể đồng thiết kế cả chip lẫn thuật toán để khiến chúng mạnh mẽ hơn. Bà nhận định rằng nếu AI có thể tự điều chỉnh chính chip và mã nguồn của mình thì sẽ tạo ra kiểu cải tiến lặp lại liên tục cho công nghệ này.
“Chúng ta đang bước vào một giai đoạn mới mà chỉ cần dành nhiều sức mạnh tính toán hơn để thiết kế chip nhanh hơn và tốt hơn. Điều này sẽ tạo ra một dạng định luật mở rộng cho thiết kế chip”, Anna Goldie nhấn mạnh.
Sơn Vân