Giám đốc điều hành Nvidia Jensen Huang. Ảnh: Reuters.
Không còn xa lạ với nỗi lo bị Nvidia "đè bẹp", nhiều công ty AI nhỏ đang chủ động phá bỏ công nghệ cũ trước khi đối thủ lớn ra tay. Đó cũng là cách Tuhin Srivastava, đồng sáng lập nền tảng suy luận AI Baseten, chuẩn bị ứng phó khi Nvidia tung ra nền tảng mới.
"Trong AI, bạn phải đốt cháy những chiếc thuyền. Chúng tôi chưa đốt, nhưng đã mua dầu hỏa rồi", Srivastava chia sẻ với Business Insider.
Câu chuyện bắt đầu đầu năm nay khi nhóm của Srivastava làm việc với mô hình lý luận DeepSeek R1. Việc triển khai gặp khó khăn do quá trình suy luận của AI bị tắc nghẽn, khiến mô hình phản hồi chậm và kém hiệu quả với khách hàng.
Mặc dù Baseten có quyền truy cập vào chip Nvidia H200 - dòng chip tiên tiến nhất thời điểm đó - phần mềm Triton Inference Server đi kèm lại không xử lý tốt các yêu cầu suy luận phức tạp. Baseten buộc phải xây dựng phần mềm riêng để tối ưu hóa quy trình.
Tháng 3 vừa qua, CEO Nvidia Jensen Huang giới thiệu Dynamo - nền tảng suy luận mã nguồn mở giúp tối ưu quá trình suy luận trên chip Nvidia. Huang mô tả Dynamo như "hệ điều hành của nhà máy AI".
Ông Jensen Huang phát biểu tại Hội nghị công nghệ GPU Nvidia (GTC) tại Trung tâm SAP ở thành phố San Jose, bang California, Mỹ. Ảnh: Reuters
Với sự ra mắt của Dynamo, Srivastava biết rõ: nền tảng do Baseten tự phát triển sẽ sớm bị vượt mặt. Ông dự đoán công ty mình sẽ mất vài tháng để chuyển sang hệ thống mới.
"Tôi đã chuẩn bị tinh thần cho việc này", ông nói.
Không chỉ Nvidia, toàn ngành học máy cũng đang phát triển thần tốc. Các mô hình AI ngày càng phức tạp, đòi hỏi nhiều sức mạnh tính toán hơn, nhưng cũng nhanh chóng trở nên lỗi thời khi các kỹ sư tìm ra thuật toán tối ưu hơn.
"Bạn không thể trung thành với bất kỳ khuôn khổ hay cách làm nào mãi mãi", Karl Mozurkewich - kiến trúc sư trưởng tại công ty điện toán đám mây Valdi, nhận xét.
Theo Brown, một YouTuber và nhà phát triển AI, chia sẻ rằng AI đã biến những thứ từng được ngành công nghệ xem là "bất khả xâm phạm" thành những thứ "dễ dàng vứt bỏ".
Brown kể rằng thời còn làm kỹ sư tại Twitch, anh từng gặp sự phản đối dữ dội khi đề xuất viết lại dự án thay vì xây dựng trên nền cũ. "Tôi phải học cách hành động thật nhanh trước khi ai đó kịp ngăn cản", anh nói.
Đây cũng là lý do khiến các startup AI thường nhanh nhạy hơn so với các tập đoàn lớn, vốn bị ràng buộc bởi quy trình và chi phí đầu tư cũ.
Quinn Slack, CEO nền tảng mã hóa AI Sourcegraph, cho rằng khoảng 80% các công ty Fortune 500 nhận ra nền tảng AI đầu tiên của họ cần phải thay đổi chỉ sau một buổi họp kéo dài một giờ.
Tuy nhiên, không phải ai cũng chọn "đốt thuyền".
Ben Miller - CEO của nền tảng đầu tư bất động sản Fundrise - đang xây dựng sản phẩm AI mới cho ngành của mình. Với ông, nếu mô hình hiện tại đủ tốt, công ty sẽ không vội vàng chuyển sang cái mới.
"Tôi sẽ gắn bó với những gì hiệu quả trong thời gian dài nhất có thể", Miller cho biết thêm một phần lý do là vì ông điều hành một tổ chức quy mô lớn.
Tư duy của Miller cho thấy bài toán cân bằng phổ biến trong ngành: giữa việc đổi mới liên tục và duy trì sự ổn định.
Mozurkewich nhấn mạnh rằng, khi sản phẩm đã gần sát với người tiêu dùng, lợi ích từ việc "đi nhanh và phá bỏ mọi thứ" giảm đi rõ rệt.
"Không có gì đảm bảo rằng bạn sẽ có thêm khách hàng hoặc doanh thu chỉ vì ra mắt tính năng tiên tiến nhất", ông nói.
Trong thế giới AI, nơi công nghệ thay đổi từng tháng, lựa chọn giữa đổi mới và bền vững vẫn là câu hỏi lớn mà không có câu trả lời cố định.
Hoài An