Chip mới của Amazon là cuộc cách mạng trong lĩnh vực chip AI
Chip gia tốc Trainium3 vừa được lắp đặt tại một số trung tâm dữ liệu và sẽ có sẵn cho khách hàng từ hôm 2.12, đánh dấu bước tiến quan trọng của Amazon Web Services (AWS) trong việc thoát khỏi sự thống trị của Nvidia trong lĩnh vực chip AI.
Chiến lược tốc độ và hiệu suất giá
Dave Brown, phó chủ tịch của AWS, cho biết trong một cuộc phỏng vấn rằng vào đầu năm tới công ty sẽ bắt đầu mở rộng quy mô rất nhanh. Động thái chip này là yếu tố chính trong chiến lược của Amazon để nổi bật trong AI. AWS là người bán lớn nhất năng lượng điện toán thuê và lưu trữ dữ liệu, nhưng đã vật lộn để sao chép sự thống trị đó trong số các nhà phát triển công cụ AI hàng đầu, vì một số công ty thay vào đó chọn dựa vào Microsoft, có quan hệ chặt chẽ với OpenAI nhà sáng tạo ChatGPT, hoặc Google của Alphabet.
Amazon hy vọng thu hút các công ty tìm kiếm giá rẻ. Chip Trainium có khả năng cung cấp năng lượng cho các phép tính chuyên sâu đằng sau các mô hình AI rẻ hơn và hiệu quả hơn so với các đơn vị xử lý đồ họa dẫn đầu thị trường của Nvidia, theo công ty. Brown nói: "Chúng tôi rất hài lòng với khả năng có được hiệu suất giá phù hợp với Trainium”. Chiến lược định vị này phản ánh nhận thức của Amazon rằng không phải mọi công ty đều cần hiệu suất tối đa mà Nvidia cung cấp, và nhiều người sẽ sẵn sàng đánh đổi một chút hiệu suất để tiết kiệm chi phí đáng kể.
Amazon đang phát hành Trainium3 khoảng một năm sau khi triển khai chip gia tốc trước đó, một tốc độ nhanh theo tiêu chuẩn ngành chip. Một kỹ sư AWS đã đùa khi chip lần đầu tiên được khởi động vào tháng Tám: "Điều chính chúng tôi sẽ hy vọng ở đây là chúng tôi không thấy bất kỳ loại khói hoặc lửa nào”. Lời đùa này phản ánh căng thẳng và rủi ro liên quan đến việc đưa công nghệ chip mới ra thị trường với tốc độ nhanh như vậy.
Sự quay vòng nhanh chóng cũng phù hợp với tốc độ của Nvidia, công ty đã cam kết phát hành chip mới mỗi năm. Trong ngành bán dẫn, nơi chu kỳ phát triển thường kéo dài nhiều năm, khả năng của cả Amazon và Nvidia trong việc lặp lại hàng năm là một thành tích ấn tượng. Tuy nhiên, có một điểm yếu quan trọng: chip của Amazon thiếu các thư viện phần mềm sâu giúp khách hàng đưa các đơn vị xử lý đồ họa của Nvidia vào hoạt động nhanh chóng.
Bedrock Robotics, một công ty sử dụng mô hình trí tuệ nhân tạo để cho phép thiết bị xây dựng hoạt động tự động, chạy cơ sở hạ tầng của mình trên máy chủ AWS. Nhưng khi xây dựng mô hình để giúp hướng dẫn máy xúc, Bedrock sử dụng chip Nvidia, theo Giám đốc công nghệ Kevin Peterson. Ông nói: "Chúng tôi cần nó có hiệu suất và dễ sử dụng. Đó là Nvidia”. Nhận xét này làm nổi bật thách thức lớn nhất mà Amazon phải đối mặt: xây dựng hệ sinh thái phần mềm mạnh mẽ xung quanh chip của mình để cạnh tranh với lợi thế đã được thiết lập của Nvidia.
Nhiều chip Trainium đang được sử dụng ngày nay thuộc quyền của Anthropic, bên trong các trung tâm dữ liệu ở Indiana, Mississippi và Pennsylvania. AWS cho biết đầu năm nay rằng họ đã kết nối hơn 500.000 chip lại với nhau để giúp startup AI đào tạo các mô hình mới nhất của mình và hướng đến việc dành 1 triệu chip cho Anthropic vào cuối năm. Việc Anthropic sử dụng số lượng lớn chip Trainium là một sự xác nhận quan trọng, nhưng cũng làm nổi bật sự phụ thuộc của Amazon vào một khách hàng lớn để chứng minh khả năng của chip.
Thách thức hệ sinh thái và chiến lược đa dạng hóa
Amazon đang đặt cược vào thành công của Anthropic, cùng với các dịch vụ AI của riêng mình, có thể thu hút các công ty khác. Amazon đã công bố rất ít khách hàng lớn khác cho chip, khiến các nhà phân tích gặp khó khăn trong việc đánh giá hiệu quả của Trainium. Anthropic cũng đang sử dụng Đơn vị Xử lý Tensor của Google và đã cắt một thỏa thuận đầu năm nay với đơn vị Alphabet mang lại cho startup quyền truy cập vào hàng chục tỷ đô la năng lượng điện toán. Thực tế này cho thấy ngay cả khách hàng lớn nhất của Trainium cũng không hoàn toàn cam kết với chip của Amazon, duy trì quan hệ với các nhà cung cấp chip khác.
Amazon đã thực hiện thông báo chip tại re:Invent, hội nghị người dùng hàng năm của mình, trong những năm gần đây đã trở thành một quảng cáo cuốn hút cho các dịch vụ AI nơi Amazon thu hút các nhà xây dựng công cụ tiên tiến và các công ty có thể muốn trả tiền để truy cập chúng. Hội nghị này đã trở thành một sự kiện quan trọng trong lịch ngành công nghệ, nơi Amazon giới thiệu tầm nhìn của mình cho tương lai đám mây và AI.
Hôm 2.12, Amazon cũng công bố các bản cập nhật cho dòng mô hình AI chính của mình, có tên là Nova. Các sản phẩm Nova 2 mới bao gồm một biến thể có tên Omni, có thể nhận đầu vào văn bản, hình ảnh, giọng nói hoặc video và phản hồi bằng cả văn bản hoặc hình ảnh. Khả năng đa phương thức này phản ánh xu hướng trong ngành AI hướng tới các mô hình có thể xử lý nhiều loại dữ liệu khác nhau, làm cho chúng linh hoạt hơn cho các ứng dụng trong thế giới thực.
Như với chip của mình, Amazon đã cố gắng bán cho khách hàng về hiệu suất của các mô hình của mình cho giá của chúng. Các mô hình Nova trước đó nói chung không được xếp hạng trong số các nhà lãnh đạo ngành trong các điểm chuẩn theo dõi cách các mô hình AI hoạt động trong việc trả lời các câu hỏi được chuẩn hóa. Rohit Prasad, người lãnh đạo phần lớn phát triển mô hình của Amazon và nhóm Trí tuệ Nhân tạo Tổng quát của công ty, nói trong một cuộc phỏng vấn: "Điểm chuẩn thực sự là thế giới thực," thêm rằng ông mong đợi các mô hình mới sẽ cạnh tranh.
Công ty cũng có kế hoạch cho phép khách hàng mang nhiều dữ liệu hơn khi tùy chỉnh các mô hình của Amazon. Nova Forge, một sản phẩm mới, được thiết kế để cho phép người dùng tinh vi lấy các phiên bản mô hình Nova của Amazon trước khi đào tạo của chúng hoàn tất và tùy chỉnh chúng với dữ liệu của riêng họ. Cách tiếp cận này khác biệt so với fine-tuning truyền thống và có thể mang lại các mô hình tùy chỉnh hiệu quả hơn cho các trường hợp sử dụng cụ thể.
Reddit đang sử dụng Nova Forge để xây dựng một mô hình có khả năng đánh giá liệu một bài đăng trên bảng tin kỹ thuật số có vi phạm chính sách an toàn của trang web hay không. Chris Slowe, giám đốc công nghệ của công ty, nói rằng một số khách hàng AI bị cám dỗ sử dụng mô hình tiên tiến nhất để giải quyết mọi vấn đề, thay vì tìm kiếm một mô hình có chuyên môn cụ thể. Ông nói trong một cuộc phỏng vấn: "Thực tế là chúng tôi có thể biến nó thành chuyên gia trong lĩnh vực cụ thể của chúng tôi là nơi giá trị đến từ”.
Chiến lược của Amazon với cả Trainium3 và Nova phản ánh một cách tiếp cận thực dụng: cung cấp hiệu suất tốt ở mức giá cạnh tranh hơn, đồng thời xây dựng hệ sinh thái linh hoạt cho phép tùy chỉnh sâu. Liệu chiến lược này có đủ để thách thức sự thống trị của Nvidia và thu hút đủ khách hàng để biến Trainium thành một dòng sản phẩm có lợi nhuận vẫn còn phải xem.
Bùi Tú