Mô hình Cosmos 3 kết hợp khả năng suy luận thị giác và tạo hình đa phương thức trong một mô hình mở duy nhất. Ảnh: NVIDIA
Cosmos 3 là gì và tại sao quan trọng
Jensen Huang, nhà sáng lập kiêm Giám đốc điều hành NVIDIA, tuyên bố rằng "Vụ nổ lớn của trí tuệ vật lý đang đến rất gần, nhờ các đột phá trong lý luận đa phương thức, thị giác và mô hình thế giới." Cosmos 3 chính là hạt nhân của tuyên bố đó.
Mô hình này được xây dựng trên kiến trúc hỗn hợp transformer, kết hợp khả năng suy luận và tạo nội dung trong cùng một khung. NVIDIA xác nhận Cosmos 3 có thể hoạt động theo ba vai trò khác nhau tùy ngữ cảnh sử dụng, bao gồm mô hình ngôn ngữ thị giác, mô hình mô phỏng môi trường vật lý, hoặc nền tảng cho các mô hình hành động của robot.
Cosmos 3 có hai phiên bản chính. Cosmos 3 Super phục vụ các ứng dụng robot và xe tự lái đòi hỏi độ chính xác cao. Cosmos 3 Nano được tối ưu để suy luận nhanh hơn trong môi trường tài nguyên hạn chế. NVIDIA khẳng định mô hình này dẫn đầu nhiều bảng xếp hạng mô hình mở trong ba lĩnh vực gồm tạo sinh thế giới, chính sách hành động robot và nhận thức thị giác.
Từ phòng thí nghiệm đến nhà máy sản xuất
Với các nhà nghiên cứu robot, NVIDIA giới thiệu Isaac GR00T Reference Humanoid Robot, một thiết kế tham chiếu mã nguồn mở tích hợp robot hình người Unitree H2 Plus, bàn tay khéo léo Sharpa, bộ xử lý onboard Jetson Thor và toàn bộ phần mềm Isaac GR00T. Mục tiêu là thu hẹp khoảng cách giữa nghiên cứu thuần túy và triển khai thực tế bằng cách gói gọn phần cứng, mô phỏng, huấn luyện và vận hành vào một nền tảng duy nhất.
Nhiều tổ chức nghiên cứu lớn đã xác nhận sử dụng nền tảng này, trong đó có Ai2, Đại học Bách khoa ETH Zurich, Trung tâm Robot Stanford và UC San Diego. Sự tham gia của các đơn vị học thuật hàng đầu cho thấy Isaac GR00T không chỉ là sản phẩm thương mại mà còn là hạ tầng nghiên cứu được cộng đồng khoa học xem nghiêm túc.
NVIDIA đưa trí tuệ tính toán vào lòng nhà máy chip
Hợp tác giữa NVIDIA và TSMC mang tính chất khác biệt so với các thỏa thuận công nghệ thông thường. TSMC đang sử dụng thư viện CUDA-X và các mô hình tính toán của NVIDIA trực tiếp trong dây chuyền sản xuất chip, bao gồm quang khắc tính toán, mô phỏng transistor, kiểm soát quy trình, kiểm tra wafer và lập lịch vận hành xưởng fab.
TSMC cũng triển khai NVIDIA Metropolis và TAO Toolkit để cải thiện khả năng phát hiện lỗi ở cấp độ nanomet trên bề mặt wafer. Jensen Huang nhắc lại rằng hai công ty đã hợp tác gần ba thập kỷ, và lần này NVIDIA đưa năng lực tính toán tăng tốc trực tiếp vào bên trong nhà máy sản xuất để xử lý các bài toán thiết kế và chế tạo phức tạp nhất thế giới.
Xe tự lái nhận thêm bộ não 32 tỷ tham số
Trong lĩnh vực xe tự lái, NVIDIA ra mắt Alpamayo 2 Super, mô hình suy luận với 32 tỷ tham số được thiết kế để giúp xe taxi tự hành nhận thức, lập kế hoạch và phản ứng với các tình huống giao thông phức tạp. Con số 32 tỷ tham số đặt Alpamayo 2 Super vào nhóm mô hình hạng nặng, phản ánh mức độ phức tạp mà NVIDIA đánh giá cần thiết để xe tự lái xử lý đủ độ an toàn trong môi trường thực.
Tổng thể các công bố lần này phác thảo rõ chiến lược của NVIDIA: không bán từng sản phẩm rời rạc mà xây dựng một hệ sinh thái phủ toàn bộ vòng đời phát triển máy móc tự hành, từ tạo dữ liệu tổng hợp và mô phỏng cho đến triển khai thực địa. Đây là cuộc cạnh tranh về nền tảng, không đơn thuần là cuộc cạnh tranh về chip.
Ngọc Hà