Ý tưởng về robot có thể làm việc nhà, gồm giặt sấy quần áo đến rửa chén, lau sàn xuất hiện trong trí tưởng tượng của nhiều người từ lâu. Nhưng đến nay, chúng chủ yếu chỉ tồn tại trong các bộ phim khoa học viễn tưởng.
Tuy nhiên, Physical Intelligence, một công ty khởi nghiệp AI tại San Francisco, Mỹ lại cho rằng giấc mơ như vậy không xa vời. Họ vừa trình diễn một mô hình trí tuệ nhân tạo có thể học cách làm việc nhà thuần thục.
AI chẩn đoán ung thư nhưng không biết gấp áo
Trong vài năm qua, AI và ứng dụng của giải pháp công nghệ này đã phát triển nhanh chóng. Chúng tạo được ảnh, video như thật, dự đoán cấu trúc protein và chẩn đoán ung thư. Bất chấp những tiến bộ này, con người vẫn vượt trội AI trong thế giới thật. Điều này có thể được khái quát trong “Nghịch lý Moravec”, cho rằng thắng ván cờ vây hay tìm ra thuốc chữa bệnh là dễ dàng với trí tuệ nhân tạo, nhưng chúng lại không thể gấp được một chiếc áo sơ mi.
Đây là bài toán được Physical Intelligence tìm cách giải trong 8 tháng qua, từ khi công ty này được thành lập. Startup non trẻ này nhận được sự đầu tư từ các tên tuổi uy tín trong ngành gồm cả OpenAI. Mới nhất, giá trị công ty tăng mạnh lên 2 tỷ USD với khoản góp vốn từ Jeff Bezos.
Vấn đề doanh nghiệp non trẻ này đang tìm cách giải là một hệ thống AI có trí thông minh vật lý tương đương với con người.
Nền tảng thử nghiệm mới ra mắt có tên pi-zero. Cơ bản nó có sườn là một mô hình ngôn ngữ lớn (LLM), được bổ sung thêm dữ liệu rộng gồm hình ảnh, văn bản, hành động thực tế. Mô hình được huấn luyện trên thông tin tích lũy từ các loại cánh tay robot hoạt động trong nhà máy hiện đại.
Khác biệt của công nghệ mà Physical Intelligence đang phát triển là nó không phải lập trình thuần túy. Các loại robot hiện tại đều chỉ thực hiện hành động lặp lại liên tục khi được thiết lập sẵn. Giải pháp này không khả thi để ứng dụng trong một môi trường thực tế phức tạp, như tại nhà. AI được đưa vào để máy học và làm theo hướng dẫn. Đây là cách robot có thể giặt đồ, nấu cơm.
Cách AI làm việc nhà
pi-zero là một nền tảng trí thông minh vật lý được Physical Intelligence phát triển và đóng gói. Nó có kích thước 3 tỷ tham số (3B). Đây là mức tương đối nhỏ so với những LLM khác đang vận hành với tác vụ lập trình hay tạo văn bản. Nhờ vậy, pi-zero có thể được chạy tại biên với những máy tính có card đồ họa cơ bản thay vì dựa vào đám mây hay hệ thống cồng kềnh.
Hệ thống được thiết kế để ứng dụng lên nhiều loại mô hình cánh tay robot, không phân biệt hình dạng hay công năng ban đầu. Theo Remi Cademi, trưởng nhóm chế tạo robot của Hugging Face, cựu thành viên nhóm Tesla Optimus, nếu pi-zero được mở mã nguồn, ai cũng có thể cài nó lên robot để làm việc nhà.
Cánh tay robot được điều khiển bằng AI có thể gấp quần áo, dọn bàn, phân loại rác. Ảnh: Physical Intelligence.
Hiện tại, Physical Intelligence cung cấp 7 tùy chọn robot có thể được điều khiển bằng pi-zero. Trong đó, có cả những nhóm tác vụ phức tạp (cho robot) như gấp quần áo, dọn bàn ăn hay xếp trứng vào hộp. Đây là công việc khó vì có liên quan đến vật lý tiếp xúc, như tính toán biến dạng quần áo, độ cứng hộp carton hay dùng lực bao nhiêu để không vỡ quả trứng.
Ví dụ với robot gấp quần áo. Sau khi được giao việc, nó tự động đến trước máy giặt sấy, mở cửa sập rồi lấy đồ khô ra khỏi. Tiếp đến, thiết bị mang giỏ đến bàn, lấy quần áo trải ra và gấp gọn.
Tuy nhiên, giải pháp vẫn ở giai đoạn thử nghiệm ban đầu sau 8 tháng phát triển. Với nhóm tác vụ phức tạp như xếp trứng hay gấp hộp, tỉ lệ thành công hiện ở mức trên 50%. Ngoài ra, độ trễ xử lý cũng là vấn đề cần cải thiện khi cánh tay làm việc còn chậm chạp so với sức người.