Quay video công việc nhà để huấn luyện cho robot 'quản gia'

Quay video công việc nhà để huấn luyện cho robot 'quản gia'
4 giờ trướcBài gốc
Robot làm việc nhà tại Hội nghị Robot Thế giới 2025. Ảnh: Công Tuyên - PV TTXVN tại Trung Quốc
Cơn khát dữ liệu cho robot hình người
Sự phát triển nhanh chóng của trí tuệ nhân tạo (AI) đã đưa robot hình người trở thành chiến tuyến mới trong cuộc đua công nghệ. Các nhà sản xuất liên tục giới thiệu những mẫu robot có thể đi lại, nhảy múa, thậm chí chiến đấu với độ linh hoạt ngày càng cao. Tuy nhiên, mục tiêu tối thượng của ngành là một robot đa năng có thể làm việc trong cửa hàng, văn phòng và gia đình, vẫn phụ thuộc vào một yếu tố cốt lõi: dữ liệu.
Không giống các hệ thống AI xử lý văn bản hay hình ảnh, robot cần dữ liệu thực tế để học cách tương tác an toàn với môi trường ngoài đời thực. Vì vậy, các công ty đang ngày càng dựa vào những video quay từ góc nhìn thứ nhất, ghi lại cảnh con người thực hiện các công việc thường nhật như nấu ăn, dọn dẹp, chăm sóc thú cưng. Loại dữ liệu này, còn gọi là “dữ liệu vị kỷ”, giúp robot hiểu được chuyển động, khoảng cách và cách xử lý đồ vật trong đời sống thực.
Theo CNN, nhu cầu đối với loại dữ liệu này đang tăng vọt, kéo theo sự xuất hiện của nhiều công ty khởi nghiệp chuyên thu thập và gắn nhãn video từ hàng nghìn lao động tự do trên toàn cầu.
Tại Micro1, một công ty có trụ sở ở Palo Alto (Mỹ), hàng nghìn cộng tác viên được cung cấp thiết bị quay gắn trên đầu cùng danh sách nhiệm vụ cụ thể. Họ được yêu cầu ghi hình ít nhất 10 giờ mỗi tuần, với nội dung xoay quanh các công việc gia đình. Tuy nhiên, công ty cũng khuyến khích người tham gia ghi lại bất cứ hoạt động nào mà họ muốn robot thực hiện trong tương lai.
Cần hàng tỷ giờ dữ liệu
Dù đã thu thập hơn 160.000 giờ video mỗi tháng từ khoảng 4.000 cộng tác viên tại 71 quốc gia, Micro1 cho rằng con số này vẫn còn quá nhỏ. Theo đại diện công ty, để robot đạt được khả năng hoạt động linh hoạt như con người, ngành này có thể cần tới hàng tỷ giờ dữ liệu.
Diễn biến này được cho là tương tự giai đoạn đầu của các mô hình ngôn ngữ lớn như ChatGPT, vốn được huấn luyện trên hàng trăm tỷ dữ liệu được thu thập trên Internet. Tuy nhiên, khác với AI văn bản hay hình ảnh, vốn có thể tận dụng kho dữ liệu khổng lồ sẵn có, robot lại cần dữ liệu đặc thù hơn nhiều, gắn với hành vi và tương tác vật lý.
Chính điều này đã tạo ra cơ hội kinh doanh trị giá hàng tỷ USD cho các công ty thu thập và gắn nhãn dữ liệu. Theo ước tính của các tổ chức nghiên cứu thị trường, ngành này có thể tăng trưởng khoảng 30% mỗi năm và đạt quy mô tối thiểu 10 tỷ USD vào năm 2030.
Tuy nhiên, không phải mọi video đều có giá trị. Một số doanh nghiệp cho biết chỉ sử dụng được khoảng một nửa số dữ liệu thu thập được. Bên cạnh đó, khác biệt giữa các môi trường sống, từ nhà bếp, dụng cụ cho đến thói quen sinh hoạt, cũng khiến việc chuẩn hóa dữ liệu trở nên phức tạp, buộc các công ty phải thu thập trên phạm vi toàn cầu.
Cuộc đua tìm phương pháp huấn luyện tối ưu
Trong nhiều thập kỷ, robot chủ yếu được huấn luyện thông qua điều khiển từ xa hoặc mô phỏng phần mềm. Tuy nhiên, cả hai phương pháp đều có hạn chế: phần cứng điều khiển tốn kém, còn mô phỏng lại thiếu độ chính xác khi tương tác với vật thể thực.
Việc sử dụng dữ liệu con người đang trở thành giải pháp trung gian hiệu quả về chi phí. Thay vì để robot học trực tiếp, các công ty chỉ cần trả tiền cho người quay video và thiết bị ghi hình.
Một số quốc gia như Trung Quốc đã đầu tư mạnh vào hạ tầng đào tạo robot, trong khi Nhật Bản, Hàn Quốc và các doanh nghiệp phương Tây cũng đang thử nghiệm nhiều mô hình khác nhau. Đáng chú ý, báo cáo gần đây của Nvidia cho thấy việc bổ sung hơn 20.000 giờ video góc nhìn thứ nhất có thể cải thiện tỷ lệ thành công của robot trong các nhiệm vụ như gấp áo, phân loại đồ vật hay mở nắp chai thêm hơn 50%.
Các chuyên gia nhận định, trong tương lai, ngành robot sẽ không phụ thuộc vào một phương pháp duy nhất mà kết hợp nhiều nguồn dữ liệu khác nhau để tối ưu hiệu quả.
“Chặng cuối” của tự động hóa
Bước ngoặt quan trọng của robot tự động đến từ sự phát triển của các mô hình AI có khả năng chuyển đổi tín hiệu hình ảnh thành hành động vật lý. Nhờ đó, robot không còn chỉ thực hiện các nhiệm vụ lặp lại mà có thể “hiểu” và phản ứng với môi trường xung quanh.
Tuy vậy, thách thức lớn nhất vẫn nằm ở môi trường gia đình, nơi mọi thứ luôn thay đổi và khó dự đoán. Robot hiện vẫn thiếu “trực giác” giống con người, đặc biệt trong việc đánh giá lực, ma sát và rủi ro.
Trong khi đó, các robot hiện tại chủ yếu hoạt động trong môi trường kiểm soát như nhà máy, với tỷ lệ hoàn thành nhiệm vụ lên tới 99,9%. Ngược lại, trong các công việc đơn giản như gấp quần áo, tỷ lệ thành công chỉ đạt khoảng 70 - 80%, chưa đủ để triển khai thương mại.
Yếu tố an toàn cũng là rào cản lớn. Các chuyên gia cảnh báo rằng nếu robot không thể phân biệt chính xác giữa đồ vật và con người, hậu quả có thể rất nghiêm trọng. Do đó, việc triển khai robot trong môi trường gia đình, đặc biệt với trẻ nhỏ, vẫn còn là câu chuyện của tương lai.
Dù vậy, những thử nghiệm ban đầu đã bắt đầu, không phải với con người, mà với thú cưng. Điều này cho thấy hành trình đưa robot giúp việc vào đời sống thực tế đang tiến gần hơn, nhưng vẫn còn một “chặng đường cuối” đầy thách thức trước khi giấc mơ trở thành hiện thực.
Bảo Hân/Báo Tin tức và Dân tộc
Nguồn Tin Tức TTXVN : https://baotintuc.vn/ai-va-cuoc-song/quay-video-cong-viec-nha-de-huan-luyen-cho-robot-quan-gia-20260405192237838.htm