Manus được cho là đã đạt đến "cảnh giới" của AGI (Artificial General Intelligence) - một dạng trí tuệ nhân tạo vượt trội, với khả năng hiểu biết, học hỏi, thực hiện các nhiệm vụ tương tự như con người.
AGI là dạng phát triển cao cấp hơn của AI tạo sinh. Trong khi AI tạo sinh chỉ biết tìm kiếm để trả lời các câu hỏi, hoặc thực hiện một số bài toán theo yêu cầu, thì AGI có khả năng suy nghĩ và thực hiện các tác vụ một cách độc lập, tương tự như con người.
Theo các bài test mà nhóm phát triển Manus thực hiện, thì trợ lý AI này đã đạt tới mức độ ban đầu của AGI. Điều cũng từng được người đồng phát triển Manus, Ji Yichao (Cát Nhất Siêu) khẳng định: "Chúng tôi coi đây là mô hình tiếp theo về sự kết hợp giữa con người và máy móc, và cho mọi người thấy một cái nhìn thoáng qua về AGI là như thế nào".
Khi được yêu cầu lập kế hoạch về một chuyến du lịch 7 ngày đến Nhật Bản với kinh phí từ 2.500 - 5.000 USD và tìm kiếm một địa điểm đặc biệt để thực hiện màn cầu hôn, chỉ trong chưa đầy 1 phút Manus đã có thể lên kế hoạch chi tiết cho từng ngày. Chẳng hạn như buổi sáng đi tham quan ở đâu, buổi chiều ở đâu và buổi tối ăn ở nhà hàng nào. Thậm chí nó còn có thể đưa ra khuyến cáo về phương tiện di chuyển cũng như loại thẻ thanh toán.
Manus lập kế hoạch cho chuyến đi du lịch Nhật Bản trong 7 ngày.
Một ví dụ khác, khi được cung cấp một file zip chứa hồ sơ ứng viên. Manus đã đọc qua các hồ sơ để trích xuất các kỹ năng liên quan đến yêu cầu tuyển dụng, đồng thời đối chiếu chúng với xu hướng thị trường việc làm và sau đó xếp hạng ứng viên, đưa ra gợi ý tuyển dụng theo cách tối ưu nhất.
Hoặc khi được yêu cầu tạo lịch phỏng vấn ứng viên với hai buổi phỏng vấn mỗi ngày. Số lượng ứng viên trong mỗi buổi phải được phân bổ đều nhất có thể và lịch trình phải phù hợp với thời gian khả dụng của mỗi ứng viên. Manus ngay lập tức đã phân tích file chứa hồ sơ ứng viên và sau đó đưa ra kết quả tối ưu nhất.
Manus phân tích file khảo sát ứng viên để đưa ra lịch trình phỏng vấn tối ưu
Thậm chí, khi đưa ra một câu hỏi tương đối mơ hồ như: "Tôi cần thuê một căn hộ ở San Francisco", Manus không chỉ liệt kê kết quả tìm kiếm mà còn bổ sung các thống kê về xu hướng cho thuê nhà, thời tiết địa phương và thậm chí cả các tội phạm trong khu vực.
Tóm lại, Manus có thể phân tích cổ phiếu, đánh giá sản phẩm thương mại điện tử, tái hiện các sự kiện lịch sử bằng bản đồ trực quan. Nó có thể tự động tìm kiếm thông tin, điền biểu mẫu, viết email, đưa ra các gợi ý, đề xuất hoặc các quyết định gần như bộ óc của con người.
Anh Nguyễn Lâm, một chuyên gia công nghệ đang làm việc tại công ty OTG Việt Nam đã thử dùng Manus để phân tích cổ phiếu VinFast. Manus đưa ra báo cáo phân tích toàn diện kèm với 3 báo cáo về từng khía cạnh để tham khảo. Anh Lâm nhận xét rằng báo cáo của Manus sâu hơn, có nhiều số liệu hơn so với báo cáo anh thực hiện trên ứng dụng Deep Research của OpenAI.
Anh Lâm cũng yêu cầu Manus dự báo cuộc gặp giữa Tổng thống Ukraine Zelensky với Tổng thống Hoa Kỳ Donald Trump và Phó tổng thống JD Vance. Manus đã đưa ra 3 kịch bản và cả 3 đều có kết thúc là ông Trump mời ông Zelensky khỏi Nhà Trắng - giống với sự việc đã xảy ra thực tế.
Vì sao Manus lại thông minh như vậy?
Sở dĩ Manus thông minh như vậy là nhờ kiến trúc đa tác nhân của nó. Thay vì dựa vào một mạng nơ ron duy nhất, Manus hoạt động như một giám đốc điều hành giám sát một đội các tác nhân phụ chuyên biệt.
Khi được giao một nhiệm vụ phức tạp, Manus chia vấn đề thành các thành phần có thể quản lý, giao chúng cho các tác nhân phù hợp và theo dõi tiến độ của chúng. Cấu trúc này cho phép Manus giải quyết các quy trình làm việc nhiều bước mà trước đây cần nhiều công cụ AI được tích hợp thủ công.
Manus không phải là một mô hình, mà là tập hợp các mô hình được xây dựng dựa trên mô hình Claude 3.5 Sonnet của Anthropic và các phiên bản tinh chỉnh của mô hình Qwen của Alibaba. Manus tích hợp với 29 công cụ và phần mềm nguồn mở, cho phép nó duyệt web, tương tác với API, chạy tập lệnh và thậm chí phát triển phần mềm độc lập.
Trong khi các trợ lý AI truyền thống cần sự tham gia tích cực của người dùng - hoạt động khi người dùng mở trình duyệt hoặc app, thì Manus hoạt động trong môi trường điện toán ảo trên đám mây, do đó, người dùng có thể tắt máy tính sau khi đặt ra yêu cầu cho Manus thực hiện, trong khi máy vẫn tiếp tục hoạt động ở chế độ nền và thông báo cho người dùng khi hoàn tất.
Đây là điều khiến Manus khác biệt so với các đối thủ cạnh tranh. Trong khi ChatGPT-4 và Gemini dựa vào lời nhắc của con người để hướng dẫn, Manus không chờ hướng dẫn. Thay vào đó, nó được thiết kế để tự khởi tạo các nhiệm vụ, đánh giá thông tin mới và điều chỉnh cách tiếp cận một cách năng động.
Thế giới sẽ về đâu sau sự xuất hiện của Manus?
Trong nhiều năm qua, người ta vẫn nghĩ rằng nước Mỹ với các công ty công nghệ lớn như OpenAI, Google, Meta sẽ thống trị lĩnh vực AI. Các công ty này sẽ đưa ra các phiên bản AI mạnh mẽ dựa trên mô hình ngôn ngữ lớn của họ. Tuy nhiên, sự xuất hiện của Manus đã phá vỡ điều này.
Manus, cùng với DeepSeek và nhiều trợ lý AI khác do Trung Quốc phát triển đã cho thấy quốc gia này có lợi thế tiên phong trong các lĩnh vực quan trọng. Trung Quốc có thể thay thế Mỹ kiểm soát tương lai của AI.
Một số chuyên gia trong ngành cho rằng Manus là đại diện cho sự công nghiệp hóa trí tuệ nhân tạo, và các công ty sẽ buộc phải thay thế lao động con người bằng AI, không phải vì sở thích mà vì sự cần thiết.
Kỷ nguyên của AGI đã bắt đầu và Trung Quốc đang dẫn đầu. Chúng ta cần phải suy nghĩ lại về tương lai của việc làm, về sự sáng tạo và cạnh tranh trong một thế giới mà trí thông minh không còn là tài sản độc nhất của con người nữa.
Đăng Khoa