Mark Zuckerberg chỉ đạo Meta chi 14,3 tỉ USD mua 49% Scale AI, mời Alexandr Wang về xây dựng siêu AI

Mark Zuckerberg chỉ đạo Meta chi 14,3 tỉ USD mua 49% Scale AI, mời Alexandr Wang về xây dựng siêu AI
một ngày trướcBài gốc
Đây là thỏa thuận bất thường cho thấy gã khổng lồ mạng xã hội đang đẩy nhanh bước tiến để bắt kịp cuộc đua AI.
Meta Platforms hôm 12.6 thông báo đã đầu tư vào Scale AI, nhưng không tiết lộ chi tiết. Theo một nguồn tin thân cận với thương vụ, quy mô đầu tư là 14,3 tỉ USD, trang Bloomberg News cho biết. Giá trị định giá mới của Scale AI là 29 tỉ USD, gồm cả khoản tiền huy động được, theo nguồn tin giấu tên vì thông tin này chưa được công bố chính thức.
Là một phần của khoản đầu tư, Alexandr Wang (Giám đốc điều hành kiêm đồng sáng lập Scale AI) sẽ đảm nhận vai trò mới tại Meta Platforms trong đội ngũ AI. Alexandr Wang sẽ gia nhập đơn vị “siêu trí tuệ” mới của Meta Platforms, tập trung vào việc phát triển AI có khả năng hoạt động ngang hay vượt trội con người, thường được gọi là AI tổng quát (AGI).
Alexandr Wang sẽ gia nhập đơn vị “siêu trí tuệ” của Meta Platforms - Ảnh: Bloomberg
“Meta đã hoàn tất quan hệ đối tác chiến lược và đầu tư vào Scale AI. Là một phần của việc này, chúng tôi mở rộng hợp tác về việc sản xuất dữ liệu cho các mô hình AI, và Alexandr Wang sẽ gia nhập Meta để làm việc trong nỗ lực phát triển siêu trí tuệ. Chúng tôi sẽ chia sẻ thêm thông tin về dự án này cũng như những nhân sự tài năng tham gia nhóm trong vài tuần tới”, một người phát ngôn của Meta Platforms nói.
Nguồn tin cũng cho biết Meta Platforms sẽ nắm giữ 49% cổ phần của Scale AI, nhưng chỉ mua cổ phần không có quyền biểu quyết.
Giám đốc điều hành Mark Zuckerberg đã xác định AI là trọng tâm hàng đầu tại Meta Platforms trong năm nay, dành hàng chục tỉ USD cho cơ sở hạ tầng và tuyển dụng liên quan đến AI. Tuy nhiên, ông ngày càng tỏ ra không hài lòng với tiến độ của Meta Platforms sau khi ra mắt mô hình ngôn ngữ lớn mới nhất Llama 4, vốn bị đánh giá là chưa đáp ứng kỳ vọng.
Trong những tháng kể từ khi ra mắt Llama 4 vào tháng 4, Mark Zuckerberg đã đích thân chỉ đạo nhiều hơn. Ông ưu tiên tuyển dụng các chuyên gia và nhà khoa học AI cho nhóm siêu trí tuệ mới, thậm chí mời các ứng viên đến nhà riêng tại gần Hồ Tahoe và thành phố Palo Alto (bang California, Mỹ) để phỏng vấn. Thậm chí, tỷ phú 40 tuổi đã sắp xếp lại văn phòng Meta Platforms để nhóm mới gần bàn làm việc của ông hơn, theo Bloomberg News.
Meta Platforms và Mark Zuckerberg cũng đưa ra các gói đãi ngộ hấp dẫn nhằm thu hút các nhà nghiên cứu hàng đầu từ Google (thuộc Alphabet) và công ty khởi nghiệp Sesame AI.
Sesame AI là công ty khởi nghiệp công nghệ tập trung vào việc phát triển AI đàm thoại với giọng nói giống con người một cách chân thực. Mục tiêu của họ là tạo ra các trợ lý AI có thể giao tiếp tự nhiên, biểu cảm và gần gũi như người thật.
Mark Zuckerberg ưu tiên tuyển dụng các chuyên gia và nhà khoa học AI cho nhóm siêu trí tuệ của Meta Platforms - Ảnh: Bloomberg
Áp dụng chiến lược tương tự Amazon, Microsoft và Google
Với thương vụ Scale AI, Mark Zuckerberg (hiếm khi đầu tư lớn vào các công ty khởi nghiệp) dường như đang áp dụng chiến lược tương tự Amazon, Microsoft và Google. Ba hãng công nghệ lớn này đều đã ký thỏa thuận với các công ty khởi nghiệp AI nổi bật và thu hút những nhân sự tài năng nhất từ họ - cách để tránh sự giám sát chặt chẽ từ cơ quan quản lý thường đi kèm với các vụ mua lại quy mô lớn. Gần đây, Meta Platforms đang phải đối mặt với vụ kiện độc quyền từ Ủy ban Thương mại Liên bang Mỹ (FTC) liên quan thương vụ mua lại Instagram và WhatsApp.
Không như các công ty khởi nghiệp AI khác, Scale AI không tập trung vào xây dựng các mô hình ngôn ngữ lớn. Được thành lập vào năm 2016, Scale AI cung cấp dịch vụ dữ liệu giúp các công ty, gồm cả Meta Platforms và OpenAI, huấn luyện và cải thiện hệ thống AI của họ. Scale AI cũng xây dựng các ứng dụng AI tùy chỉnh cho doanh nghiệp và chính phủ.
Thương vụ này có thể giúp Meta Platforms bắt kịp Google và OpenAI trong lĩnh vực phát triển AI, đồng thời tăng cường mối quan hệ với chính phủ Mỹ khi công ty ngày càng tham gia sâu vào công nghệ quốc phòng. Alexandr Wang (28 tuổi) là người có kỹ năng kết nối tốt, từng xây dựng quan hệ với các nhà làm luật Mỹ thông qua hoạt động vận động hành lang.
Scale AI đang có đà tăng trưởng mạnh, đạt doanh thu khoảng 870 triệu USD trong năm 2024 và kỳ vọng doanh thu năm nay đạt 2 tỉ USD, Bloomberg News đưa tin hồi tháng 4. Scale AI từng được định giá khoảng 14 tỉ USD trong vòng gọi vốn năm ngoái.
“Rõ ràng là Meta đang theo đuổi chiến lược này một cách quyết liệt vì không muốn bị tụt lại phía sau. Khoản đầu tư mạnh tay như vậy không chỉ cho thấy tầm quan trọng của nó với công ty, mà còn chỉ ra họ cần nó”, Shweta Khajuria, nhà phân tích tại Wolfe Research, nhận định trong một cuộc phỏng vấn.
Bà nói thêm rằng thỏa thuận này cho thấy Meta Platforms “không còn tự tin vào khả năng dẫn đầu của mình”.
“Các mô hình AI hiện thiếu 4 năng lực cốt lõi mà con người sở hữu”
Theo trang Insider, Yann LeCun (Giám đốc khoa học về AI của Meta Platforms) gần đây đã chia sẻ định nghĩa cơ bản của ông về trí thông minh với Anthony Annunziata – lãnh đạo AI của IBM.
“Có bốn đặc điểm thiết yếu của hành vi thông minh mà mọi loài động vật, hoặc những động vật tương đối thông minh, đều có thể làm được và tất nhiên con người cũng vậy. Hiểu biết về thế giới vật lý, có trí nhớ bền vững, khả năng suy luận và lập kế hoạch, đặc biệt là lập kế hoạch phức tạp và có tính phân cấp”, ông nói.
Yann LeCun cho rằng AI, đặc biệt là các mô hình ngôn ngữ lớn, vẫn chưa đạt đến ngưỡng này và việc tích hợp các năng lực đó sẽ đòi hỏi sự thay đổi trong cách huấn luyện chúng. Đó là lý do tại sao nhiều hãng công nghệ lớn đang cố gắng lắp ghép các khả năng mới vào các mô hình hiện có trong cuộc đua thống trị lĩnh vực AI, Yann LeCun nói.
“Để hiểu thế giới vật lý, bạn huấn luyện một hệ thống thị giác riêng biệt, sau đó gắn nó lên mô hình ngôn ngữ. Với trí nhớ, bạn dùng RAG, hoặc gắn thêm một hệ thống ghi nhớ liên kết, hay đơn giản là làm cho mô hình lớn hơn”, ông cho hay.
RAG (tạo sinh có tăng cường truy xuất) là một cách để cải thiện kết quả đầu ra của các mô hình ngôn ngữ lớn bằng cách sử dụng các nguồn kiến thức bên ngoài. Thay vì chỉ dựa vào thông tin đã được học trong quá trình đào tạo ban đầu (có thể bị lỗi thời hoặc thiếu chi tiết), kỹ thuật này kết hợp hai bước chính:
- Truy xuất: Khi nhận được câu hỏi từ người dùng, mô hình AI trước tiên sẽ tìm kiếm và truy xuất thông tin liên quan từ kho kiến thức bên ngoài, chẳng hạn cơ sở dữ liệu, tập hợp tài liệu, trang web…
- Tạo sinh: Mô hình AI sẽ sử dụng những thông tin vừa tìm thấy để tạo ra câu trả lời chính xác và có căn cứ hơn, thay vì chỉ dựa vào những gì đã học từ trước.
Phương pháp nêu trên được phát triển tại Meta Platforms.
Tuy nhiên, tất cả những thứ đó chỉ là “các mẹo vá víu tạm thời”, Yann LeCun tuyên bố.
Lãnh đạo AI tại Meta Platforms đã nhiều lần đề cập đến một phương án thay thế mà ông gọi là mô hình dựa trên thế giới thực. Đây là những mô hình được huấn luyện từ các tình huống đời thực và có mức độ nhận thức cao hơn so với AI dựa trên mô hình theo mẫu.
Trong cuộc trò chuyện với Anthony Annunziata, Yann LeCun đưa ra một định nghĩa khác: “Bạn có nhận thức hoặc thông tin về tình hình hiện tại của môi trường xung quanh vào một thời điểm nhất định. Mô hình thế giới có thể dự đoán cách thế giới sẽ tiến triển như thế nào do hậu quả của một hành động mà bạn thực hiện”.
Theo Yann LeCun, do thế giới quá phức tạp và khó lường, cách duy nhất để huấn luyện mô hình AI theo hướng đó là thông qua khái niệm trừu tượng, thay vì chỉ học từ dữ liệu cụ thể hoặc mô hình theo mẫu.
Meta Platforms đang thử nghiệm điều này thông qua V-JEPA, mô hình AI mà họ đã công bố rộng rãi vào tháng 2. Công ty mẹ Facebook mô tả đây là mô hình AI không tạo sinh, học bằng cách dự đoán các phần bị thiếu hoặc bị che khuất trong một video.
Yann LeCun nói rằng thay vì bắt mô hình AI phải học từng điểm ảnh một cách chính xác (rất khó và tốn kém), nên dạy nó hiểu bản chất và logic trừu tượng của video. Điều đó sẽ giúp mô hình AI dự đoán tốt hơn và bỏ qua những chi tiết không quan trọng hoặc ngẫu nhiên.
Khái niệm này tương tự như cách các nhà hóa học xây dựng một hệ thống phân cấp cơ bản cho các thành phần cấu tạo nên vật chất, ví dụ hạt nguyên tử phân tử vật chất.
“Chúng ta tạo ra các khái niệm trừu tượng. Hạt nguyên tử phân tử vật chất. Mỗi lần đi lên một tầng, chúng ta loại bỏ rất nhiều thông tin từ tầng dưới mà không còn liên quan đến nhiệm vụ đang thực hiện”, ông cho hay.
Tóm lại, đó là một cách khác để nói rằng chúng ta đã học cách hiểu thế giới vật lý bằng cách tạo ra các hệ thống phân cấp.
Yann LeCun được mệnh danh là “cha đẻ của AI” vì những đóng góp mang tính nền tảng trong lĩnh vực học sâu, đặc biệt là trong việc phát triển mạng nơ-ron tích chập (Convolutional Neural Networks - CNNs). Đây là một trong những công nghệ cốt lõi đứng sau nhiều tiến bộ AI hiện nay, từ nhận diện hình ảnh đến xử lý ngôn ngữ tự nhiên.
Học sâu là một nhánh của học máy, sử dụng mạng nơ-ron nhiều lớp để tự động học từ dữ liệu rất lớn và phức tạp. Học máy là một nhánh của AI, cho phép máy tính tự học từ dữ liệu và cải thiện hiệu suất theo thời gian mà không cần được lập trình rõ ràng từng bước.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/mark-zuckerberg-chi-dao-meta-chi-14-3-ti-usd-mua-49-scale-ai-moi-alexandr-wang-ve-xay-dung-sieu-ai-233676.html