Ruoming Pang, kỹ sư xuất sắc và quản lý phụ trách nhóm mô hình nền tảng của Apple, sẽ rời công ty, theo các nguồn tin thân cận với Bloomberg.
Từng gia nhập Apple từ Alphabet (công ty mẹ Google) vào năm 2021, Ruoming Pang là cái tên mới nhất được chiêu mộ vào đội ngũ siêu trí tuệ mới của Meta Platforms, theo các nguồn tin giấu tên vì vấn đề nhân sự chưa được công bố chính thức.
Để lôi kéo Ruoming Pang, Meta Platforms đã đưa ra gói đãi ngộ trị giá hàng chục triệu USD mỗi năm, các nguồn tin cho biết.
Ruoming Pang rời Apple gia nhập đội ngũ siêu trí tuệ của Meta Platforms - Ảnh: Internet
Mark Zuckerberg, Giám đốc điều hành Meta Platforms, đang thực hiện một chiến dịch tuyển dụng quy mô lớn, đưa về các lãnh đạo AI đình đám như Alexandr Wang (đồng sáng lập công ty khởi nghiệp Scale AI), Daniel Gross (đồng sáng lập công ty khởi nghiệp Safe Superintelligence) và Nat Friedman (cựu giám đốc điều hành GitHub) với mức đãi ngộ cao ngất ngưởng.
Hôm 7.7, Meta Platforms cũng đã tuyển dụng nhà nghiên cứu Yuanzhi Li từ OpenAI và Anton Bakhtin - chuyên gia từng làm việc với mô hình Claude tại Anthropic, theo những người am hiểu sự việc.
Tháng trước, Meta Platforms chiêu mộ một số nhà nghiên cứu AI kỳ cựu từ đối thủ OpenAI, Google và Anthropic cho bộ phận Superintelligence Labs do Alexandr Wang và Nat Friedman dẫn dắt. Đây là nỗ lực tái tổ chức toàn diện các sáng kiến AI của công ty mẹ Facebook và xây dựng "siêu trí tuệ cá nhân cho mọi người" - công nghệ AI có thể thực hiện các nhiệm vụ tốt ngang hoặc vượt con người.
10 chuyên gia AI gia nhập Meta Platforms cuối tháng 6 gồm:
Trapit Bansal tiên phong về học tăng cường trên chuỗi tư duy, đồng sáng tạo dòng mô hình o tại OpenAI.
Học tăng cường là phương pháp học máy, trong đó một tác nhân học cách đưa ra quyết định bằng cách tương tác với môi trường và nhận phản hồi dưới dạng phần thưởng hoặc hình phạt. Mục tiêu của học tăng cường là giúp tác nhân tối đa hóa phần thưởng dài hạn thông qua các hành động mà nó thực hiện trong môi trường.
Chuỗi tư duy là kỹ thuật yêu cầu các mô hình AI suy luận giải quyết vấn đề từng bước một, đồng thời hiển thị các bước trung gian để đưa ra câu trả lời.
Bi Shuchao đồng sáng tạo chế độ giọng nói của GPT-4o và o4-mini, trước đây dẫn dắt huấn luyện đa phương thức hậu kỳ tại OpenAI. Huấn luyện đa phương thức hậu kỳ là bước tinh chỉnh mô hình AI sau khi đã được huấn luyện ban đầu, với mục tiêu giúp nó hiểu và xử lý đồng thời nhiều dạng dữ liệu khác nhau như văn bản, hình ảnh, âm thanh, video…
Chang Huiwen đồng sáng tạo khả năng tạo ảnh của GPT-4o, từng sáng tạo kiến trúc MaskGIT (tạo ảnh tiên tiến - PV) và Muse (tạo ảnh từ văn bản - PV) tại Google Research.
Lin Ji tham gia xây dựng mô hình o3/o4-mini, GPT-4o, GPT-4.1, GPT-4.5, o4-imagegen (thành phần phụ trách tạo ra hình ảnh trong kiến trúc mô hình o4 - PV) và nền tảng suy luận Operator.
Joel Pobartừng phụ trách suy luận tại Anthropic, trước đây làm ở Meta 11 năm về HHVM (máy ảo được Meta phát triển để chạy mã PHP hiệu quả hơn – PV), Hack (ngôn ngữ lập trình được Meta phát triển dựa trên PHP, có hỗ trợ hệ thống kiểu tĩnh – PV), Flow (công cụ kiểm tra kiểu tĩnh cho JavaScript – PV), React (thư viện JavaScript mã nguồn mở do Meta phát triển để xây dựng giao diện người dùng, đặc biệt là các ứng dụng web tương tác cao – PV), công cụ hiệu suất và học máy.
Ren Hongyu đồng sáng tạo GPT-4o, 4o-mini, o1-mini, o3-mini, o3 và o4-mini, trước đây lãnh đạo nhóm huấn luyện hậu kỳ tại OpenAI.
Johan Schalkwyk là cựu Google Fellow (một trong những cấp bậc kỹ thuật cao nhất tại Google – PV), đóng góp sớm cho Sesame (công nghệ liên quan nhận dạng hoặc tổng hợp giọng nói tại Google - PV) và lãnh đạo kỹ thuật dự án Maya (sử dụng Gemini API để thể hiện khả năng tích hợp ngữ cảnh hội thoại, xử lý hình ảnh và âm thanh một cách toàn diện – PV).
Sun Pei từng phụ trách huấn luyện hậu kỳ, lập trình và suy luận cho Gemini tại Google DeepMind, trước đó xây dựng hai thế hệ mô hình cảm biến của Waymo (công ty con của Alphabet chuyên phát triển công nghệ xe tự lái - PV).
Yu Jiahui đồng sáng tạo o3, o4-mini, GPT-4.1 và GPT-4o, từng là trưởng nhóm Nhận thức tại OpenAI và đồng lãnh đạo mảng đa phương thức cho dự án Gemini tại Google DeepMind.
Zhao Shengjia đồng sáng tạo ChatGPT, GPT-4, tất cả mô hình mini, GPT-4.1 và o3, từng dẫn đầu mảng dữ liệu tổng hợp tại OpenAI.
Trong số này có 7 chuyên gia AI đến từ Trung Quốc, từng tốt nghiệp các trường đại học danh tiếng ở nước này (Đại học Thanh Hoa, Đại học Bắc Kinh, Đại học Chiết Giang, Đại học Khoa học và Công nghệ Trung Quốc), sau đó tiếp tục theo đuổi các chương trình học và sự nghiệp tại Mỹ. Cụ thể là Bi Shuchao, Chang Huiwen, Lin Ji, Ren Hongyu, Sun Pei, Yu Jiahui và Zhao Shengjia.
Nat Friedman và Alexandr Wang (phải) dẫn dắt bộ phận Meta Superintelligence Labs - Ảnh: Internet
Tại Meta Platforms, Mark Zuckerberg đã đặt AI là ưu tiên hàng đầu khi công ty chạy đua để bắt kịp các đối thủ như OpenAI và Google. Tỷ phú 40 tuổi người Mỹ trực tiếp tham gia vào quá trình tuyển dụng cho bộ phận siêu trí tuệ, tiếp đón ứng viên tại nhà riêng ở Thung lũng Silicon và gần hồ Tahoe, thường đích thân liên hệ để chiêu mộ nhân tài.
Cuối tháng 6, Mark Zuckerberg đã tái cấu trúc các nhóm AI trong công ty để tập trung tốt hơn vào siêu trí tuệ cá nhân. Meta Platforms công bố sẽ chi hàng chục tỉ USD trong năm nay cho các nỗ lực liên quan đến AI, phần lớn dành cho hạ tầng như trung tâm dữ liệu và chip.
Meta Platforms từ chối bình luận. Apple, Ruoming Pang, OpenAI và Anthropic cũng không phản hồi câu hỏi của hãng tin Bloomberg.
Ruoming Pang từng dẫn dắt nhóm 100 người tại Apple
Tại Apple, Ruoming Pang dẫn dắt một nhóm khoảng 100 người, chịu trách nhiệm về các mô hình ngôn ngữ lớn của công ty – nền tảng cho Apple Intelligence và các tính năng AI khác trên thiết bị của hãng. Tháng 6 vừa qua, Apple tuyên bố sẽ lần đầu tiên mở các mô hình này cho các nhà phát triển bên thứ ba, giúp tạo ra loạt ứng dụng iPhone và iPad mới.
Tuy nhiên bên trong Apple, đội ngũ mô hình nền tảng (còn gọi là AFM) đang bị lãnh đạo mới giám sát kỹ khi họ cân nhắc sử dụng mô hình bên thứ ba, chẳng hạn từ OpenAI hoặc Anthropic, để hỗ trợ cho phiên bản mới của Siri. Những cuộc thảo luận nội bộ này đã khiến tinh thần đội ngũ AFM bị ảnh hưởng vài tuần gần đây.
Dù đang cân nhắc chuyển sang giải pháp bên ngoài để vận hành AI cho Siri mới, Apple vẫn đồng thời phát triển phiên bản Siri mới dựa trên mô hình do nhóm của Ruoming Pang xây dựng. Các mô hình AI này từng hỗ trợ các tính năng Apple Intelligence chạy trên iPhone, iPad, máy Mac như tóm tắt email và bài viết, Genmoji, thông báo ưu tiên...
Việc Ruoming Pang đến Meta Platforms là sự mất mát đáng kể nhất trong hàng ngũ AI của Apple kể từ khi công ty bắt đầu phát triển Apple Intelligence vài năm trước, cho thấy mức độ cạnh tranh ngày càng gay gắt để giành nhân tài ở lĩnh vực đang phát triển này. Meta Platforms đang đưa ra các mức đãi ngộ trị giá hàng triệu USD mỗi năm cho những nhà nghiên cứu AI hàng đầu thế giới, cao hơn đáng kể so với những gì Apple trả cho các kỹ sư làm công việc tương tự.
Sự khởi đầu cho một làn sóng nhân sự rời khỏi AFM
Sự ra đi của Ruoming Pang có thể chỉ là khởi đầu cho làn sóng nhân sự rời khỏi AFM, khi một số kỹ sư trong nhóm nói với đồng nghiệp rằng họ có kế hoạch rời đi trong thời gian tới để gia nhập Meta Platforms hoặc nơi khác, các nguồn tin tiết lộ với Bloomberg. Tom Gunter, cấp phó hàng đầu của Ruoming Pang, đã rời Apple vào tháng trước, theo Bloomberg.
Nhóm mô hình nền tảng hiện báo cáo cho Daphne Luong, một trong các phó giám đốc cấp cao dưới quyền John Giannandrea (Phó chủ tịch cấp cao phụ trách AI tại Apple). Trước đó, John Giannandrea đã bị gạt sang một bên trong nội bộ và mất quyền kiểm soát Siri, robot, framework như Core ML, App Intents cùng các nhóm liên quan đến sản phẩm tiêu dùng. Điều này xảy ra sau khi John Giannandrea phản ứng yếu kém với Apple Intelligence và việc Siri mới liên tục bị trì hoãn, gồm cả khả năng truy cập dữ liệu người dùng để thực hiện lệnh.
Framework (khung phát triển) là bộ công cụ phần mềm được thiết kế sẵn để hỗ trợ các lập trình viên xây dựng, triển khai ứng dụng dễ dàng, nhanh chóng và hiệu quả hơn.
Sau khi Ruoming Pang rời đi, AFM sẽ do Zhifeng Chen điều hành. Khác với cấu trúc dưới thời Ruoming Pang - nơi hầu hết kỹ sư báo cáo trực tiếp cho ông, giờ đây sẽ có một cơ cấu tổ chức mới với nhiều quản lý trung gian báo cáo đến Zhifeng Chen. Các kỹ sư này sẽ báo cáo với những quản lý trung gian đó. Một số người thân cận với AFM cho biết các ứng viên tiềm năng cho vị trí quản lý gồm Chong Wang, Zirui Wang, Chung-Cheng Chiu và Guoli Yin.
Chiến lược AI tổng thể của Apple hiện được điều hành chính bởi Craig Federighi (Giám đốc phần mềm của Apple) và Mike Rockwell (người từng dẫn dắt phát triển kính thực tế hỗn hợp Apple Vision Pro, nay phụ trách kỹ thuật cho Siri).
Về phần mình, John Giannandrea phản vẫn dẫn đầu bộ phận nghiên cứu AI của Apple. Tại hội nghị các nhà phát triển toàn cầu (WWDC) vào tháng 6, các tính năng AI của Apple chỉ xuất hiện ở mức khiêm tốn, như dịch cuộc gọi và tin nhắn văn bản. Một số tính năng AI khác, chẳng hạn phân tích ảnh chụp màn hình và cải thiện tạo ảnh, đến từ các đối tác bên ngoài như OpenAI và Google.
Apple đã giới thiệu phiên bản Xcode mới có khả năng tự hoàn thành mã nhờ tích hợp với Claude và ChatGPT.
Sơn Vân