Sản phẩm đầu tiên của cựu nữ tướng OpenAI là bước tiến mới về AI

15 giờ trướcBài gốc

Thinking Machines Lab vừa giới thiệu sản phẩm đầu tiên của mình có tên Tinker, giúp tự động hóa quá trình tạo ra các mô hình AI tiên tiến tùy chỉnh.

"Chúng tôi tin rằng Tinker sẽ giúp các nhà nghiên cứu và nhà phát triển thử nghiệm mô hình, giúp mọi người dễ dàng tiếp cận hơn các khả năng AI tiên tiến", Mira Murati, đồng sáng lập kiêm Giám đốc điều hành Thinking Machines, cho biết trong một cuộc phỏng vấn với tạp chí Wired.

Các công ty lớn và phòng thí nghiệm học thuật đã tinh chỉnh mô hình AI mã nguồn mở để tạo ra những biến thể mới được tối ưu hóa cho từng nhiệm vụ cụ thể, chẳng hạn giải toán, soạn thảo thỏa thuận pháp lý hoặc trả lời câu hỏi y tế.

Thông thường, công việc này liên quan đến việc mua và quản lý các cụm GPU (bộ xử lý đồ họa), sử dụng nhiều phần mềm khác nhau để đảm bảo các đợt huấn luyện quy mô lớn diễn ra ổn định và hiệu quả. Tinker hứa hẹn sẽ giúp nhiều doanh nghiệp, nhà nghiên cứu và thậm chí cả những người đam mê AI tinh chỉnh các mô hình riêng bằng cách tự động hóa phần lớn quy trình này.

Về cơ bản, Thinking Machines Lab đang đặt cược rằng việc giúp mọi người tinh chỉnh các mô hình tiên tiến sẽ là bước tiến lớn tiếp theo trong lĩnh vực AI và có lý do để tin họ có thể đúng.

Thinking Machines Lab được điều hành bởi các nhà nghiên cứu từng đóng vai trò cốt lõi trong việc tạo ra ChatGPT. Tinker mạnh mẽ và thân thiện với người dùng hơn so với các công cụ tương tự trên thị trường, những người dùng bản beta tiết lộ với Wired.

Mira Murati cho biết mục tiêu của Thinking Machines Lab là làm sáng tỏ công việc phức tạp đằng sau việc tinh chỉnh các mô hình mạnh nhất thế giới, giúp nhiều người hơn có thể khám phá những giới hạn bên ngoài của AI.

"Chúng tôi đang làm cho những gì vốn là khả năng tiên tiến trở nên dễ tiếp cận với mọi người và điều đó thực sự là cuộc cách mạng. Có rất nhiều người thông minh ngoài kia và chúng ta cần càng nhiều nhân tài càng tốt để thực hiện nghiên cứu AI tiên tiến", Mira Murati nói.

Tinker của Mira Murati giúp tự động hóa quá trình tạo ra các mô hình AI tiên tiến tùy chỉnh - Ảnh: Getty Images

Hiện tại, Tinker cho phép người dùng tinh chỉnh hai dòng mô hình AI mã nguồn mở: Llama của Meta Platforms và Qwen của Alibaba. Người dùng chỉ cần viết vài dòng mã để truy cập vào API (giao diện lập trình ứng dụng) của Tinker và bắt đầu tinh chỉnh bằng phương pháp học có giám sát (điều chỉnh mô hình AI bằng dữ liệu được gán nhãn) hoặc học tăng cường (phương pháp ngày càng phổ biến giúp cải thiện mô hình thông qua phản hồi tích cực hoặc tiêu cực dựa trên kết quả đầu ra). Sau khi hoàn tất, người dùng có thể tải xuống mô hình AI đã tinh chỉnh và triển khai ở bất kỳ đâu.

Ngành công nghiệp AI đang theo dõi sát sao màn ra mắt Tinker, một phần là do trình độ của đội ngũ đằng sau nó.

Thinking Machines Lab của cựu nữ tướng OpenAI gây chú ý ngay cả khi chưa có sản phẩm

Mira Murati trước đây là Giám đốc công nghệ OpenAI. Bà từng giữ chức vụ Giám đốc điều hành OpenAI trong một thời gian ngắn khi hội đồng quản trị sa thải Sam Altman vào tháng 11.2023 nhưng phục chức cho ông chỉ vài ngày sau đó. Đến tháng 9.2024, Mira Murati tuyên bố rời OpenAI.

Không lâu sau, Mira Murati đồng sáng lập Thinking Machines Lab cùng một số cựu chuyên gia OpenAI, gồm John Schulman (đồng sáng lập); Barret Zoph (cựu phó chủ tịch nghiên cứu); Lilian Weng (nghiên cứu an toàn và robot); Andrew Tulloch (phụ trách tiền huấn luyện và khả năng suy luận của mô hình AI); Luke Metz (chuyên gia huấn luyện mô hình).

Thinking Machines Lab đã thu hút rất nhiều sự chú ý ngay cả khi chưa công bố bất kỳ sản phẩm nào. Vào tháng 7, Thinking Machines Lab tiết lộ đã huy động được 2 tỉ USD trong vòng gọi vốn hạt giống, đưa công ty khởi nghiệp này lên mức định giá đáng kinh ngạc là 12 tỉ USD.

Khi còn ở OpenAI, John Schulman từng dẫn đầu việc tinh chỉnh mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT bằng phương pháp học tăng cường. Theo ông, phản hồi của người kiểm tra đóng vai trò như tín hiệu thưởng, giúp mô hình AI duy trì các cuộc trò chuyện mạch lạc, trả lời chính xác hơn không bị lạc hướng và giảm thiểu hành vi sai lệch.

John Schulman tuyên bố Tinker sẽ giúp nhiều người dễ dàng khám phá khả năng mới của các mô hình ngôn ngữ lớn thông qua học tăng cường và những kỹ thuật huấn luyện khác.

"Có rất nhiều điều kỳ diệu bí mật, nhưng chúng tôi trao cho mọi người toàn quyền kiểm soát vòng lặp huấn luyện. Chúng tôi che giấu phần phức tạp của huấn luyện phân tán, nhưng vẫn trao cho người dùng toàn quyền kiểm soát dữ liệu và các thuật toán", John Schulman nói với Wired.

John Schulman từng dẫn đầu việc tinh chỉnh mô hình ngôn ngữ lớn làm nền tảng cho ChatGPT - Ảnh: Internet

Thinking Machines Lab sẽ bắt đầu nhận đơn đăng ký sử dụng Tinker từ ngày 8.10 tới. Hiện công ty chưa thu phí API, nhưng dự kiến sẽ làm vậy trong tương lai.

Các chuyên gia đánh giá cao Tinker

API Tinker đã được cung cấp cho một số người dùng thử, gồm cả Eric Gan, nhà nghiên cứu tại Redwood Research - tổ chức nghiên cứu phi lợi nhuận tập trung vào việc nghiên cứu an toàn và rủi ro của AI tiên tiến. Eric Gan cho biết đang sử dụng tính năng học tăng cường của Tinker để tinh chỉnh mô hình AI nhằm phát hiện cửa hậu trong mã máy tính.

Eric Gan nói Tinker giúp ông có thể khai thác các khả năng từ một mô hình AI mà việc sử dụng API thông thường không thể làm được. Ông đánh giá việc điều chỉnh các tham số trong quá trình tinh chỉnh mô hình AI trên Tinker tương đối dễ dàng

“Tinker chắc chắn mang đến cách đơn giản hơn rất nhiều so với việc thực hiện học tăng cường từ đầu. Học tăng cường đặc biệt tốt nếu bạn có một tác vụ rất chuyên biệt mà các mô hình hiện tại chưa làm được”, Eric Gan nhận xét.

Một người khác thử nghiệm Tinker là Robert Nishihara, Giám đốc điều hành Anyscale - hãng cung cấp công nghệ quản lý các dự án AI quy mô lớn.

Robert Nishihara nói rằng trong khi các công cụ tinh chỉnh khác như VERL và SkyRL đã tồn tại, Tinker mang lại sự kết hợp độc đáo giữa tính trừu tượng và khả năng tùy chỉnh mô hình AI sâu. “Tôi nghĩ đây là API tuyệt vời và sẽ có rất nhiều người muốn dùng nó”, ông nói.

Đảo ngược xu hướng thương mại hóa mô hình AI ngày càng khép kín

Nỗi lo ngại dai dẳng xung quanh các mô hình AI mã nguồn mở là chúng có thể bị tải xuống và sửa đổi theo những cách bất chính. Thinking Machines Lab đang kiểm tra kỹ những người được cấp quyền truy cập API của mình và John Schulman nói công ty cuối cùng sẽ giới thiệu các hệ thống tự động để ngăn chặn việc sử dụng sai mục đích.

Tinker là sản phẩm đầu tiên của Thinking Machines Lab, nhưng công ty đã công bố các nghiên cứu cơ bản về huấn luyện mô hình, gồm cả những tiến bộ trong việc duy trì hiệu suất của mạng nơ-ron và tinh chỉnh mô hình ngôn ngữ lớn hiệu quả hơn.

Mạng nơ-ron là mô hình tính toán trong lĩnh vực AI, được lấy cảm hứng từ cách bộ não con người hoạt động.

Kế hoạch mở rộng quy trình tinh chỉnh các mô hình ngôn ngữ lớn của Thinking Machines Lab cũng cho thấy cam kết về tính cởi mở, vào thời điểm hầu hết công ty AI tại Mỹ giữ các mô hình tốt nhất ở trạng thái đóng và chỉ có thể truy cập thông qua API. Trung Quốc hiện có nhiều mô hình AI tiên tiến nguồn mở hơn Mỹ, đang được nhiều công ty và nhà nghiên cứu trên khắp thế giới sử dụng.

Mira Murati hy vọng Tinker sẽ góp phần đảo ngược xu hướng thương mại hóa mô hình AI ngày càng khép kín.

“Nếu nhìn vào những gì đang được làm trong các phòng thí nghiệm tiên phong và những gì người thông minh trong giới học thuật theo đuổi, bạn sẽ thấy hai bên ngày càng tách biệt. Điều đó thật không tốt nếu bạn nghĩ về cách mà những hệ thống mạnh mẽ đang được đưa vào thế giới”, cô nói.

Mira Murati: Từ phát triển ô tô điện Tesla đến ChatGPT và từ chối Meta

Giữa những biến động không ngừng của thế giới công nghệ, Mira Murati đang nổi lên như một trong những gương mặt định hình tương lai của AI. Bà từng góp phần quan trọng đưa những sản phẩm như ChatGPT hay DALL-E trở thành biểu tượng toàn cầu. Sau khi rời OpenAI, Mira Murati tiếp tục gây chú ý khi sáng lập Thinking Machines Lab, công ty khởi nghiệp được kỳ vọng mở ra thế hệ AI mới linh hoạt và cởi mở hơn.

Sinh năm 1988 tại Albania, Mira Murati sớm bộc lộ năng khiếu khoa học và tinh thần khám phá. Năm 16 tuổi, bà giành học bổng toàn phần đến Canada theo học tại Pearson United World College, trước khi theo đuổi chương trình kép tại Mỹ, kết hợp giữa Toán học ở trường đại học Colby College và Kỹ thuật Cơ khí tại Dartmouth College. Con đường học vấn này giúp Mira Murati vừa có nền tảng kỹ thuật vững chắc, vừa mang tư duy phân tích sâu sắc - hai yếu tố sau này trở thành chìa khóa trong sự nghiệp công nghệ của bà.

Pearson United World College là trường trung học quốc tế nội trú nằm tại tỉnh British Columbia, Canada, thuộc hệ thống United World Colleges (UWC) - mạng lưới các trường danh tiếng toàn cầu được thành lập với mục tiêu thúc đẩy hòa bình, hiểu biết quốc tế và giáo dục khai phóng thông qua sự đa dạng văn hóa.

Bắt đầu sự nghiệp tại Tesla năm 2013, Mira Murati tham gia phát triển mẫu ô tô điện Model X, một trong những dự án táo bạo nhất của Elon Musk thời điểm đó. Kinh nghiệm tại Tesla giúp bà hiểu rõ sức mạnh của đổi mới kỹ thuật và quy trình sản xuất quy mô lớn. Từ năm 2016 đến 2018, bà chuyển sang làm việc cho Leap Motion, hãng chuyên về công nghệ thực tế ảo và tương tác bằng tay, nơi bà lãnh đạo nhóm phát triển sản phẩm và trí tuệ máy tính.

Mira Murati từng làm việc dưới quyền cả Elon Musk và Sam Altman - Ảnh: Getty Images

Năm 2018, Mira Murati gia nhập OpenAI khi công ty này vẫn còn là một phòng thí nghiệm nghiên cứu nhỏ bé với tầm nhìn nhân văn: Phát triển AI vì lợi ích chung của nhân loại. Chỉ sau vài năm, Mira Murati trở thành Giám đốc công nghệ OpenAI, phụ trách giám sát toàn bộ quá trình nghiên cứu và kỹ thuật của các dự án trọng điểm. Dưới sự lãnh đạo của bà, OpenAI trình làng ChatGPT - chatbot AI đã định hình lại cách con người tương tác với máy móc.

Khi OpenAI rơi vào khủng hoảng nội bộ vào cuối năm 2023, hội đồng quản trị tạm thời cách chức Sam Altman và bổ nhiệm Mira Murati làm CEO tạm thời. Dù chỉ đảm nhiệm vai trò này trong vài ngày, bà được xem là “người giữ nhịp” giúp OpenAI vượt qua cơn bão chính trị và duy trì hoạt động ổn định. Sau gần 6 năm làm việc tại OpenAI, Mira Murati tuyên bố rời đi với lý do muốn “tạo không gian cho những khám phá mới”.

Theo Wired, Meta Platforms từng mời gọi Mira Murati và một số thành viên Thinking Machines Lab bằng gói thù lao hàng trăm triệu USD để gia nhập đơn vị trí siêu trí tuệ của công ty. Tuy nhiên, họ đã từ chối.

Sơn Vân

Nguồn Một Thế Giới : https://1thegioi.vn/san-pham-dau-tien-cua-cuu-nu-tuong-openai-la-buoc-tien-moi-ve-ai-238437.html