Là nhân vật có ảnh hưởng lớn làn sóng vibe coding (lập trình theo cảm hứng), Andrej Karpathy vừa xuất hiện trên podcast Dwarkesh Patel để bàn về mức độ tiến bộ trong việc phát triển các tác tử AI (trí tuệ nhân tạo).
Tác tử AI là hệ thống AI được thiết kế để tự động quan sát, suy luận và thực hiện hành động nhằm đạt mục tiêu đã định. Khác với một ứng dụng AI tĩnh chỉ trả lời khi có lệnh, tác tử AI có khả năng nhận dữ liệu hoặc tín hiệu từ môi trường, phân tích và lên kế hoạch dựa trên kiến thức hoặc thuật toán có sẵn, chủ động thực hiện các bước tiếp theo, thậm chí phối hợp với con người hoặc các tác tử khác để hoàn thành nhiệm vụ. Ví dụ, một tác tử AI có thể liên tục quét email, tự động soạn và gửi phản hồi phù hợp. Trong phần mềm, tác tử AI có thể tự lập kế hoạch sửa lỗi và tối ưu mã nguồn mà không đợi từng chỉ dẫn cụ thể.
Andrej Karpathy nhận xét: “Các tác tử AI vẫn chưa hoạt động tốt. Chúng chưa đủ thông minh, chưa đủ năng lực đa phương thức, không thể thao tác trên máy tính hay làm những việc như vậy. Chúng chưa có khả năng học liên tục. Chúng sẽ ghi nhớ hết mọi điều mà bạn nói. Chúng còn thiếu năng lực về nhận thức và nói chung là chưa hiệu quả”,
Ông dự đoán: “Sẽ mất khoảng một thập kỷ để giải quyết tất cả những vấn đề đó”.
Andrej Karpathy không ấn tượng với các tác tử AI hiện tại - Ảnh: Getty Images
Andrej Karpathy sáng lập và điều hành Eureka Labs - công ty giáo dục chuyên về AI được thành lập vào khoảng giữa năm 2024. Tại Eureka Labs, ông tập trung phát triển các khóa học và chương trình đào tạo AI. Sản phẩm đầu tiên của Eureka Labs là khóa học LLM101n dành cho sinh viên đại học với mục tiêu giúp học viên tự đào tạo và phát triển mô hình AI riêng.
Từ năm 2017 đến 2022, Andrej Karpathy là Giám đốc AI tại Tesla, chịu trách nhiệm chính cho hệ thống thị giác và mạng nơ-ron nhân tạo của Autopilot - hệ thống hỗ trợ lái xe được tích hợp trên ô tô điện.
Podcast Dwarkesh Patel là chương trình trò chuyện do Dwarkesh Patel sáng lập và điều hành. Ông là nhà bình luận, blogger và người sáng tạo nội dung nổi tiếng trong lĩnh vực AI, khoa học và kinh tế học.
Vibe coding là khái niệm mới trong cộng đồng AI, mô tả cách viết mã kết hợp với AI một cách linh hoạt, thay vì thực hiện thủ công. Nói cách khác, thay vì ngồi suy nghĩ rồi gõ từng dòng mã, kỹ sư sẽ trao đổi với AI để thử nhiều hướng tiếp cận khác nhau, tinh chỉnh và xây dựng dự án theo kiểu “đi theo cảm hứng”, giống làm việc song hành cùng cộng tác viên thông minh.
Hậu quả nếu tác tử AI khiến con người trở nên vô dụng
Tác tử AI hiện là một trong những chủ đề được nói đến nhiều nhất trong giới công nghệ. Nhiều nhà đầu tư thậm chí gọi 2025 là “năm của tác tử AI”.
Andrej Karpathy vốn nói rất nhanh. Vì thế, sau buổi podcast, Andrej Karpathy đã viết một bài đăng trên X dành cho những thính giả không thể nắm bắt hết mọi thứ ông nói. Về chủ đề tác tử AI, Andrej Karpathy nhắc lại sự thất vọng trước đó của mình.
“Lời phê bình của tôi là ngành AI hiện đang xây dựng hoặc quảng cáo công cụ vượt xa khả năng mà công nghệ hiện có thật sự đáp ứng được. Giới công nghệ dường như đang sống trong một tương lai tưởng tượng rằng: Các hệ thống tự động hoàn toàn có thể viết ra mọi dòng mã, khiến con người trở nên thừa thãi”, ông cho biết thêm.
Andrej Karpathy nói rằng ông không muốn sống trong tương lai như vậy. Trong tương lai lý tưởng của Andrej Karpathy, con người với AI hợp tác để lập trình và thực hiện nhiệm vụ.
Ông cảnh báo rằng nếu xây dựng loại tác tử AI khiến con người trở nên vô dụng, hậu quả là nội dung kém chất lượng do AI tạo sẽ tràn lan khắp nơi.
Andrej Karpathy không phải người duy nhất nghi ngờ khả năng thực tế của các tác tử AI.
Năm ngoái, Quintin Au, trưởng nhóm phát triển của công ty khởi nghiệp gán nhãn dữ liệu ScaleAI, viết trên LinkedIn rằng sai sót của các tác tử AI có xu hướng tích lũy theo từng tác vụ.
“Hiện tại, mỗi khi AI thực hiện một hành động, có khoảng 20% khả năng sai sót. Đó là bản chất của các mô hình ngôn ngữ lớn, không thể đạt 100% chính xác. Nếu một tác tử AI cần thực hiện 5 bước để hoàn thành một nhiệm vụ, xác suất nó làm đúng toàn bộ chỉ khoảng 32%”, Quintin Au viết.
Dù nghi ngại tác tử AI, Andrej Karpathy khẳng định ông không phải người hoài nghi AI nói chung.
“Dự đoán của tôi về tiến trình AI bi quan hơn khoảng 5 - 10 lần so với những gì bạn nghe thấy ở các buổi tiệc AI tại San Francisco (Mỹ) hay trên X, nhưng vẫn lạc quan hơn nhiều so với những người phủ nhận hoặc hoài nghi AI”, ông nhấn mạnh.
OpenAI đặt cược vào các tác tử AI
Khác với Andrej Karpathy, OpenAI đang đặt cược tương lai của kỹ thuật phần mềm vào các tác tử AI.
Trong tập OpenAI Podcast phát sóng tháng trước, Greg Brockman (đồng sáng lập kiêm Chủ tịch OpenAI) và Thibault Sottiaux (trưởng nhóm kỹ thuật Codex) đã phác thảo viễn cảnh về những mạng lưới rộng lớn gồm các tác tử AI, được con người giám sát nhưng có khả năng làm việc liên tục trên đám mây như những cộng tác viên thực thụ.
Greg Brockman hào hứng với tác tử AI - Ảnh: Getty Images
“Chúng tôi rất tin tưởng rằng hướng đi của lĩnh vực này sẽ là những quần thể lớn tác tử AI ở đâu đó trên đám mây. Chúng ta với tư cách cá nhân, nhóm, tổ chức sẽ giám sát và điều hướng chúng để tạo ra giá trị kinh tế to lớn. Vì vậy, nếu chúng ta nhìn về vài năm tới, đây sẽ là bức tranh: Hàng triệu tác tử AI đang làm việc trong trung tâm dữ liệu của chúng ta và các công ty để thực hiện những công việc hữu ích”, Thibault Sottiaux nói.
Codex là dòng mô hình AI do OpenAI phát triển, chuyên về hiểu và tạo mã lập trình. Codex được huấn luyện trên lượng dữ liệu lớn gồm mã nguồn từ nhiều ngôn ngữ lập trình và văn bản tự nhiên, nên có thể chuyển yêu cầu bằng ngôn ngữ tự nhiên thành đoạn mã hoàn chỉnh; gợi ý, tự động hoàn thành hoặc viết lại hàm/mô đun; hỗ trợ sửa lỗi, tối ưu và giải thích mã; tích hợp trực tiếp vào các công cụ phát triển để hỗ trợ lập trình viên. Giữa tháng 9, OpenAI đã ra mắt phiên bản GPT-5 Codex, có thể chạy hàng giờ liền trên các dự án phần mềm phức tạp, chẳng hạn tái cấu trúc mã nguồn quy mô lớn, đồng thời tích hợp trực tiếp vào quy trình làm việc của nhà phát triển trong môi trường đám mây.
Kevin Weil, Giám đốc sản phẩm OpenAI, từng nói trên podcast Exponential View rằng các công cụ AI nội bộ, chẳng hạn hệ thống rà soát mã dựa trên Codex, đã giúp tăng hiệu quả cho đội ngũ kỹ sư của họ. Tuy nhiên, điều này không có nghĩa là các lập trình viên sẽ trở nên lỗi thời.
Dù có những ví dụ thành công về vibe coding, rõ ràng khi một người sử dụng tác tử AI mà không biết lập trình thì điều đó rất dễ nhận ra, theo các kỹ sư và giáo sư khoa học máy tính.
Greg Brockman cho biết việc giám sát vẫn sẽ đóng vai trò then chốt khi các tác tử AI đảm nhận những vai trò tham vọng hơn. Theo ông, từ năm 2017, OpenAI đã xây dựng chiến lược về cách con người hoặc những AI kém tinh vi hơn có thể giám sát AI mạnh mẽ hơn, nhằm duy trì khả năng kiểm soát và “nắm quyền điều khiển”.
"Việc tìm hiểu toàn bộ hệ thống này, sau đó biến nó thành mạng lưới đa tác tử AI có thể được điều khiển bởi các cá nhân, nhóm hay tổ chức, đồng thời làm cho nó phù hợp với mục tiêu chung, chính là hướng đi của chúng tôi. Điều đó nghe hơi mơ hồ, nhưng cũng rất thú vị", Thibault Sottiaux thổ lộ.
Trong bối cảnh AI đang tiến rất nhanh về khả năng tự động hóa, OpenAI nhiều lần nhấn mạnh vai trò của tác tử AI tại các phát biểu và sự kiện công khai.
Sam Altman, Giám đốc điều hành OpenAI, dự báo trong một bài viết hồi đầu năm 2025 rằng các tác tử AI “sẽ sớm gia nhập lực lượng lao động và làm thay đổi rõ rệt năng suất của các công ty”. Nhận định này cho thấy tầm nhìn của ông về một thế giới nơi các hệ thống AI có thể cộng tác liên tục cùng chúng ta, đảm nhận những nhiệm vụ phức tạp mà trước đây chỉ con người mới làm được.
Trong buổi nói chuyện hồi tháng 4, Sam Altman cũng nhấn mạnh khái niệm agentic AI - hệ thống AI có tính chủ động, tự tìm hiểu và hành động để hoàn thành nhiệm vụ. Ông cảnh báo rằng khi các agentic AI có quyền truy cập hệ thống, internet hay dữ liệu quan trọng, việc xây dựng cơ chế bảo đảm an toàn và kiểm soát sẽ trở thành ưu tiên hàng đầu.
Thông điệp chung của OpenAI là: Tác tử AI được thiết kế không nhằm thay thế con người mà trở thành cộng sự, hỗ trợ các nhóm, tổ chức đạt hiệu suất cao hơn. Tuy nhiên, để công nghệ này phát huy tối đa giá trị, việc đảm bảo khả năng giám sát, định hướng và điều chỉnh của con người là điều không thể bỏ qua.
Sơn Vân