Theo khảo sát do Hiệp hội Vì sự tiến bộ của trí tuệ nhân tạo (AAAI) thực hiện, trong số 475 nhà nghiên cứu được hỏi, có tới 76% cho rằng việc đơn thuần mở rộng các mô hình ngôn ngữ lớn (LLM) là “không có khả năng” hoặc “rất không có khả năng” dẫn đến AGI - mục tiêu được kỳ vọng sẽ giúp máy móc đạt đến khả năng tư duy và học hỏi như con người.
Đây là nhận định đáng chú ý trong bối cảnh ngành công nghệ đã đầu tư mạnh mẽ vào AI kể từ làn sóng bùng nổ năm 2022, với giả định rằng chỉ cần tăng dữ liệu, phần cứng, năng lượng và tài chính thì các hệ thống AI sẽ dần đạt tới hoặc vượt qua năng lực trí tuệ của con người.
Chỉ tính riêng năm 2024, ngành công nghiệp AI tạo sinh đã huy động được 56 tỉ USD đô la vốn đầu tư mạo hiểm trên toàn cầu, nhưng các nhà khoa học không nghĩ rằng công nghệ này sẽ dẫn đến AGI - Ảnh: Live Science
Hiệu suất đang chững lại
Theo Live Science, kể từ khi mô hình GPT-4 ra mắt, nhiều chuyên gia cho rằng hiệu quả từ việc mở rộng quy mô mô hình không còn cải thiện rõ rệt.
“Sau khi OpenAI tung GPT-4, lợi ích từ việc mở rộng mô hình đã giảm dần và ngày càng tốn kém. Các công ty AI hiện đã đầu tư quá nhiều và khó có thể thừa nhận rằng họ đang đi sai hướng. Tất cả những gì họ có thể làm là tiếp tục đầu tư, dù không chắc thành công”, Stuart Russell - giáo sư khoa học máy tính tại Đại học California (Mỹ), nhận định.
Ngành AI tạo sinh hiện đang tiêu thụ lượng tài nguyên khổng lồ. Chỉ trong năm 2024, các công ty khởi nghiệp AI toàn cầu đã huy động được 56 tỉ USD, phần lớn được dùng để xây dựng các trung tâm dữ liệu quy mô lớn. Lượng khí thải carbon từ ngành AI cũng đã tăng gấp ba lần kể từ năm 2018.
Ngoài ra, nguồn dữ liệu đào tạo đang dần cạn kiệt. Các mô hình AI hiện tại cần lượng dữ liệu khổng lồ, chủ yếu là văn bản và hình ảnh do con người tạo ra. Tuy nhiên, nhiều dự báo cho thấy nguồn dữ liệu này có thể cạn vào cuối thập niên. Khi đó, các công ty sẽ phải chọn giữa hai hướng: thu thập dữ liệu cá nhân từ người dùng hoặc sử dụng dữ liệu tổng hợp do AI tạo ra - vốn tiềm ẩn nguy cơ "hồi quy" và giảm chất lượng mô hình.
Hạn chế từ chính cấu trúc mô hình
Ngoài vấn đề về dữ liệu và năng lượng, các chuyên gia cho rằng các mô hình hiện tại còn đối mặt với những giới hạn mang tính cấu trúc. Kiến trúc “biến áp” - nền tảng của nhiều mô hình AI hiện nay - tuy hiệu quả trong việc xử lý ngôn ngữ, nhưng chưa đủ để mô phỏng các khái niệm trừu tượng hoặc tư duy đa bước như con người.
Giáo sư Stuart Russell nhận xét: “Các mô hình hiện tại thực chất là những mạch truyền thống có quy mô rất lớn. Chúng chỉ có thể biểu diễn một số khái niệm ở mức gần đúng, tương tự như một bảng tra cứu khổng lồ với nhiều lỗ hổng. Điều này khiến chúng khó có thể lý luận sâu hoặc suy nghĩ linh hoạt”.
Ông Russell cũng chỉ ra rằng, dù một số mô hình đạt được kết quả ấn tượng trong các bài kiểm tra ngôn ngữ, chúng vẫn có thể dễ dàng bị đánh bại trong các tình huống chiến lược thực tế như chơi cờ vây.
Mức độ kỳ vọng vượt xa thực tế
Tỷ lệ cao các nhà nghiên cứu tỏ ra hoài nghi về tiềm năng của LLMs cũng cho thấy một khoảng cách ngày càng lớn giữa kỳ vọng của thị trường và giới khoa học. Theo khảo sát, 79% người được hỏi cho rằng nhận thức của công chúng về khả năng của AI đã vượt xa thực tế công nghệ hiện tại.
Trên thực tế, một số mô hình chi phí thấp hơn đáng kể đang dần bắt kịp các mô hình đắt đỏ của Thung lũng Silicon. Mới đây, công ty DeepSeek (Trung Quốc) đã giới thiệu mô hình có hiệu suất tương đương GPT-4 nhưng với mức đầu tư thấp hơn nhiều, làm dấy lên nghi ngờ về hiệu quả của chiến lược “càng lớn càng tốt”.
“Đây có thể là một bong bóng công nghệ. Trước đây, nhiều công nghệ phải mất hàng chục năm mới chứng minh được giá trị. Không loại trừ khả năng nhiều công ty AI hiện nay sẽ thất bại, nhưng cũng có thể vài tên tuổi sẽ vươn lên mạnh mẽ”, Giáo sư Thomas Dietterich (Đại học bang Oregon, Mỹ) cho hay.
Định hướng mới: Lý luận và mô hình chuyên biệt
Tuy nhiên, kết quả khảo sát không có nghĩa rằng triển vọng của AI là tiêu cực. Nhiều chuyên gia cho rằng hướng đi mới là phát triển các mô hình lý luận - những mô hình dành nhiều tài nguyên tính toán hơn cho các truy vấn phức tạp thay vì đơn thuần dựa vào khối lượng dữ liệu.
Việc kết hợp các mô hình AI tạo sinh với hệ thống học máy chuyên sâu, đồng thời tinh chỉnh mô hình cho các mục tiêu cụ thể, đang cho thấy nhiều hứa hẹn. Thành công của DeepSeek cũng minh chứng rằng sự đổi mới trong thiết kế hệ thống có thể mang lại hiệu quả vượt trội, mà không cần đầu tư quá lớn.
Một hướng đi khác được các chuyên gia đề xuất là lập trình xác suất - kỹ thuật cho phép hệ thống máy học xử lý sự không chắc chắn và đưa ra phán đoán mang tính suy luận. Đây có thể là cách tiếp cận khả thi hơn để tiến gần tới AGI, thay vì tiếp tục phụ thuộc vào mô hình dự đoán xác suất truyền thống.
Dù không thiếu những thành tựu đáng kể trong thời gian qua, ngành AI đang bước vào giai đoạn điều chỉnh kỳ vọng. Các nhà nghiên cứu ngày càng nhấn mạnh rằng AGI không thể đạt được chỉ bằng việc nhân rộng mô hình hoặc tiêu tốn thêm năng lượng.
Để tiến xa hơn, AI cần không chỉ là “bộ não ghi nhớ” mà còn phải có khả năng lập luận, hiểu ngữ cảnh, và thích nghi với tình huống mới. Đây là thách thức đòi hỏi sự phối hợp giữa khoa học máy tính, nhận thức học, và triết lý về tư duy - điều mà hiện tại, các mô hình AI thế hệ mới chỉ đang bắt đầu khám phá.
Hoàng Vũ