Một số chuyên gia dự đoán rằng đây có thể là cột mốc đánh dấu sự khởi đầu của kỷ nguyên Trí tuệ nhân tạo tổng quát (AGI), tức là AI có thể đạt được trí thông minh giống con người.
GPT-5 khác gì với các phiên bản trước?
OpenAI dự kiến tung ra GPT-5 - phiên bản mới nhất của GPT - ngay trong tháng 8. The Verge ngày 25.7 đưa tin rằng OpenAI đang tăng cường công suất máy chủ để vận hành GPT-5, đồng thời dẫn lời nguồn tin thân cận cho biết: “GPT-5 ra mắt sau khi hoàn tất các bước thử nghiệm cuối cùng”.
Tuy OpenAI chưa công bố chi tiết cụ thể về GPT-5, nhưng dự kiến đây sẽ là một mô hình tích hợp cả chức năng suy luận (inferential) và không suy luận (non-inferential). Nói cách khác, GPT-5 sẽ có khả năng tự xác định cách trả lời phù hợp cho câu hỏi của người dùng, vừa cung cấp thông tin hiệu quả, vừa có lập luận logic.
Trước đây, OpenAI phát hành các mô hình không suy luận (như dòng GPT) - chuyên trả lời dựa vào dữ liệu huấn luyện sẵn, không đưa ra lời giải thích - thích hợp cho các câu hỏi đơn giản. Trong khi đó, các mô hình suy luận như dòng “o” lại đi kèm lý do, quy trình giải bài và logic lập luận, phù hợp cho các lĩnh vực như khoa học. Tuy nhiên, nếu đầu vào sai, mô hình suy luận cũng có thể mắc lỗi nghiêm trọng.
The Verge cũng dự đoán rằng GPT-5 sẽ đánh dấu bước chuyển sang “trí tuệ nhân tạo tổng quát” - loại AI có thể tư duy như con người và giải quyết vấn đề mà không bị giới hạn bởi lĩnh vực cụ thể. Tờ này dẫn lời CEO Sam Altman của OpenAI rằng GPT-5 là “một hệ thống tích hợp các công nghệ hiện có” thể hiện ý định tiến tới AGI bằng cách kết hợp các mô hình ngôn ngữ quy mô lớn.
Là con át chủ bài của OpenAI
OpenAI thông báo cho phép người dùng miễn phí truy cập không giới hạn GPT-5 - điều chưa từng có với các mô hình suy luận trước đó. Như vậy, người dùng không trả phí cũng có thể trải nghiệm khả năng lập luận logic mà trước đây chỉ có ở các phiên bản nâng cao.
Đáng chú ý, có dự đoán rằng Microsoft Copilot cũng sẽ được tích hợp GPT-5. Theo hãng công nghệ FirstPageSage (Mỹ), tính đến tháng 2, thị phần kết hợp của GPT (59,8%) và Copilot (14,4%) đã vượt quá 74%. Tức là hơn 70% người dùng AI tạo sinh sẽ có thể tiếp cận mô hình tích hợp mới.
Thành công của GPT-5 còn mang ý nghĩa sống còn với OpenAI. Dù GPT hiện chiếm thị phần áp đảo, các đối thủ như Google Gemini, X Grok, Meta AI và DeepSeek cũng đang tăng trưởng rất nhanh. Đặc biệt, Viện Nghiên cứu Siêu trí tuệ (Superintelligence Research Institute) của Meta đã chiêu mộ hàng loạt nhân sự cấp cao từ OpenAI trong năm nay, gồm cả tiến sĩ Jeong-Hyeong Won và nhà nghiên cứu Jason Way - những người từng tham gia phát triển các mô hình suy luận. Do đó, GPT-5 là con át chủ bài để OpenAI nới rộng khoảng cách với các đối thủ.
Chính sách thương mại hóa của OpenAI tiến triển ra sao?
Dù đang giữ thị phần lớn, OpenAI vẫn gặp khó khăn về lợi nhuận do nguồn thu chủ yếu chỉ đến từ đăng ký trả phí. Tính đến tháng 4, GPT đã có hơn 500 triệu người dùng, nhưng công ty vẫn chưa có lãi.
CNBC cho biết doanh thu ước tính từ đăng ký năm ngoái của OpenAI là 5,5 tỉ USD, nhưng khoản lỗ ròng vẫn lên tới 5 tỉ USD. Đây là lý do vì sao OpenAI đang tích cực tìm kiếm mô hình thương mại hóa.
OpenAI bắt đầu thử nghiệm tích hợp quảng cáo từ cuối năm ngoái. Mới đây, trong một podcast, Sam Altman khẳng định ông không phản đối việc đưa quảng cáo vào GPT: “Nó có thể hữu ích cho mục tiêu kiếm tiền, như quảng cáo trên Instagram chẳng hạn. Cần tiếp cận thận trọng”.
Ngoài ra, OpenAI đã đưa chức năng thương mại vào GPT. Cụ thể, khi người dùng tìm kiếm thông tin mua sắm, GPT sẽ đề xuất sản phẩm và liên kết mua hàng. Theo Financial Times, một hệ thống thanh toán riêng nhằm thu hoa hồng từ các giao dịch cũng dự định ra mắt và nếu nó được triển khai trọn vẹn, OpenAI hoàn toàn có thể trở thành đối thủ của các mô hình mua sắm hiện hành như Google.
GPT đã tiến hóa thế nào?
Làn sóng AI tạo sinh bắt đầu từ tháng 11.2022, khi OpenAI phát hành GPT-3.5. Trước đó, GPT-3 đã được công bố vào tháng 6.2020, nhưng phiên bản 3.5 mới là bước ngoặt, khi được định hình như một chatbot đối thoại, tạo nên cơn sốt AI.
Khác với các chatbot truyền thống chỉ phản hồi theo dữ liệu được nhập sẵn, GPT có thể tạo ra nội dung mới dựa trên dữ liệu huấn luyện bất kể câu hỏi là gì.
Đến tháng 3.2023, GPT-4 ra đời, nâng cấp mạnh mẽ khả năng suy luận và trả lời. Trong một ví dụ, khi được yêu cầu giải bài kiểm tra hành nghề luật sư tại Mỹ, GPT-3.5 chỉ đạt điểm trong nhóm 10% thấp nhất, trong khi GPT-4 vào top 10% cao nhất.
Đặc biệt, các phiên bản mở rộng của GPT-4 đã châm ngòi cho làn sóng AI tạo sinh quy mô lớn. GPT-4o là ví dụ điển hình: có khả năng xử lý đa phương tiện (text, hình ảnh, âm thanh), thậm chí có thể biến ảnh người dùng thành phong cách hoạt hình như Simpsons hay Ghibli.
Bùi Tú