Công ty khởi nghiệp OpenAI đã âm thầm đảo ngược một thay đổi lớn liên quan đến cách hàng trăm triệu người sử dụng ChatGPT.
Trên blog ít được chú ý về các thay đổi sản phẩm, OpenAI cho biết đã rút lại hệ thống điều hướng mô hình của ChatGPT với người dùng gói miễn phí và Go (5 USD/tháng). Đây là hệ thống tự động chuyển các câu hỏi phức tạp của người dùng sang các mô hình suy luận tiên tiến hơn. Thay vào đó, những người dùng này giờ đây sẽ mặc định sử dụng GPT-5.2 Instant, phiên bản nhanh nhất và rẻ nhất trong loạt mô hình mới của OpenAI.
Người dùng gói ChatGPT Go vẫn có thể truy cập các mô hình suy luận, nhưng sẽ phải tự chọn thủ công.
OpenAI rút lại hệ thống điều hướng mô hình của ChatGPT với người dùng gói miễn phí và Go, chuyển họ sang sử dụng GPT-5.2 Instant mặc định - Ảnh: Internet
Hệ thống điều hướng mô hình AI được ra mắt chỉ bốn tháng trước, như một phần trong nỗ lực của OpenAI nhằm thống nhất trải nghiệm người dùng khi phát hành phiên bản GPT-5. Tính năng này phân tích câu hỏi của người dùng trước khi quyết định ChatGPT sẽ trả lời bằng mô hình AI phản hồi nhanh, chi phí thấp hay mô hình suy luận chậm hơn nhưng tốn kém hơn.
Về lý thuyết, bộ điều hướng sẽ đưa người dùng đến các mô hình AI thông minh nhất của OpenAI đúng lúc họ cần. Trước đây, người dùng phải lựa chọn mô hình AI tiên tiến thông qua một menu khá rối rắm, điều mà chính Giám đốc điều hành Sam Altman thừa nhận OpenAI cũng không thích.
Trong thực tế, bộ điều hướng dường như đã chuyển nhiều người dùng ChatGPT miễn phí hơn sang các mô hình suy luận nâng cao, vốn tốn kém hơn để OpenAI vận hành. Ngay sau khi ra mắt, Sam Altman cho biết bộ điều hướng đã làm tỷ lệ người dùng miễn phí sử dụng mô hình suy luận tăng từ dưới 1% lên 7%. Đây là canh bạc tốn kém nhằm cải thiện chất lượng câu trả lời của ChatGPT, nhưng tính năng này không được đón nhận rộng rãi như OpenAI kỳ vọng.
Một nguồn tin am hiểu vấn đề nói với tạp chí Wired rằng bộ điều hướng đã ảnh hưởng tiêu cực đến chỉ số người dùng hoạt động hằng ngày của OpenAI. Dù được xem là đỉnh cao về năng lực AI, các mô hình suy luận có thể mất vài phút để xử lý các câu hỏi phức tạp với chi phí tính toán rất cao. Phần lớn người dùng ChatGPT không muốn chờ đợi lâu, ngay cả khi điều đó đồng nghĩa với việc nhận được câu trả lời tốt hơn.
Theo Chris Clark, Giám đốc vận hành OpenRouter (nhà cung cấp hạ tầng suy luận AI), các mô hình phản hồi nhanh vẫn chiếm ưu thế trong các chatbot dành cho người tiêu dùng. Trên những chatbot AI này, tốc độ và giọng điệu phản hồi thường là yếu tố then chốt.
“Nếu ai đó gõ một câu hỏi rồi phải chờ chatbot suy nghĩ suốt 20 giây thì rõ ràng là không hấp dẫn. Các chatbot AI phổ thông đang cạnh tranh với Google Search. Google luôn tập trung làm cho tìm kiếm nhanh nhất có thể và chưa bao giờ nói rằng: Chúng ta nên đưa ra câu trả lời tốt hơn nhưng hãy làm chậm hơn”.
Một người phát ngôn OpenAI nói với Wired rằng, dựa trên phản hồi của nhiều người, công ty xác định rằng người dùng gói miễn phí và Go thích ở lại trải nghiệm chat mặc định, đồng thời chỉ chọn chế độ suy luận khi thực sự cần.
OpenAI không cho biết cụ thể những phản hồi hay dấu hiệu nào từ người dùng đã dẫn đến quyết định của mình. Công ty khởi nghiệp AI số 1 thế giới tiết lộ mô hình GPT-5.2 Instant hiện có thể dành nhiều thời gian hơn để trả lời câu hỏi, tương tự các mô hình suy luận, qua đó thu hẹp sự khác biệt với đa số người dùng.
Người phát ngôn OpenAI thông báo người dùng ChatGPT trả phí vẫn đánh giá cao bộ điều hướng mô hình và công ty kỳ vọng công nghệ đứng sau tính năng này sẽ tiếp tục phát triển. Theo các nguồn tin, OpenAI có khả năng sẽ triển khai lại bộ điều hướng mô hình AI cho người dùng gói miễn phí và Go khi nó được cải thiện.
Thời lượng truy cập trung bình trên ChatGPT thấp hơn Gemini kể từ tháng 9
Sự thay đổi này diễn ra trong bối cảnh OpenAI đang gấp rút cải tiến ChatGPT trước áp lực cạnh tranh ngày càng tăng, đặc biệt từ Google. Tháng trước, Sam Altman đã công bố tình trạng “báo động đỏ” trên toàn công ty để huy động nguồn lực cải thiện sản phẩm tiêu dùng cốt lõi.
Dù ChatGPT là thế lực lớn trong thị trường AI với hơn 800 triệu người dùng hoạt động hằng tuần, Giám đốc tài chính OpenAI - Sarah Friar nói với các nhà đầu tư rằng thời lượng người dùng dành cho chatbot AI này đã giảm nhẹ sau các hạn chế nội dung gần đây.
Từ tháng 8, OpenAI đã đưa vào ChatGPT nhiều biện pháp bảo vệ, như gợi ý người dùng nghỉ giải lao khi trò chuyện quá dài và mở rộng phạm vi các bộ phân loại để chặn nhiều nội dung bị coi là không an toàn.
Dữ liệu từ bên thứ ba cho thấy áp lực cạnh tranh đang gia tăng. Theo công ty theo dõi lưu lượng SimilarWeb, Google Gemini đã tăng trưởng mạnh những tháng gần đây, trong khi ChatGPT chững lại. Omri Shtayer, Phó chủ tịch phụ trách dữ liệu và sản phẩm DaaS (dữ liệu như một dịch vụ) của SimilarWeb, nói với Wired rằng thời lượng truy cập trung bình trên ChatGPT đã thấp hơn Gemini kể từ tháng 9.
Bộ điều hướng mô hình AI của OpenAI đã gây tranh cãi ngay từ khi ra mắt cùng GPT-5 vào tháng 8. Các lãnh đạo OpenAI bất ngờ trước phản ứng dữ dội từ nhiều người dùng chỉ ưa thích trò chuyện với một mô hình AI cụ thể. Chỉ trong vòng một tuần, OpenAI đã khôi phục trình chọn mô hình AI và một số phiên bản cũ hơn, đồng thời vẫn giữ bộ điều hướng làm mặc định trong ChatGPT thông qua chế độ mới được đặt tên là Auto.
Sự việc cho thấy các công ty hàng đầu vẫn đang loay hoay tìm cách tốt nhất để tích hợp mô hình AI mạnh mẽ vào sản phẩm tiêu dùng đại chúng.
“Điều hướng mô hình AI sẽ tiếp tục là hướng đi đúng”
Khi thúc đẩy mức độ sử dụng ChatGPT cao hơn, OpenAI phải làm điều đó mà không đi ngược lại các cam kết về an toàn. Trong một báo cáo gần đây, công ty cho biết mỗi tuần có hàng trăm nghìn người dùng ChatGPT xuất hiện những dấu hiệu có thể liên quan đến các tình trạng khẩn cấp về sức khỏe tâm thần như loạn thần hoặc hưng cảm.
Hưng cảm là trạng thái rối loạn tâm thần đặc trưng bởi sự hưng phấn quá mức, tràn đầy năng lượng, cảm xúc phấn khích cực độ, tư duy dồn dập, nói nhiều, giảm nhu cầu ngủ, nhưng lại đi kèm với hành vi liều lĩnh, dễ cáu kỉnh, thậm chí ảo giác, hoang tưởng. Tình trạng này trái ngược với trầm cảm, biểu hiện ở nhiều mức độ từ nhẹ đến nặng có loạn thần, ảnh hưởng nghiêm trọng đến cuộc sống người bệnh.
OpenAI đang thực hiện các bước để cải thiện cách các mô hình AI phản hồi. Bộ điều hướng mô hình của OpenAI là một trong những biện pháp đó, khi chuyển các truy vấn nhạy cảm sang các mô hình suy luận, vốn trước đây được cho là phù hợp hơn để hỗ trợ những người dùng đang gặp khủng hoảng.
Tuy nhiên, một người phát ngôn của OpenAI nói với Wired rằng công ty sẽ không còn chuyển các cuộc trò chuyện nhạy cảm sang mô hình suy luận nữa, do GPT-5.2 Instant đã đạt hiệu năng cao hơn trong các bài kiểm tra an toàn.
Bộ điều hướng mô hình AI vẫn tồn tại với người dùng ChatGPT trả phí, gồm các gói Plus (20 USD/tháng) và Pro (200 USD/tháng), cho thấy công ty vẫn cam kết với ý tưởng này.
Robert Nishihara, đồng sáng lập Anyscale (nền tảng huấn luyện và suy luận AI), kỳ vọng các bộ điều hướng mô hình sẽ tồn tại lâu dài, ngay cả khi những phiên bản hiện nay chưa hoàn hảo.
“Về bản chất, mỗi loại vấn đề cần những mô hình AI và mức tài nguyên tính toán khác nhau. Dù trong ngắn hạn có chuyện gì xảy ra, tôi vẫn tin rằng việc điều hướng mô hình AI sẽ tiếp tục là hướng đi đúng”, Robert Nishihara nhận định.
GPT-5.2 vượt Gemini 3 Pro ở 7/8 bài kiểm tra
OpenAI trình làng GPT-5.2 hôm 12.12, khẳng định đây là dòng mô hình AI mạnh mẽ nhất đến nay cho công việc tri thức chuyên nghiệp.
“Chúng tôi thiết kế GPT-5.2 nhằm tạo ra nhiều giá trị kinh tế hơn cho người dùng. Mô hình này giỏi hơn trong việc tạo bảng tính, xây dựng bài thuyết trình, viết mã, phân tích hình ảnh, hiểu văn bản dài, sử dụng công cụ và xử lý các dự án phức tạp gồm nhiều bước”, OpenAI thông báo.
Trong ChatGPT, phiên bản GPT-5.2 Instant, Thinking và Pro bắt đầu được triển khai từ hôm 12.12, với các gói trả phí trước tiên. Trên API, các phiên bản này hiện đã sẵn sàng cho mọi nhà phát triển.
Trong bài đánh giá hiệu năng GDPval, OpenAI cho biết GPT-5.2 có thể vượt qua “các chuyên gia trong ngành ở những nhiệm vụ công việc tri thức được mô tả rõ ràng, trải rộng trên 44 lĩnh vực nghề nghiệp”.
“GPT-5.2 Thinking tạo ra kết quả cho các nhiệm vụ GDPval với tốc độ nhanh hơn 11 lần và chi phí thấp hơn dưới 1% so với các chuyên gia. Điều này cho thấy rằng, khi có sự giám sát của con người, GPT-5.2 có thể hỗ trợ đáng kể cho công việc chuyên môn”, công ty khởi nghiệp AI số 1 thế giới thông báo.
Ngoài ra, OpenAI tiết lộ rằng trong bài kiểm tra nội bộ dành cho các tác vụ lập mô hình bảng tính của chuyên viên phân tích ngân hàng đầu tư cấp dưới, “chẳng hạn xây dựng mô hình 3 báo cáo cho một công ty Fortune 500 với định dạng và trích dẫn chuẩn, hoặc dựng mô hình LBO cho một thương vụ tư nhân hóa”, điểm số của GPT-5.2 cao hơn 9,3% mỗi tác vụ so với GPT-5.1, tăng từ trung bình 59,1% lên 68,4%. Thông tin này chắc chắn sẽ thu hút sự chú ý của các ngân hàng.
Fortune 500 là top 500 doanh nghiệp có doanh thu cao nhất nước Mỹ, bao gồm cả tập đoàn công nghệ, năng lượng, bán lẻ, tài chính, ô tô…
LBO (Leveraged Buyout) là mô hình tài chính dùng để phân tích và định giá một thương vụ thâu tóm bằng đòn bẩy. Nói đơn giản, đây là mô hình giúp trả lời câu hỏi: Nếu mua lại một công ty bằng lượng lớn tiền vay mượn, thương vụ có sinh lời hay không?
Ngoài ra, GPT-5.2 Thinking bị ảo giác (trả lời sai y như thật) ít hơn GPT-5.1 Thinking. Với người dùng chuyên nghiệp, điều này đồng nghĩa với việc ít sai sót hơn khi dùng GPT-5.2 Thinking để nghiên cứu, viết lách, phân tích và hỗ trợ ra quyết định, giúp mô hình đáng tin cậy hơn cho công việc tri thức hằng ngày.
Theo OpenAI, GPT-5.2 Thinking là mô hình thị giác mạnh nhất của công ty cho đến nay, giảm khoảng một nửa tỷ lệ lỗi trong suy luận biểu đồ và hiểu giao diện phần mềm. Với người dùng chuyên nghiệp, GPT-5.2 Thinking diễn giải chính xác hơn bảng điều khiển (dashboard), ảnh chụp sản phẩm, sơ đồ kỹ thuật và báo cáo trực quan, hữu ích trong các quy trình tài chính, vận hành, kỹ thuật, thiết kế và hỗ trợ khách hàng, nơi thông tin hình ảnh đóng vai trò chủ đạo.
Trên mạng xã hội X, OpenAI đăng ảnh cho thấy GPT-5.2 vượt GPT-5.1 và Claude Opus 4.5 của Anthropic trên 8 bài kiểm tra khác nhau. Cụ thể gồm:
SWE-Bench Pro: Đánh giá khả năng sửa lỗi và hiểu mã trong các dự án phần mềm thực tế.
GPQA Diamond: Câu hỏi khoa học nâng cao, không cho phép dùng công cụ.
CharXiv Reasoning: Phân tích biểu đồ, hình minh họa khoa học.
FrontierMath: Toán học nâng cao nhiều cấp độ khó.
AIME 2025: Bài thi toán cạnh tranh (giống Olympic).
ARC-AGI-1 và ARC-AGI-2: Bài kiểm tra về tư duy trừu tượng và suy luận logic.
GDPval: Bộ đánh giá đo lường các nhiệm vụ công việc tri thức được mô tả rõ ràng trên 44 ngành nghề.
Nếu so với Gemini 3 Pro, GPT-5.2 giành chiến thắng 7/8 bài kiểm tra, trừ CharXiv Reasoning.
GPT-5.2 vượt Gemini 3 Pro và Claude Opus 4.5 ở phần lớn bài kiểm tra
Trước khi GPT-5.2 trình làng, nhiều người trong giới công nghệ nhận định Google đang đuổi kịp và thậm chí vượt OpenAI trong cuộc đua AI, với việc phát hành Gemini 3 hồi tháng 11 gây được nhiều tiếng vang.
Thế nhưng, Sam Altman (Giám đốc điều hành OpenAI) nói trong cuộc phỏng vấn với kênh CNBC hôm 11.12: “Gemini 3 gây ít ảnh hưởng đến các chỉ số của chúng tôi hơn so với lo ngại ban đầu”.
Sơn Vân