GPT-5.2 và cú bứt tốc của AI trong công việc văn phòng

một giờ trướcBài gốc

Trung tuần tháng 12, OpenAI đã công bố phiên bản GPT-5.2, đánh dấu một bước tiến đáng chú ý trong khả năng tạo lập và xử lý các tài liệu phục vụ hoạt động kinh doanh. Theo giới quan sát, những cải thiện này cho thấy tốc độ phát triển rất nhanh của các mô hình ngôn ngữ lớn, đặc biệt trong các tác vụ vốn được xem là thế mạnh của con người.

Thông tin về GPT-5.2 được đưa ra trong bối cảnh trước đó không lâu, nhiều phân tích vẫn cho rằng các tác nhân AI còn gặp hạn chế khi thực hiện công việc văn phòng phức tạp. Các nhận định này chủ yếu dựa trên kết quả đánh giá hiệu năng của các phiên bản trước, trong đó có GPT-5.1, với kết luận rằng AI chưa thể sánh ngang con người trong việc tạo ra các tài liệu kinh doanh có chất lượng cao.

Việc sử dụng ChatGPT cần được thực hiện cẩn thận để đảm bảo tính chính xác và an toàn của thông tin, đặc biệt là trong các trường hợp yêu cầu độ chính xác và đáng tin cậy cao.

Tuy nhiên, GPT-5.2 đã cho thấy sự thay đổi rõ rệt khi đạt kết quả cải thiện đáng kể trên GDPval - một tiêu chuẩn được sử dụng để đo lường khả năng của tác nhân AI trong việc thực hiện các nhiệm vụ thực tế mang lại giá trị kinh tế. GDPval tập trung đánh giá mức độ đóng góp tiềm năng của AI vào tăng trưởng tổng sản phẩm quốc nội (GDP) thông qua hiệu quả xử lý công việc.

Trong khuôn khổ GDPval, các tác nhân AI được giao phân tích tài liệu, slide và nhiều dạng thông tin khác thuộc 44 lĩnh vực chuyên môn, trải rộng từ luật, thiết kế, hỗ trợ khách hàng cho đến điều dưỡng. Người tham gia phải thực hiện các nhiệm vụ như tạo bảng tính và những công việc văn phòng tương tự, sau đó kết quả được so sánh trực tiếp với sản phẩm do các chuyên gia con người thực hiện.

Cách chấm điểm của GDPval dựa trên “tỷ lệ thắng”, tức tỷ lệ các nhiệm vụ mà sản phẩm do AI tạo ra được đánh giá là tốt hơn hoặc tương đương với kết quả của chuyên gia. Đây được xem là thước đo phản ánh khá sát năng lực ứng dụng thực tế của các mô hình AI trong môi trường làm việc.

Trước khi GPT-5.2 ra mắt với hiệu năng đạt 70,9%, điểm số GDPval ghi nhận mức 12,4% đối với GPT-4o, 38,8% với GPT-5 high và 47,6% cho Claude Opus 4.1. Những con số này từng được sử dụng để lập luận rằng các mô hình ngôn ngữ quy mô lớn vẫn còn khoảng cách đáng kể so với con người trong việc tạo lập tài liệu kinh doanh và xử lý công việc văn phòng phức tạp.

Việc GPT-5.2 cải thiện mạnh mẽ kết quả trên GDPval cho thấy khoảng cách đó đang được thu hẹp nhanh chóng. Diễn biến này không chỉ buộc giới nghiên cứu phải điều chỉnh lại các đánh giá trước đây, mà còn đặt ra những câu hỏi mới về vai trò của AI trong môi trường làm việc, cũng như tốc độ mà công nghệ này có thể tác động đến năng suất và cấu trúc lao động trong thời gian tới.

Thủy Long

Nguồn Một Thế Giới : https://1thegioi.vn/gpt-5-2-va-cu-but-toc-cua-ai-trong-cong-viec-van-phong-242630.html