Theo Washington Post, thay vì truy cập vào hàng loạt đường dẫn từ kết quả Google, ngày càng nhiều người dùng chọn cách hỏi ChatGPT và nhận lại một bản tóm tắt ngắn gọn, cô đọng. Để làm được điều đó, các công ty như OpenAI và Anthropic đang triển khai một thế hệ bot AI mới, được lập trình để thu thập và xử lý nội dung theo thời gian thực.
Không chỉ quét bề mặt, những bot này đang “đọc” hàng triệu trang web mỗi ngày, đưa nội dung liên quan vào bộ nhớ và sử dụng để trả lời câu hỏi của người dùng. Theo dữ liệu từ công ty khởi nghiệp TollBit (trụ sở tại New York), lưu lượng truy cập từ các bot truy xuất nội dung đã tăng 49% trong quý 1 năm 2025, so với quý cuối năm 2024.
Bot AI đang thay con người đọc web, gây biến động lớn trong cách nội dung được truy cập, sử dụng và định giá - Ảnh: Washington Post
TollBit, công ty cung cấp công cụ giúp các nhà xuất bản theo dõi và kiếm tiền từ lưu lượng bot AI, đã phân tích dữ liệu từ 266 trang web, trong đó có một nửa là các cơ quan báo chí quốc gia và địa phương. Kết quả cho thấy bot AI đang phát triển theo đường cong tăng trưởng cấp số nhân, và không có dấu hiệu chậm lại.
“Ban đầu chỉ ảnh hưởng đến ngành xuất bản, nhưng xu hướng này rồi sẽ lan rộng ra toàn bộ internet”, Toshit Panigrahi, CEO kiêm đồng sáng lập TollBit nhận định.
Panigrahi cũng nhấn mạnh rằng loại bot này thường rất khó bị phát hiện. Trong khi lượng người truy cập thật đang giảm do người dùng nhận câu trả lời trực tiếp từ AI thay vì truy cập nguồn gốc – thì lượng nội dung bị truy xuất bởi AI lại đang tăng vọt. “Tổng lượng dữ liệu được tiêu thụ đang bùng nổ, chỉ là nó không còn đến từ con người nữa”, ông nói.
Một người phát ngôn của OpenAI cho rằng tuy lượng truy cập giới thiệu từ ChatGPT có thể thấp hơn về số lượng, nhưng lại cho thấy ý định tìm kiếm rõ ràng hơn, khác với hành vi duyệt web ngẫu nhiên.
Sự dịch chuyển này đẩy các trang web đến một thực tế mới rằng không chỉ viết cho con người, mà phải tối ưu cho AI. Tuy nhiên, Panigrahi thừa nhận rằng việc yêu cầu các công ty AI trả tiền để sử dụng nội dung, trong khi họ vẫn khẳng định việc thu thập này là “sử dụng hợp lý” là một trận chiến không dễ thắng.
Đặc biệt khi các công ty AI ngày càng ẩn danh hóa các bot của mình, khiến các biện pháp kiểm soát truy cập trở nên vô hiệu. “Nếu bạn vẫn nghĩ mình đang tối ưu hóa tìm kiếm cho người dùng, thì bạn đã bỏ lỡ cơ hội lớn”, Panigrahi cảnh báo.
Tranh cãi xoay quanh quyền sử dụng nội dung trực tuyến đang ngày càng gay gắt. Để huấn luyện các mô hình AI, các công ty công nghệ đã sử dụng bot quét hàng loạt dữ liệu công khai trên internet mà không trả tiền bản quyền. Điều này dẫn đến hàng loạt vụ kiện, trong đó nổi bật là vụ New York Times kiện OpenAI vì vi phạm bản quyền nội dung. Một số nhà xuất bản chọn cách thương lượng và ký kết thỏa thuận cấp phép nội dung, như Washington Post đã làm với OpenAI vào tháng 4 năm nay.
Tuy nhiên, bên cạnh các bot thu thập dữ liệu để huấn luyện mô hình, loại bot tăng trưởng nhanh nhất hiện nay là bot truy xuất theo yêu cầu người dùng, tức phản hồi câu hỏi cụ thể bằng cách tìm, đọc và tóm tắt nội dung mới. TollBit cho biết, tốc độ tăng trưởng của loại bot này nhanh gấp 2,5 lần so với bot truyền thống trong giai đoạn từ quý 4 năm 2024 đến quý 1 năm 2025.
Panigrahi còn cho rằng báo cáo hiện tại có thể vẫn đang đánh giá thấp quy mô thực tế, vì chưa tính đến các bot mà AI cử đi thay mặt cho các trợ lý AI có thể tự động thực hiện tác vụ như đặt đồ ăn, mua vé, hoặc tìm thông tin.
TollBit cho biết, trong tháng 3.2025, đã có hơn 26 triệu lượt truy cập từ bot AI vượt qua các biện pháp chặn truy cập nội dung được các trang web cài đặt. Một số công ty AI biện minh rằng các tác tử AI (AI agent) hoạt động thay mặt người dùng, do đó không cần tuân thủ các hướng dẫn chặn bot truyền thống.
Mặc dù các nhà xuất bản có thể áp dụng biện pháp kỹ thuật để hạn chế việc quét dữ liệu, nhưng thực tế cho thấy những biện pháp đó ngày càng kém hiệu quả, nhất là khi bot AI ngày càng tinh vi hơn.
Mark Howard, giám đốc vận hành của tập đoàn truyền thông Time (một trong những khách hàng của TollBit), cho biết dữ liệu từ TollBit đã giúp họ đàm phán hiệu quả hơn với các công ty AI như OpenAI và Perplexity, một công cụ tìm kiếm mới dựa trên AI.
Tuy vậy, Howard thẳng thắn thừa nhận thị trường bồi thường nội dung vẫn chưa định hình rõ ràng. “Phần lớn bot AI ngoài kia vẫn sử dụng nội dung mà không qua bất kỳ cơ chế trả phí nào… Còn một chặng đường rất, rất dài phía trước”, ông nói.
Hoàng Vũ