Một kỹ sư tại OpenAI đang xử lý 210 tỷ token trong một tuần, lượng văn bản đủ để lấp đầy Wikipedia 33 lần và trở thành người dùng AI nhiều nhất công ty. Tại Anthropic, một người dùng đơn lẻ của Claude Code có thể tiêu tốn hơn 150.000 USD chỉ trong một tháng.
Những con số khổng lồ này không phải ngoại lệ, nó đang dần trở thành xu hướng mới tại các công ty hàng đầu.
Tại Meta, Shopify và OpenAI, các nhà quản lý đã đưa mức độ sử dụng AI vào tiêu chí đánh giá hiệu suất. Một số công ty thậm chí xây dựng bảng xếp hạng nội bộ theo dõi lượng token mỗi nhân viên tiêu thụ theo tuần. Ngân sách token hào phóng đang trở thành đặc quyền mới trong ngành công nghệ, ngang hàng với bảo hiểm hay bữa trưa miễn phí.
Xu hướng đốt token
Hiện tượng trên có tên tokenmaxxing, một thuật ngữ chỉ lượng token AI tối đa mà một người sử dụng, bất kể kết quả đầu ra ra sao.
"Trong các công ty công nghệ lớn, việc không sử dụng AI với tốc độ nhanh chóng đang trở thành một rủi ro nghề nghiệp, bất kể chất lượng sản phẩm ra sao", Gergely Orosz, tác giả bản tin nổi tiếng dành cho kỹ sư phần mềm nhận định.
Để hiểu mức độ thay đổi, chúng ta cần nhìn lại bối cảnh. Cho đến gần đây, một người dùng chuyên nghiệp tích cực dùng AI cũng chỉ tiêu thụ hàng nghìn token mỗi ngày. Một sinh viên viết luận với nhiều vòng chỉnh sửa có thể dùng đến 10.000 token, tương đương khoảng 7.500 từ. Tiêu thụ hàng tỷ token gần như không tưởng nếu chỉ gõ bàn phím thủ công.
Nhiều chatbot AI hiện tại tự động viết và sửa code với tốc độ chóng mặt. Ảnh: Barchart.
Song, sự xuất hiện của các công cụ lập trình tự động đã thay đổi tất cả. Những hệ thống này có thể chạy tự động hàng giờ liền, xem xét và chỉnh sửa toàn bộ cơ sở mã, viết chương trình phần mềm hoàn chỉnh từ một lệnh duy nhất. Mỗi tác nhân AI mẹ có thể tạo ra các tác nhân con để xử lý nhiều phần của cùng một nhiệm vụ, sinh ra hàng nghìn token ở mỗi bước.
Một số hệ thống như OpenClaw được thiết kế để chạy liên tục 24/7, xử lý token ngay cả khi người dùng đang ngủ.
"Nếu bạn có một số tác nhân hoạt động liên tục, bạn sẽ tạo ra 700 triệu token mỗi tuần", Ege Erdil, đồng sáng lập của Mechanize cho biết. Về phần mình, ông ước tính mức tiêu thụ token của bản thân vào khoảng 1-10 tỷ token mỗi tuần.
Cuộc đua hiệu suất
Những con số này mang lại lợi ích trực tiếp cho các công ty AI bán token. Anthropic đã tăng gấp đôi dự báo doanh thu chỉ trong 2 tháng đầu năm nay, phần lớn nhờ tăng trưởng của các công cụ lập trình tự động. OpenAI cho biết Codex đã tăng gấp 3 số người dùng hoạt động hàng tuần kể từ đầu năm, còn tổng lượng sử dụng tính bằng token tăng 5 lần. Năm ngoái, Google cho biết các mô hình AI của họ xử lý hơn 1,3 triệu tỷ token mỗi tháng.
Tuy nhiên, không phải tất cả đều tin rằng đây là năng suất thực sự.
"Việc đốt hàng triệu token mỗi tuần dường như không bền vững", một nhân viên OpenAI chia sẻ. Người này cho biết kết quả sinh ra có thể chưa đạt chất lượng như kỳ vọng.
Anthropic tăng gấp đôi doanh thu nhờ mô hình Claude. Ảnh: Bloomberg.
"Tôi có lẽ đã chi nhiều hơn cả lương của mình cho Claude", Max Linder, kỹ sư phần mềm ở Stockholm thừa nhận.
Nhiều nhân viên công nghệ lo ngại đồng nghiệp đang phung phí hàng tỷ token, có thể tốn hàng nghìn USD mỗi ngày, chỉ để khoe khoang hoặc tạo ấn tượng với quản lý. Ngay tại các phòng nghiên cứu AI nơi nhân viên được dùng không giới hạn công cụ của công ty, ý tưởng về việc tự động hóa hoàn toàn vẫn gây ra nhiều hoài nghi.
Cơn nghiện token còn tạo ra một tầng lớp người dùng tinh vi tìm cách lách qua các giới hạn. Một nhà khởi nghiệp chia sẻ rằng anh phát hiện một công cụ AI do Figma tạo ra cho phép sử dụng lượng token của Claude tương đương 70.000 USD thông qua tài khoản chỉ 20 USD/tháng. Anh đã dùng kẽ hở này để xây dựng 6 dự án phần mềm song song.
Chiến lược sinh tồn trong thời AI
Nikunj Kothari, nhà đầu tư mạo hiểm ở San Francisco, gọi hiện tượng trên là "nỗi lo lắng về token". Ông mô tả ngành công nghệ đang bị ám ảnh bởi tốc độ của AI hơn năng suất con người.
"Trước đây, những cuộc trò chuyện trong bữa tối thường bắt đầu bằng câu hỏi anh đang xây dựng cái gì. Chuyện đó đã qua rồi. Giờ câu hỏi sẽ là anh đang quản lý bao nhiêu tác nhân?", Kothari viết.
Nhiều công ty đo hiệu suất nhân viên thông qua việc sử dụng token. Ảnh: Bloomberg.
Động lực đằng sau tokenmaxxing không đơn thuần là năng suất. Với nhiều lập trình viên, đây còn là chiến lược sinh tồn. Nếu kỷ nguyên viết mã thủ công đang đi đến hồi kết, nhiều nhân viên hàng đầu đang tìm cách sử dụng AI để tạo thêm giá trị cho bản thân. Bảng xếp hạng token chính là bằng chứng công khai về việc họ đang theo kịp thời đại.
Dù bảo vệ hệ thống bảng xếp hạng AI, Orosz cũng thừa nhận nó không hoàn hảo. Ông so sánh với các chỉ số cũ như số dòng mã hay số lần commit, những thứ từng bị chỉ trích vì không phản ánh chất lượng thực sự. Shopify tuyên bố lượng token chỉ là một trong nhiều thước đo, bên cạnh việc xem xét AI "cải thiện và khuếch đại" công việc như thế nào.
Những kỹ sư nghiện AI hôm nay sẽ trở thành lực lượng lao động năng suất gấp trăm lần trong tương lai gần. Tuy nhiên, việc tạo ra giá trị thực sự khi phụ thuộc vào AI vẫn là vấn đề chưa có câu trả lời.
Minh Hoàng