Cơ chế tấn công "distillation" và quy mô xâm nhập dữ liệu logic
Báo cáo từ Google công bố vào ngày 12/2/2026 xác nhận hệ thống chatbot Gemini đã chịu tác động từ hơn 100.000 truy vấn có chủ đích trong một chiến dịch sao chép công nghệ. Hình thức này được gọi là "distillation attacks" (tấn công chiết xuất), tập trung vào việc đặt câu hỏi liên tục để buộc mô hình tiết lộ các cơ chế suy luận và logic xử lý thông tin nội bộ. Thay vì đánh phá hạ tầng kỹ thuật theo cách truyền thống, các tác nhân thực hiện việc truy vấn số lượng lớn để xây dựng lại mô hình AI riêng dựa trên kết quả phản hồi từ Gemini.
Kết quả phân tích cho thấy các thực thể đứng sau hoạt động này chủ yếu là những doanh nghiệp tư nhân và nhóm nghiên cứu có động cơ thương mại. Mục tiêu cốt lõi của chiến dịch là cải thiện năng lực cho các mô hình AI đối thủ để rút ngắn thời gian nghiên cứu và giảm chi phí phát triển. Dù các hoạt động này được ghi nhận đến từ nhiều khu vực trên toàn cầu, danh tính cụ thể của các tổ chức liên quan hiện chưa được công bố. Google khẳng định các truy vấn này tập trung làm rõ cách thức "lý luận" của Gemini, vốn là phần cốt lõi tạo nên sự khác biệt của sản phẩm trên thị trường.
Rủi ro bảo hộ tài sản trí tuệ và sự gia tăng của tội phạm công nghệ AI
Việc phát triển các mô hình ngôn ngữ lớn (LLM) tiêu tốn của các tập đoàn công nghệ hàng tỷ USD, do đó cấu trúc nội tại của các hệ thống này được xác lập là tài sản độc quyền có giá trị kinh tế đặc biệt cao. Google coi hành vi "chưng cất" mô hình là một dạng đánh cắp tài sản trí tuệ tinh vi. Thực tế các LLM buộc phải mở cho người dùng truy cập qua internet đã tạo ra những lỗ hổng để các đối thủ khai thác bí mật công nghệ thông qua các bộ câu hỏi được lập trình sẵn.
John Hultquist, chuyên gia phân tích tình báo mối đe dọa tại Google, nhận định kiểu tấn công chiết xuất sẽ trở nên phổ biến khi các doanh nghiệp đẩy mạnh phát triển AI tùy chỉnh trên nguồn dữ liệu nhạy cảm. Thực tế này từng được OpenAI phản ánh vào năm 2025 khi cáo buộc DeepSeek sử dụng phương thức tương tự với ChatGPT để nâng cấp mô hình. Sự việc của Gemini một lần nữa đặt ra thách thức lớn cho các đơn vị vận hành AI trong việc cân bằng giữa cung cấp dịch vụ rộng rãi và bảo mật bí quyết cốt lõi. Trong điều kiện cạnh tranh gay gắt, việc bảo vệ các mẫu logic nội bộ trở thành yếu tố sống còn để duy trì vị thế của các định chế công nghệ hàng đầu.
Khánh Trang