“Chính phủ Mỹ có thông tin cho thấy các thực thể nước ngoài, chủ yếu có trụ sở tại Trung Quốc, đang tham gia vào các chiến dịch có chủ đích, trên quy mô công nghiệp để chưng cất các hệ thống AI tiên tiến của Mỹ”, ông Michael Kratsios, Giám đốc Văn phòng Chính sách Khoa học và Công nghệ Nhà Trắng, viết trong một bản ghi nhớ được chia sẻ trên mạng xã hội hôm 23/4.
“Bằng cách sử dụng hàng chục nghìn tài khoản trung gian để tránh bị phát hiện và sử dụng kỹ thuật jailbreak nhằm khai thác thông tin độc quyền, các chiến dịch phối hợp này đang trích xuất một cách có hệ thống năng lực từ các mô hình AI Mỹ, khai thác chuyên môn và sự đổi mới của Mỹ”, ông cho biết thêm.
Chưng cất là quá trình huấn luyện các mô hình AI nhỏ hơn bằng cách sử dụng đầu ra của mô hình lớn hơn như một phần nỗ lực giảm chi phí huấn luyện AI mới.
Jailbreak là kỹ thuật hoặc cách đặt câu hỏi đặc biệt để lách các quy tắc an toàn của mô hình AI, khiến nó tiết lộ thông tin nhạy cảm, nội dung bị hạn chế, hoặc hoạt động ngoài phạm vi được thiết kế ban đầu.
Nhà Trắng vừa cáo buộc Trung Quốc đánh cắp tài sản trí tuệ của các phòng thí nghiệm AI Mỹ trên quy mô công nghiệp - Ảnh: SV
Trung Quốc lên tiếng
Đại sứ quán Trung Quốc tại Washington cho biết họ phản đối “những cáo buộc vô căn cứ”, đồng thời nói thêm rằng nước này “rất coi trọng việc bảo vệ quyền sở hữu trí tuệ”.
Được công bố chỉ vài tuần trước khi Tổng thống Mỹ Donald Trump dự kiến gặp Chủ tịch Trung Quốc Tập Cận Bình tại thủ đô Bắc Kinh, bản ghi nhớ có thể làm hai siêu cường thêm căng thẳng trong cuộc chiến công nghệ kéo dài, vốn đã giảm bớt nhờ thỏa thuận hòa giải hồi tháng 10/2025.
Bản ghi nhớ gửi đến các cơ quan chính phủ Mỹ, cho biết chính quyền Trump sẽ chia sẻ thông tin với các công ty AI Mỹ về các nỗ lực chưng cất, đồng thời "khám phá hàng loạt biện pháp để buộc các tác nhân nước ngoài phải chịu trách nhiệm" về các chiến dịch này.
Văn bản trên cũng dấy lên câu hỏi liệu Mỹ có cho phép các chip AI mạnh mẽ của Nvidia được vận chuyển đến Trung Quốc hay không. Chính quyền Trump đã bật đèn xanh cho Nvidia bán chip H200 sang Trung Quốc vào tháng 1, kèm theo một số điều kiện. Tuy nhiên hôm 23/4, Bộ trưởng Thương mại Mỹ Howard Lutnick cho biết chưa có lô Nvidia H200 nào được vận chuyển đến Trung Quốc.
H200 thuộc kiến trúc Hopper, được Nvidia phát hành trước dòng Blackwell. Theo Viện Nghiên cứu Tiến bộ, chip Blackwell (B200, GB200) nhanh hơn khoảng 1,5 lần so với H200 trong huấn luyện mô hình AI và nhanh gấp 5 lần khi thực hiện các tác vụ suy luận.
OpenAI: DeepSeek chưng cất mô hình AI để xây dựng R1
Cuộc tranh cãi bắt đầu vào tháng 1/2025 khi công ty khởi nghiệp AI DeepSeek (Trung Quốc) gây chấn động ngành công nghệ với việc ra mắt mô hình suy luận R1 có hiệu năng tương đương các sản phẩm hàng đầu Mỹ như của OpenAI, Anthropic và Google, nhưng chi phí huấn luyện thấp hơn rất nhiều.
Động thái này đã làm dấy lên lo ngại tại Mỹ rằng Trung Quốc có thể bắt kịp trong cuộc đua AI bất chấp việc bị hạn chế mua chip hiệu năng cao từ Nvidia.
Sự xuất hiện của R1 góp phần kích hoạt đợt bán tháo cổ phiếu công nghệ trị giá khoảng 1.000 tỉ USD trên thị trường toàn cầu. Riêng Nvidia, công ty Mỹ chuyên cung cấp chip tiên tiến để huấn luyện các mô hình AI, mất gần 600 tỉ USD vốn hóa thị trường chỉ trong một ngày 27/1/2025.
Không lâu sau đó, OpenAI cáo buộc DeepSeek đã sử dụng kỹ thuật chưng cất mô hình AI của họ để xây dựng R1.
Về bản chất, kỹ thuật này là hợp pháp nếu được sử dụng nội bộ. Tuy nhiên, vấn đề trở nên nghiêm trọng nếu một công ty sử dụng đầu ra của mô hình đối thủ để huấn luyện sản phẩm cạnh tranh.
Đầu tháng 2/2026, OpenAI cho biết trong một bản ghi nhớ gửi Ủy ban đặc biệt của Hạ viện Mỹ về Trung Quốc rằng DeepSeek đã sử dụng kỹ thuật chưng cất liên quan đến các sản phẩm của Mỹ để huấn luyện mô hình thế hệ tiếp theo.
OpenAI thông báo: “Chúng tôi đã quan sát thấy các tài khoản liên quan đến nhân viên DeepSeek phát triển các phương thức nhằm vượt qua các hạn chế của OpenAI và truy cập các mô hình thông qua các bộ định tuyến bên thứ ba được che giấu nguồn gốc, cùng những cách khác nhằm ẩn danh nguồn truy cập”.
“Chúng tôi cũng biết rằng nhân viên DeepSeek đã phát triển mã để truy cập các mô hình AI của Mỹ và thu thập đầu ra phục vụ cho quá trình chưng cất theo cách lập trình tự động”, trích bản ghi nhớ.
Theo OpenAI, hoạt động chưng cất, phần lớn liên quan đến Trung Quốc và đôi khi là Nga, vẫn tiếp diễn và ngày càng tinh vi bất chấp các nỗ lực trấn áp những người dùng vi phạm điều khoản dịch vụ của hãng. Công ty khởi nghiệp AI hàng đầu thế giới cho biết đã quan sát thấy các hoạt động này trực tiếp trên nền tảng của mình.
Sự phổ biến của phương pháp chưng cất có thể trở thành mối đe dọa kinh doanh với các công ty Mỹ như OpenAI và Anthropic - vốn đã đầu tư hàng tỉ USD vào hạ tầng AI và thu phí các dịch vụ cao cấp. Hành vi chưng cất mô hình có thể làm suy giảm lợi thế mà Mỹ đang có trước Trung Quốc trong lĩnh vực AI.
OpenAI cũng nhấn mạnh các rủi ro an ninh quốc gia khác liên quan đến bước tiến của DeepSeek, gồm cả việc chatbot thuộc công ty này kiểm duyệt kết quả về những chủ đề bị chính phủ Trung Quốc coi là nhạy cảm. Theo OpenAI, khi các khả năng được sao chép thông qua chưng cất, các biện pháp bảo vệ thường bị bỏ qua, làm gia tăng nguy cơ các mô hình AI bị lạm dụng trong những lĩnh vực rủi ro cao như sinh học hoặc hóa học.
Anthropic: DeepSeek, Moonshot AI, MiniMax chưng cất quy mô công nghiệp
Ngày 23/2, Anthropic công bố báo cáo chi tiết cáo buộc DeepSeek, Moonshot AI và MiniMax đã tiến hành các chiến dịch chưng cất quy mô công nghiệp nhằm trích xuất năng lực từ mô hình Claude của họ.
Theo Anthropic, ba công ty AI Trung Quốc này đã tạo khoảng 24.000 tài khoản giả và thực hiện hơn 16 triệu tương tác với Claude, vi phạm điều khoản dịch vụ và hạn chế truy cập theo khu vực.
Anthropic cho biết mục tiêu của các chiến dịch này là trích xuất các khả năng cốt lõi của Claude, gồm suy luận logic, lập trình, sử dụng công cụ tự động, phân tích dữ liệu và giải quyết vấn đề phức tạp.
Anthropic tiết lộ DeepSeek đã tạo ra hơn 150.000 cuộc hội thoại tập trung vào khả năng suy luận của Claude, trong khi Moonshot AI và MiniMax lần lượt tạo ra khoảng 3,4 triệu và 13 triệu cuộc hội thoại, nhắm vào lập trình và các chức năng khác.
Dmitri Alperovitch, Chủ tịch viện nghiên cứu Silverado Policy Accelerator và đồng sáng lập hãng an ninh mạng CrowdStrike (Mỹ), nói với trang TechCrunch rằng ông không ngạc nhiên khi biết điều này.
“Trong một thời gian khá dài, rõ ràng rằng một phần lý do giúp các mô hình AI Trung Quốc tiến bộ nhanh chóng là nhờ hành vi đánh cắp thông qua kỹ thuật chưng cất từ mô hình AI tiên tiến của Mỹ. Giờ đây, chúng ta đã có bằng chứng xác thực về điều đó. Điều này càng cho chúng ta thêm lý do thuyết phục để từ chối bán bất kỳ chip AI nào cho các công ty này, vì điều đó chỉ càng mang lại lợi thế cho họ”, Dmitri Alperovitch bình luận.
Huan Sun, phó giáo sư khoa học máy tính và kỹ thuật tại Đại học Bang Ohio (Mỹ), bình luận: “Tôi không thể nghĩ ra cách nào khác để các tác giả có thể chứng minh rằng họ không chưng cất từ GPT của OpenAI”.
Khái niệm chưng cất AI đã tồn tại từ lâu. Năm 2015, ba nhà nghiên cứu, trong đó có Geoffrey Hinton - nhà khoa học được mệnh danh là “cha đẻ AI” - công bố bài viết có tiêu đề Distilling the Knowledge in a Neural Network (Chưng cất tri thức trong mạng nơ-ron), cho thấy cách tri thức từ mô hình AI lớn có thể được chuyển sang mô hình nhỏ hơn, dễ triển khai hơn.
Trong nhiều năm, các công ty AI đã sử dụng phương pháp này để tạo ra các phiên bản nhỏ hơn và hiệu quả hơn của mô hình lớn. Tuy nhiên, vấn đề nằm ở chỗ chưng cất có thể được sử dụng để sao chép năng lực từ các mô hình đối thủ mà không cần mức đầu tư tương đương.
Anthropic cảnh báo kỹ thuật này có thể cho phép các công ty nhanh chóng tái tạo các năng lực mà đối thủ đã mất nhiều năm và hàng tỉ USD để phát triển.
Sơn Vân