Chưng cất trái phép
Tuần qua, DeepSeek đã làm rung chuyển ngành công nghệ với một mô hình AI mới có khả năng cạnh tranh với các nền tảng lớn như OpenAI, trong khi được xây dựng với chi phí thấp hơn nhiều, thậm chí còn miễn phí cho người sử dụng nhờ nền tảng mã nguồn mở.
Các cố vấn hàng đầu của Nhà Trắng đã bày tỏ lo ngại rằng DeepSeek của Trung Quốc đã hưởng lợi từ một phương pháp gọi là "chưng cất dữ liệu" - sao chép những thành tựu của các đối thủ cạnh tranh để xây dựng mô hình mới của mình.
Kỹ thuật chưng cất bao gồm việc sử dụng một mô hình AI cũ hơn và mạnh mẽ hơn (chẳng hạn như OpenAI) đánh giá chất lượng câu trả lời từ một mô hình mới hơn, chuyển giao hiệu quả các bài học của mô hình cũ hơn.
Điều đó có nghĩa là mô hình mới hơn có thể tận dụng được lợi ích từ khoản đầu tư lớn về thời gian và sức mạnh tính toán của mô hình cũ hơn mà không phải chịu thêm chi phí liên quan.
Hình thức chưng cất dữ liệu này là một kỹ thuật phổ biến được sử dụng trong lĩnh vực AI. Tuy nhiên, nó vi phạm các điều khoản dịch vụ của một số mô hình nổi bật do các công ty công nghệ Mỹ đưa ra trong những năm gần đây, trong đó có OpenAI.
OpenAI nói rằng họ phát hiện có các nhóm ở Trung Quốc đang tích cực làm việc để sao chép các mô hình AI của Mỹ thông qua phương pháp chưng cất và đang xem xét liệu DeepSeek có chưng cất các mô hình của mình một cách không phù hợp hay không, một phát ngôn viên của OpenAI chia sẻ với Reuters.
Ông Howard Lutnick, người được Tổng thống Donald Trump đề cử làm Bộ trưởng Thương mại có nhiệm vụ giám sát các biện pháp kiểm soát xuất khẩu trong tương lai đối với công nghệ AI, đã nói với Thượng viện Hoa Kỳ trong phiên điều trần phê chuẩn hôm 29/1 rằng có vẻ như DeepSeek đã chiếm dụng trái phép công nghệ AI của Hoa Kỳ và tuyên bố sẽ áp đặt các hạn chế.
"Tôi không tin rằng DeepSeek được thực hiện một cách minh bạch. Điều đó thật vô lý", ông Lutnick nói. "Tôi sẽ nghiêm ngặt trong việc theo đuổi các hạn chế và thực thi các hạn chế đó để giữ chúng ta ở vị trí dẫn đầu".
David Sacks , chuyên gia AI và tiền điện tử của Nhà Trắng, cũng nêu lên mối lo ngại về việc khai thác DeepSeek trong một cuộc phỏng vấn với Fox News hôm 28/1.
Khó ngăn chặn
Các chuyên gia công nghệ cho biết việc chặn quá trình chưng cất có thể rất khó. Nguyên nhân là do các mô hình mã nguồn mở được nhiều người sử dụng. Họ tải về những dữ liệu mẫu để "chưng cất" với số lượng rất nhỏ, dữ liệu phân tán đến nhiều nơi.
Khi các sản phẩm phổ biến như ChatGPT có hàng trăm triệu người dùng, lượng truy cập nhỏ như vậy có thể khó phát hiện. Một số mô hình AI như Llama của Meta hay Mistral cho phép người dùng tải xuống miễn phí và sử dụng trong các trung tâm dữ liệu hoặc máy chủ riêng, nghĩa là việc vi phạm các điều khoản dịch vụ của họ có thể khó bị phát hiện.
Ông Umesh Padval, giám đốc điều hành tại Thomvest Ventures cho biết: "Không thể dừng việc chưng cất mô hình khi bạn có các mô hình nguồn mở như Mistral và Llama. Chúng có sẵn cho tất cả mọi người".
Reuters dẫn nguồn một chuyên gia ẩn danh nói rằng cách duy nhất để ngăn chặn các công ty như DeepSeek chưng cất dữ liệu từ các công ty Mỹ là áp dụng các yêu cầu nghiêm ngặt về việc đăng ký thông tin khách hàng, tương tự như cách các công ty tài chính xác định đối tượng kinh doanh của họ. Tuy nhiên, điều này lại ảnh hưởng đến một số quyền riêng tư cá nhân mà chưa chắc Tổng thống Donald Trump đã muốn thực hiện.
Jonathan Ross, giám đốc điều hành của Groq, một công ty điện toán AI lưu trữ các mô hình AI trên nền tảng đám mây của mình, đã chặn tất cả các địa chỉ IP của Trung Quốc truy cập vào nền tảng đám mây của mình, nhằm ngăn ngừa việc lợi dụng các mô hình AI mà công ty này đang lưu trữ.
Tuy nhiên, chính ông Ross cũng thừa nhận rằng việc này không hề hiệu quả bởi người ta sẽ tìm ra cách để không sử dụng IP Trung Quốc.
"Nó giống như một trò chơi mèo vờn chuột. Nếu ai có giải pháp, hãy cho chúng tôi biết, chúng tôi sẽ thực hiện", ông Ross nói.
Theo Reuters
Đăng Khoa