Theo đó, OpenAI cho, biết đã thấy một số bằng chứng nghi ngờ từ DeepSeek về việc thực hiện chưng cất mô hình (Distillation - giảm kích thước mô hình nhưng vẫn giữ hiệu suất cao).
Kỹ thuật này được các nhà phát triển sử dụng để có hiệu suất tốt hơn trên các mô hình nhỏ hơn bằng cách sử dụng kết quả đầu ra từ các mô hình lớn hơn và cho phép chúng đạt được kết quả tương tự trên các tác vụ cụ thể với chi phí thấp hơn nhiều.
Chưng cất mô hình là hoạt động phổ biến trong ngành nhưng mối lo ngại là DeepSeek có thể đang thực hiện điều đó để xây dựng nguồn mở, và điều này vi phạm các điều khoản dịch vụ của OpenAI.
Điều khoản dịch vụ của OpenAI nêu rõ người dùng không được sao chép bất kỳ dịch vụ nào hoặc sử dụng kết quả đầu ra để phát triển các mô hình cạnh tranh với OpenAI.
Việc DeepSeek phát hành mô hình lý luận R1 đã gây sốc cho thị trường, cũng như các nhà đầu tư và công ty công nghệ ở Thung lũng Silicon. Các mô hình được xây dựng trên nguồn mở của họ đã đạt được thứ hạng cao và kết quả tương đương với các mô hình hàng đầu của Mỹ.
Cổ phiếu của Nvidia đã bị bán tháo vào đầu tuần này do lo ngại rằng các khoản đầu tư lớn vào phần cứng AI đắt tiền của công ty có thể không cần thiết.
Trong khi đó, OpenAI và đối tác Microsoft đã điều tra các tài khoản được cho là của DeepSeek, những tài khoản này sử dụng giao diện lập trình ứng dụng (API) của OpenAI và chặn quyền truy cập của họ vì nghi ngờ có hành vi chưng cất vi phạm các điều khoản dịch vụ.
Trước đó, ông trùm tiền điện tử Nhà Trắng, David Sacks đã nói rằng có khả năng đã xảy ra hành vi trộm cắp IP.
“Có một kỹ thuật trong AI gọi là chưng cất… khi một mô hình học hỏi từ một mô hình khác và loại bỏ kiến thức ra khỏi mô hình mẹ…Và có bằng chứng đáng kể cho thấy những gì DeepSeek đã làm ở đây là họ đã chưng cất kiến thức ra khỏi các mô hình OpenAI, và tôi không nghĩ OpenAI thực sự vui về điều này”, ông cho biết.
DeepSeek cho biết, họ chỉ sử dụng 2.048 card đồ họa Nvidia H800 và chi 5,6 triệu USD để đào tạo mô hình của mình với 671 tỷ tham số, chỉ bằng một phần nhỏ so với số tiền mà OpenAI và Google đã chi để đào tạo các mô hình có quy mô tương đương. Một số chuyên gia cho biết mô hình đã tạo ra các phản hồi cho thấy nó đã được đào tạo trên các đầu ra từ GPT-4 của OpenAI, điều này sẽ vi phạm các điều khoản dịch vụ của OpenAI.
Những người trong ngành cho biết các phòng thí nghiệm AI ở Trung Quốc và Mỹ thường sử dụng kết quả từ các công ty như OpenAI, cụ thể là những công ty đã đầu tư vào việc thuê người để dạy các mô hình cách tạo ra phản hồi nghe giống con người hơn. Theo những người trong ngành, cách này tốn kém và đòi hỏi nhiều nhân lực, và những công ty nhỏ hơn thường tận dụng công việc này.
Ritwik Gupta, nghiên cứu sinh tiến sĩ về AI tại Đại học California cho biết: "Các công ty khởi nghiệp và học giả thường sử dụng kết quả từ các chương trình ngôn ngữ lớn thương mại liên kết với con người, như ChatGPT để đào tạo một mô hình khác…Điều đó có nghĩa là họ được hưởng bước phản hồi của con người này miễn phí. Tôi không ngạc nhiên khi DeepSeek được cho là sẽ làm như vậy. Nếu họ làm vậy, việc dừng chính xác hoạt động này có thể rất khó khăn".
Hoạt động này cũng nêu bật khó khăn đối với các công ty muốn bảo vệ lợi thế kỹ thuật của mình. OpenAI cho biết trong tuyên bố mới nhất rằng: "Chúng tôi biết các công ty có trụ sở tại Trung Quốc và các công ty khác liên tục cố gắng chắt lọc các mô hình của các công ty AI hàng đầu của Mỹ".
“Chúng tôi tham gia vào các biện pháp đối phó để bảo vệ IP của mình, bao gồm một quy trình cẩn thận về các AI tiên tiến nhất để đưa vào các mô hình đã phát hành…và điều cực kỳ quan trọng là chúng tôi đang hợp tác chặt chẽ với chính phủ Mỹ để bảo vệ tốt nhất các mô hình hiệu quả nhất khỏi các nỗ lực của đối thủ cạnh tranh nhằm nắm bắt công nghệ của Mỹ”, OpenAI cho biết.
Mặt khác, OpenAI đang phải đối mặt với cáo buộc vi phạm bản quyền từ các tờ báo và người sáng tạo nội dung, bao gồm các vụ kiện từ tờ The New York Times và các tác giả nổi tiếng, những người cáo buộc công ty đào tạo mô hình dựa trên các bài viết và sách của họ mà không được phép.
Hạc Hiên / Theo báo chí nước ngoài