Các ông lớn OpenAI, Microsoft, Meta chạy đua tạo mô hình AI giá rẻ

Các ông lớn OpenAI, Microsoft, Meta chạy đua tạo mô hình AI giá rẻ
3 giờ trướcBài gốc
Sự đột phá của DeepSeek đã làm rung chuyển niềm tin vào vị thế dẫn đầu của Thung lũng Silicon
Các công ty hàng đầu về trí tuệ nhân tạo (AI) như OpenAI, Microsoft và Meta đang chuyển hướng sang một kỹ thuật gọi là “chưng cất” (distillation) trong cuộc đua toàn cầu nhằm tạo ra các mô hình AI rẻ hơn, dễ tiếp cận hơn cho người dùng và doanh nghiệp.
Kỹ thuật này trở thành tâm điểm chú ý sau khi DeepSeek – một công ty Trung Quốc – sử dụng nó để xây dựng các mô hình AI mạnh mẽ và hiệu quả từ hệ thống mã nguồn mở của Meta và Alibaba.
Sự đột phá của DeepSeek đã làm rung chuyển niềm tin vào vị thế dẫn đầu của Thung lũng Silicon, khiến giới đầu tư Phố Wall xóa sổ hàng tỷ USD giá trị cổ phiếu của các gã khổng lồ công nghệ Mỹ.
“CHƯNG CẤT” – BÍ QUYẾT THU NHỎ MÔ HÌNH AI
“Chưng cất” là quá trình lấy một mô hình ngôn ngữ lớn – gọi là “mô hình thầy” (teacher model) – chuyên dự đoán từ tiếp theo trong câu, để tạo dữ liệu huấn luyện một mô hình nhỏ hơn – tức “mô hình học sinh” (student model). Qua đó, kiến thức và khả năng dự đoán của mô hình lớn được chuyển giao nhanh chóng sang mô hình nhỏ.
Olivier Godement, trưởng bộ phận sản phẩm nền tảng của OpenAI, mô tả: “Chưng cất giống như phép thuật. Nó lấy một mô hình thông minh khổng lồ để dạy cho một mô hình nhỏ hơn, rất giỏi trong các nhiệm vụ cụ thể, lại siêu rẻ và siêu nhanh khi chạy”.
Dù kỹ thuật này đã được dùng nhiều năm, những tiến bộ gần đây khiến các chuyên gia tin rằng nó sẽ trở thành lợi thế lớn cho các startup, giúp họ xây dựng ứng dụng AI chi phí thấp. Các mô hình ngôn ngữ lớn như GPT-4 của OpenAI, Gemini của Google hay Llama của Meta đòi hỏi dữ liệu khổng lồ và sức mạnh tính toán đắt đỏ để phát triển – ước tính hàng trăm triệu USD, dù các công ty không công bố con số chính xác.
Nhờ chưng cất, doanh nghiệp và nhà phát triển có thể tiếp cận sức mạnh của những mô hình này với chi phí chỉ bằng một phần nhỏ, chạy nhanh trên laptop hay smartphone.
OpenAI đã mở nền tảng chưng cất, cho phép học từ các mô hình lớn như ChatGPT. Microsoft – nhà đầu tư lớn nhất của OpenAI với gần 14 tỷ USD – cũng dùng GPT-4 để chưng cất dòng mô hình nhỏ Phi trong một hợp tác thương mại. Tuy nhiên, OpenAI nghi ngờ DeepSeek đã chưng cất mô hình của họ để tạo ra đối thủ cạnh tranh – hành động vi phạm điều khoản dịch vụ. DeepSeek chưa phản hồi về cáo buộc này.
ƯU ĐIỂM VÀ HẠN CHẾ CỦA MÔ HÌNH CHƯNG CẤT
Mô hình chưng cất mang lại hiệu suất cao với chi phí thấp, nhưng cũng có giới hạn. Ahmed Awadallah từ Microsoft Research giải thích: “Chưng cất là một sự đánh đổi. Khi thu nhỏ mô hình, bạn khó tránh khỏi việc giảm khả năng của nó”. Ví dụ, một mô hình nhỏ qua chưng cất có thể giỏi tóm tắt email, nhưng sẽ kém ở các nhiệm vụ khác như sáng tác văn bản phức tạp.
Khi chi phí giảm, khả năng tiếp cận tăng, tương lai của AI không chỉ nằm ở sức mạnh tính toán mà còn ở sự sáng tạo và linh hoạt trong việc mang công nghệ đến tay người dùng. Hình minh họa về kỹ thuật chưng cất AI
David Cox, Phó Chủ tịch mảng mô hình AI tại IBM Research, cho rằng phần lớn doanh nghiệp không cần mô hình khổng lồ. “Các mô hình chưng cất đủ mạnh cho chatbot dịch vụ khách hàng hay chạy trên điện thoại. Nếu rẻ hơn mà vẫn đáp ứng nhu cầu, chẳng có lý do gì không dùng”, ông nói.
Điều này thách thức mô hình kinh doanh của các công ty AI lớn như OpenAI, vốn kiếm lợi nhuận từ sức mạnh tính toán cao. Mô hình nhỏ rẻ hơn, tốn ít tài nguyên hơn, nhưng cũng mang lại doanh thu thấp hơn khi các hãng thường giảm giá dịch vụ cho chúng.
Tuy nhiên, Godement của OpenAI lập luận rằng mô hình lớn vẫn cần thiết cho các nhiệm vụ đòi hỏi trí thông minh cao và độ chính xác tuyệt đối, như y tế hay tài chính – nơi doanh nghiệp sẵn sàng trả phí cao. Ông nhấn mạnh: “Mô hình lớn cũng là nền tảng để khám phá khả năng mới, sau đó chưng cất cho mô hình nhỏ hơn.”
CẠNH TRANH GAY GẮT VÀ CÂU HỎI VỀ TƯƠNG LAI AI
Sự trỗi dậy của DeepSeek đặt ra vấn đề bảo vệ công nghệ. OpenAI đã lập đội giám sát, có thể khóa tài khoản nếu nghi ngờ ai đó tạo dữ liệu hàng loạt để huấn luyện đối thủ – như họ tin DeepSeek đã làm. Nhưng Douwe Kiela từ Contextual AI nhận xét: “OpenAI cố gắng ngăn chưng cất từ lâu, nhưng rất khó tránh hoàn toàn”.
Chưng cất còn là thắng lợi cho mô hình mã nguồn mở. DeepSeek công khai mô hình của mình, theo tinh thần mà Yann LeCun – nhà khoa học AI trưởng của Meta – ủng hộ: “Mã nguồn mở cho phép mọi người hưởng lợi từ tiến bộ của nhau”.
Nhưng điều này cũng đặt ra câu hỏi về lợi thế tiên phong. Chuyên gia Cox từ IBM cảnh báo: “Bạn có thể chi hàng tỷ USD để dẫn đầu, nhưng đối thủ nhanh chóng bắt kịp nhờ chưng cất. Đây là một sân chơi kinh doanh đầy thách thức”.
Các công ty lớn như Google, Meta và OpenAI vẫn dẫn đầu, nhưng áp lực từ startup như DeepSeek và xu hướng chưng cất cho thấy cuộc đua AI đang thay đổi. Khi chi phí giảm, khả năng tiếp cận tăng, tương lai của AI không chỉ nằm ở sức mạnh tính toán mà còn ở sự sáng tạo và linh hoạt trong việc mang công nghệ đến tay người dùng.
Hoàng Hà
Nguồn VnEconomy : https://vneconomy.vn/cac-ong-lon-openai-microsoft-meta-chay-dua-tao-mo-hinh-ai-gia-re.htm