Alibaba, ByteDance huấn luyện mô hình AI mới ở Đông Nam Á để tiếp cận chip Nvidia

Alibaba, ByteDance huấn luyện mô hình AI mới ở Đông Nam Á để tiếp cận chip Nvidia
một giờ trướcBài gốc
Theo hai nguồn tin của trang FT, Alibaba và ByteDance nằm trong số các hãng công nghệ lớn Trung Quốc đang huấn luyện những mô hình ngôn ngữ lớn (công nghệ nền tảng cho chatbot AI) mới nhất tại trung tâm dữ liệu ở khắp Đông Nam Á.
Các nguồn tin này cho biết, việc huấn luyện mô hình ngôn ngữ lớn ở nước ngoài đã gia tăng đều đặn sau khi chính quyền Tổng thống Trump hồi tháng 4 áp đặt hạn chế với việc bán H20 - loại chip AI của Nvidia dành riêng cho thị trường Trung Quốc.
"Đến đây là một lựa chọn hiển nhiên. Bạn cần những chip tốt nhất để huấn luyện các mô hình AI tiên tiến nhất, và tất cả đều tuân thủ pháp luật", nhà điều hành trung tâm dữ liệu có trụ sở tại Singapore cho biết.
Năm nay, Qwen của Alibaba và Doubao của ByteDance là những mô hình AI có hiệu năng hàng đầu Trung Quốc. Qwen cũng được giới lập trình viên bên ngoài Trung Quốc sử dụng rộng rãi vì đây là mô hình mở và được cung cấp miễn phí.
Alibaba, ByteDance là hai trong các hãng công nghệ lớn Trung Quốc huấn luyện mô hình AI mới ở Đông Nam Á để tiếp cận chip AI Nvidia - Ảnh: FT
Các cụm trung tâm dữ liệu ở Singapore và Malaysia đã phát triển mạnh mẽ nhờ nhu cầu lớn từ Trung Quốc. Nhiều trung tâm dữ liệu trong số này được trang bị chip AI Nvidia cao cấp, giống loại mà các tập đoàn công nghệ lớn Mỹ sử dụng để huấn luyện mô hình ngôn ngữ lớn.
Theo những người am hiểu về vấn đề này, các công ty Trung Quốc thường ký hợp đồng thuê để sử dụng các trung tâm dữ liệu ở nước ngoài do các thực thể không phải của Trung Quốc sở hữu và vận hành. Cách làm này không vi phạm quy định kiểm soát xuất khẩu của Mỹ, vì “quy tắc khuếch tán” dưới thời chính quyền Biden nhằm bịt lỗ hổng này đã bị Tổng thống Trump bãi bỏ hồi đầu năm nay.
"Quy tắc khuếch tán" là quy định được thiết kế để ngăn Trung Quốc tiếp cận chip AI mạnh của Mỹ bằng cách “vòng” qua các trung tâm dữ liệu ở nước ngoài. Cụ thể hơn, khi chip AI Nvidia không được xuất khẩu trực tiếp sang Trung Quốc thì việc các công ty Trung Quốc dùng chúng thông qua các trung tâm dữ liệu ở nước khác (chẳng hạn Singapore, Malaysia) cũng sẽ bị xem là vi phạm.
DeepSeek là ngoại lệ
Một trường hợp ngoại lệ là công ty khởi nghiệp DeepSeek, vốn đang huấn luyện mô hình AI của mình trong nước, theo FT.
DeepSeek đã xây dựng được một cụm lớn chip AI Nvidia trước khi lệnh cấm xuất khẩu của Mỹ có hiệu lực. Ngoài ra, DeepSeek hợp tác chặt chẽ với các hãng chip nội địa, đứng đầu là Huawei, để tối ưu hóa và phát triển thế hệ chip AI Trung Quốc tiếp theo.
Huawei có một đội ngũ kỹ sư làm việc thường trực tại trụ sở của DeepSeek ở thành phố Hàng Châu (Trung Quốc). Huawei coi quan hệ đối tác này là nỗ lực chiến lược nhằm thúc đẩy hệ thống bán dẫn và phần mềm của mình để phục vụ việc huấn luyện AI trên toàn quốc.
Trong hai tháng cuối năm 2024 và đầu 2025, DeepSeek phát hành V3 và R1, hai mô hình AI nguồn mở có hiệu suất ngang sản phẩm Mỹ với chi phí huấn luyện thấp hơn rất nhiều. Điều này khiến giới đầu tư toàn cầu bán tháo cổ phiếu công nghệ vì lo ngại DeepSeek có thể đe dọa vị thế thống trị của những hãng AI lớn như OpenAI, Google, Microsoft và ảnh hưởng đến doanh số chip AI của Nvidia. Chỉ trong ngày 17.1, cổ phiếu của Nvidia giảm 17%, tương đương 600 tỉ USD vốn hóa bị mất đi, mức thiệt hại lớn nhất một ngày trong lịch sử doanh nghiệp Mỹ.
Hồi tháng 9, DeepSeek cho biết chỉ mất 294.000 USD để huấn luyện mô hình suy luận R1, con số thấp hơn nhiều so với mức được các đối thủ Mỹ bỏ ra.
Đầu năm nay, DeepSeek tiết lộ huấn luyện mô hình nền tảng V3 chỉ bằng 2.048 GPU Nvidia H800 khoảng hai tháng, với chi phí 5,6 triệu USD. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Việc huấn luyện mô hình ngôn ngữ lớn đòi hỏi lượng sức mạnh điện toán khổng lồ để xử lý dữ liệu lớn, khiến hầu hết tập đoàn Trung Quốc ưu tiên chip AI tiên tiến của Nvidia cho việc đó.
Tuy nhiên, các công ty này càng dần chuyển sang sử dụng chip Trung Quốc cho giai đoạn suy luận, khi mô hình AI phản hồi yêu cầu của người dùng. Phần việc này đang chiếm tỷ trọng ngày càng tăng trong tổng khối lượng công việc mà mô hình AI phải xử lý.
Ngoài hoạt động huấn luyện mô hình AI, các hãng công nghệ Trung Quốc còn sử dụng trung tâm dữ liệu ở Đông Nam Á để phục vụ khách hàng quốc tế, khi Alibaba và ByteDance tìm cách mở rộng thị phần điện toán đám mây toàn cầu. Họ cũng mở rộng việc tiếp cận trung tâm dữ liệu ở các khu vực khác, chẳng hạn Trung Đông.
Một hạn chế là các tập đoàn công nghệ Trung Quốc không được phép chuyển dữ liệu riêng tư ra khỏi lãnh thổ. Điều này có nghĩa là để tùy chỉnh một mô hình AI dựa trên dữ liệu cụ thể do khách hàng địa phương cung cấp, việc huấn luyện cần phải được thực hiện tại Trung Quốc, theo những người trong ngành.
Alibaba, ByteDance, DeepSeek và Huawei không phản hồi khi trang FT đề nghị bình luận. Nvidia từ chối bình luận.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/alibaba-bytedance-huan-luyen-mo-hinh-ai-moi-o-dong-nam-a-de-tiep-can-chip-nvidia-241603.html