Vào tháng 11.2025, TSMC (Đài Loan) đã ngừng vận chuyển chip AI cho khách hàng ở Trung Quốc sau khi được chính phủ Mỹ yêu cầu. Yêu cầu này được đưa ra sau khi một chip do TSMC sản xuất được phát hiện bên trong bộ xử lý AI của Huawei. Bằng cách cấm vận chuyển các chip AI tiên tiến được sản xuất bằng quy trình 7 nanomet trở xuống, TSMC chỉ đơn giản là tuân theo các lệnh trừng phạt của Mỹ.
Nanomet là đơn vị đo chiều dài cực nhỏ, được sử dụng để đo kích thước của các thành phần bên trong chip. Khi bạn thấy các con số như 7 nanomet, 5 nanomet hay 3 nanomet trong thông số kỹ thuật của chip, đó chính là cách để chỉ ra kích thước của các bóng bán dẫn (transistor) bên trong nó.
Vì sao kích thước nanomet lại quan trọng?
Kích thước càng nhỏ, hiệu năng càng cao: Khi các bóng bán dẫn càng nhỏ, chúng ta có thể tích hợp được nhiều bóng bán dẫn hơn vào cùng một diện tích chip. Điều này dẫn đến:
- Tăng tốc độ xử lý: Chip có nhiều bóng bán dẫn hơn sẽ thực hiện được nhiều phép tính hơn trong cùng một khoảng thời gian.
- Giảm tiêu thụ điện năng: Bóng bán dẫn nhỏ hơn tiêu thụ ít điện năng hơn.
- Giảm kích thước chip: Chip nhỏ gọn hơn giúp thiết bị điện tử trở nên nhỏ bé và nhẹ nhàng hơn.
- Đo lường độ phức tạp của công nghệ sản xuất: Các quy trình sản xuất chip với kích thước nanomet càng nhỏ càng đòi hỏi công nghệ sản xuất phức tạp và chính xác cao.
Ví dụ, chip 7 nanomet nghĩa là các bóng bán dẫn bên trong chip đó có kích thước trung bình khoảng 7 nanomet. Chip 3 nanomet nghĩa là các bóng bán dẫn bên trong chip đó có kích thước trung bình khoảng 3 nanomet. Rõ ràng chip 3 nanomet sẽ có hiệu năng cao hơn, tiêu thụ ít điện năng hơn và nhỏ gọn hơn so với chip 7 nanomet.
Tóm lại, nanomet là thông số quan trọng để đánh giá hiệu năng của chip. Kích thước nanomet càng nhỏ, chip càng mạnh mẽ và hiệu quả.
Hiện tại là tháng 2.2025 và TSMC vừa bổ sung một số hạn chế mới nhằm ngăn chặn các chip mạnh mẽ dùng để huấn luyện AI rơi vào tay Trung Quốc. Có hiệu lực từ ngày 31.1, các hạn chế mới nhất sẽ ngăn công ty thiết kế chip không có xưởng sản xuất (fabless) ở Trung Quốc đặt hàng TSMC tạo ra chip bằng quy trình 16 nanomet trở xuống, trừ khi họ sử dụng một đơn vị đóng gói do chính phủ Mỹ phê duyệt.
Fabless là thuật ngữ dùng để chỉ các công ty thiết kế chip nhưng không sở hữu nhà máy sản xuất (fab). Các fabless thuê các xưởng đúc bán dẫn như TSMC, Samsung Foundry hoặc Intel Foundry Services để sản xuất chip dựa trên thiết kế của họ. Nvidia, AMD, Qualcomm, MediaTek, Broadcom là ví dụ về các fabless nổi tiếng.
Các fabless thường tập trung vào nghiên cứu, phát triển kiến trúc và thiết kế vi mạch, trong khi quá trình sản xuất thực tế được thực hiện bởi xưởng đúc chuyên biệt như TSMC hoặc Samsung Foundry.
Lệnh trừng phạt từ Mỹ hiện yêu cầu công ty Trung Quốc phải sử dụng các nhà lắp ráp và kiểm tra bán dẫn (OSAT) có trong danh sách trắng của Mỹ để nhận những chip do TSMC sản xuất. Các quy tắc mới của Mỹ cũng ngăn chặn việc xuất khẩu sang Trung Quốc những chip có hơn 30 tỉ transistor được sản xuất bằng quy trình 16 nanomet trở xuống, trừ khi nhận được giấy phép từ Bộ Thương mại Mỹ.
Các GPU (bộ xử lý đồ họa) phổ thông mà trước đây AMD, Intel và Nvidia từng bán cho các công ty Trung Quốc mà không bị hạn chế, nay sẽ cần có giấy phép để vận chuyển sang Trung Quốc. Điều đáng chú ý là trong một số trường hợp, các hạn chế của TSMC thậm chí còn nghiêm ngặt hơn so với các quy định do Mỹ áp đặt.
TSMC vừa bổ sung một số hạn chế mới nhằm ngăn chặn các chip AI đến Trung Quốc - Ảnh: Internet
Theo công ty khởi nghiệp DeepSeek (Trung Quốc), mô hình ngôn ngữ lớn V3 của họ đã được huấn luyện bằng 2.048 GPU Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Năm 2022, chính quyền Biden đã hạn chế việc bán H100, chip AI mạnh nhất của Nvidia thời điểm đó, cho Trung Quốc. Sau đó, Nvidia phát hành biến thể chip A1 mới là H800, có hiệu suất dưới ngưỡng xuất khẩu để phục vụ thị trường Trung Quốc. Tuy nhiên, H800 bị hạn chế hồi năm 2023 và Nvidia tiếp tục tung ra H20 vào năm ngoái.
Được sản xuất bằng quy trình 4 nanomet, Nvidia H800 có tới 80 tỉ transistor, giúp chip này mạnh mẽ và tiết kiệm năng lượng.
Vì Nvidia H800 có số lượng transistor gần gấp ba lần mức giới hạn 30 tỉ và được sản xuất bằng quy trình 4 nanomet, DeepSeek đáng lẽ cần phải có giấy phép để mua chip này. Tuy nhiên, công ty khởi nghiệp Trung Quốc đã không được cấp giấy phép như vậy.
Kết quả là FBI (Cục Điều tra Liên bang Mỹ) và Nhà Trắng đang điều tra cách mà DeepSeek có được Nvidia H800. Giả thuyết cho rằng một bên trung gian ở Singapore có liên quan. Dù Nvidia gần đây tuyên bố không tin rằng DeepSeek đã vi phạm pháp luật, hãng chip AI số 1 thế giới của Mỹ cũng khẳng định rằng các đối tác phải tuân thủ luật pháp.
Hôm 31.1, Reuters đưa tin Bộ Thương mại Mỹ đang điều tra xem liệu DeepSeek có đang sử dụng chip của Mỹ bị cấm xuất khẩu sang Trung Quốc hay không.
Chính quyền Trump đang xem xét thắt chặt các hạn chế với việc Nvidia bán dòng chip H20 được thiết kế riêng cho thị trường Trung Quốc, theo ba nguồn tin quen thuộc với vấn đề này nói với Reuters.
Các cuộc thảo luận trong nội bộ chính quyền Trump về việc hạn chế xuất khẩu Nvidia H20 sang Trung Quốc vẫn đang ở giai đoạn đầu, theo các nguồn tin, nhưng ý tưởng này đã được xem xét từ thời chính quyền Joe Biden.
Hai nghị sĩ Mỹ cũng kêu gọi siết chặt hơn nữa việc xuất khẩu chip AI của Nvidia. Nghị sĩ Cộng hòa John Moolenaar và nghị sĩ Dân chủ Raja Krishnamoorthi, lãnh đạo Ủy ban đặc biệt về Trung Quốc tại Hạ viện, đã yêu cầu thực hiện động thái này như một phần của cuộc rà soát do Bộ Thương mại và Bộ Ngoại giao Mỹ thực hiện theo lệnh từ ông Trump nhằm kiểm tra hệ thống kiểm soát xuất khẩu của Mỹ trong bối cảnh "những diễn biến liên quan đến các đối thủ chiến lược".
"Chúng tôi kêu gọi hãy nghĩ về lợi ích quốc gia khi áp đặt hạn chế xuất khẩu Nvidia H20 và các loại chip có độ tinh vi tương tự", trích nội dung thư mà hai nghị sĩ Mỹ gửi cho cố vấn an ninh quốc gia Michael Waltz.
Trong thư, John Moolenaar và Raja Krishnamoorthi cho rằng các mô hình AI của DeepSeek được phát triển bằng Nvidia H20, hiện nằm ngoài phạm vi mặt hàng bị Mỹ kiểm soát xuất khẩu.
DeepSeek sở hữu hàng chục ngàn GPU Nvidia
DeepSeek được tách ra vào năm 2023 từ High-Flyer, công ty quản lý quỹ đầu tư. Doanh nhân đứng sau DeepSeek là ông Liang Wenfeng, người sáng lập High-Flyer và DeepSeek, từng nghiên cứu về AI tại Đại học Chiết Giang (Trung Quốc).
Lượng sức mạnh tính toán mà DeepSeek sử dụng để huấn luyện mô hình nguồn mở V3 và R1 đã trở thành chủ đề thu hút sự quan tâm mạnh mẽ từ các chuyên gia AI và nhà đầu tư, vì câu trả lời có thể ảnh hưởng lớn đến sự phát triển của công nghệ này trong tương lai.
Trong một bài viết về V3, ra mắt vào tháng 12.2024, DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, chỉ bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.
Một số chuyên gia đã đặt nghi vấn về tuyên bố của DeepSeek.
Chuyên gia Stacy Rasgon của hãng Bernstein và các nhà phân tích khác cho rằng chi phí đào tạo V3 của DeepSeek có thể cao hơn, vì con số 6 triệu USD được công ty này công bố chỉ là chi phí cho sức mạnh tính toán.
Dù vậy, con số này vẫn khác xa so với 250 tỉ USD mà các nhà phân tích ước tính các công ty điện toán đám mây lớn Mỹ sẽ chi tiêu trong năm 2025 cho cơ sở hạ tầng AI.
R1, mô hình lập luận mã nguồn mở của DeepSeek được phát hành vào ngày 20.1, thể hiện năng lực tương đương với các mô hình tiên tiến hơn từ OpenAI, Anthropic và Google, nhưng chi phí đào tạo thấp hơn đáng kể. Tuy nhiên, bài viết của DeepSeek về R1 không đề cập đến chi phí phát triển.
Các mô hình DeepSeek có chi phí thấp và hiệu suất mạnh mẽ làm dấy lên nghi ngờ về sự cần thiết của khoản đầu tư khổng lồ từ các gã khổng lồ công nghệ Mỹ, đặc biệt là vào chip AI đắt đỏ. Điều này đã dẫn đến đợt bán tháo lớn cổ phiếu Nvidia vào tuần trước, khiến vốn hóa hãng chip AI hàng đầu của Mỹ giảm gần 600 tỉ USD chỉ trong một ngày.
DeepSeek chi nhiều tiền để mua hàng chục ngàn GPU Nvidia - Ảnh: Internet
Các hồ sơ cho thấy DeepSeek là một trong những đơn vị có nguồn lực mạnh nhất để đào tạo AI. Ngay từ năm 2019, Liang Wenfeng đã chi 200 triệu nhân dân tệ (27,8 triệu USD) để mua 1.100 GPU nhằm đào tạo các thuật toán giao dịch chứng khoán. High-Flyer cho biết trung tâm điện toán của DeepSeek vào thời điểm đó có diện tích tương đương một sân bóng rổ, khoảng 436,6 mét vuông.
Năm 2021, High-Flyer đã chi 1 tỉ nhân dân tệ để phát triển cụm siêu máy tính Fire-Flyer 2, được kỳ vọng đạt công suất 1.550 petaflop, theo trang web của quỹ. Hiệu suất này tương đương với một số siêu máy tính mạnh nhất thế giới.
Petaflop là một đơn vị đo lường hiệu suất tính toán của siêu máy tính, viết tắt của Peta Floating Point Operations Per Second (nghìn nghìn tỉ phép toán dấu phẩy động mỗi giây).
Trong cuộc phỏng vấn với trang tin công nghệ 36Kr (Trung Quốc) vào tháng 5.2023, Liang Wenfeng cho biết High-Flyer đã mua gần 10.000 GPU Nvidia, gồm cả dòng A100 tiên tiến nhất vào thời điểm đó, trước khi Mỹ áp đặt hạn chế xuất khẩu loại chip này sang Trung Quốc.
Một số nhà phân tích xác định rằng việc High-Flyer chi tiêu mạnh vào phần cứng là yếu tố quan trọng giúp DeepSeek trở thành "ngựa ô" trong cuộc đua AI toàn cầu.
Trong một báo cáo, hãng nghiên cứu SemiAnalysis (Mỹ) ước tính rằng tổng chi tiêu phần cứng của DeepSeek "vượt xa mức 500 triệu USD trong suốt lịch sử công ty", gồm cả chi phí nghiên cứu và phát triển cũng như tổng chi phí sở hữu phần cứng.
Theo SemiAnalysis, tổng chi tiêu vốn cho máy chủ của DeepSeek có thể đã lên đến 1,6 tỉ USD với khoảng 50.000 GPU Nvidia Hopper, gồm cả chi phí vận hành 944 triệu USD cho các cụm tính toán.
Dù vậy, các nhà phân tích lưu ý rằng sự đổi mới của DeepSeek trong lĩnh vực phần mềm đã chứng minh rằng hiệu suất mô hình không tỷ lệ thuận với số tiền mà công ty chi cho GPU đắt tiền.
Sơn Vân