CEO Jensen Huang: Nvidia chưa nhận được đề nghị mua cổ phần Intel từ TSMC, nhu cầu chip Blackwell rất lớn

CEO Jensen Huang: Nvidia chưa nhận được đề nghị mua cổ phần Intel từ TSMC, nhu cầu chip Blackwell rất lớn
18 giờ trướcBài gốc
Tại một cuộc họp báo trong hội nghị thường niên dành cho nhà phát triển của Nvidia diễn ra ở thành phố San Jose (bang California, Mỹ), ông Jensen Huang được hỏi liệu Nvidia có tham gia một liên doanh với TSMC để mua cổ phần Intel hay không.
"Không ai mời chúng tôi tham gia vào một liên doanh cả. Không ai mời tôi. Có thể có người khác tham gia, nhưng tôi không biết. Có thể có một bữa tiệc nào đó, nhưng tôi không được mời", Giám đốc điều hành Nvidia trả lời.
Trước đó, hôm 12.3, Reuters đưa tin TSMC (hãng sản xuất chip theo hợp đồng số 1 thế giới của Đài Loan) đã tiếp cận Nvidia, Broadcom và AMD về việc mua cổ phần trong một liên doanh vận hành các nhà máy của Intel. Các phương tiện truyền thông khác trước đây cũng đưa tin Intel, với sự hậu thuẫn của Tổng thống Mỹ Donald Trump, đang xem xét kế hoạch tách riêng hoạt động sản xuất và giao quyền kiểm soát cho một liên doanh có TSMC.
Sau phát biểu của Jensen Huang, cổ phiếu cả Nvidia và Intel đều không có nhiều biến động trong giao dịch ngoài giờ.
Ông Jensen Huang phát biểu tại hội nghị công nghệ GPU Nvidia ở San Jose - Ảnh: Reuters
Nhu cầu chip Blackwell rất lớn
Trong một phiên hỏi đáp với các nhà phân tích tài chính, Jensen Huang cho biết đơn đặt hàng khoảng 3,6 triệu chip trí tuệ nhân tạo (AI) Blackwell, dòng chip chủ lực của Nvidia, từ bốn nhà cung cấp dịch vụ đám mây hàng đầu vẫn chưa phản ánh đầy đủ nhu cầu thực tế, vì chưa gồm cả các đơn từ khách hàng lớn như Meta Platforms, các nhà cung cấp đám mây nhỏ hơn và công ty khởi nghiệp.
Meta Platforms, công ty mẹ Facebook, là một trong những khách hàng mua nhiều chip Nvidia nhất. Mark Zuckerberg, Giám đốc điều hành Meta Platforms, tuyên bố đầu năm ngoái rằng công ty dự định sử dụng chip Blackwell để huấn luyện các mô hình ngôn ngữ nguồn mở Llama của mình.
Meta Platforms dự kiến sẽ chi tới 60 - 65 tỉ USD cho cơ sở hạ tầng AI vào năm nay, trong đó một phần lớn sẽ dành cho chip Nvidia. Các gã khổng lồ công nghệ khác cũng cam kết đầu tư mạnh vào AI để cạnh tranh phát triển sản phẩm tốt nhất.
Jensen Huang tìm cách trấn an các nhà đầu tư trước lo ngại về nhu cầu giảm với dòng chip AI đắt đỏ của Nvidia, sau khi công ty khởi nghiệp DeepSeek (Trung Quốc) tung ra các mô hìnhnguồn mở V3 và R1 có hiệu suất cao với chi phí thấp hơn các đối thủ ở Mỹ rất nhiều.
Cổ phiếu Nvidia từng giảm 17% chỉ trong ngày 17.1 chủ yếu vì thông tin DeepSeek đào tạo V3 chỉ bằng 2.048 GPU Nvidia H800 trong vòng hai tháng. Đây không phải là loại chip AI hàng đầu của Nvidia. Ban đầu H800 được Nvidia phát triển như một sản phẩm giảm hiệu năng để vượt qua các hạn chế từ chính quyền Biden với mục đích bán cho thị trường Trung Quốc, song sau đó bị cấm theo lệnh trừng phạt của Mỹ.
Trong một bài viết về V3, DeepSeek tuyên bố rằng quá trình huấn luyện mô hình này chỉ tiêu tốn 2,8 triệu giờ GPU với chi phí 5,6 triệu USD, bằng một phần nhỏ thời gian và tiền bạc mà các công ty Mỹ bỏ ra cho các mô hình AI của họ.
"Tin tốt là những gì mọi người hiểu về R1 hoàn toàn sai", Jensen Huang nói hôm 19.3, đề cập đến mô hình suy luận của DeepSeek. Ông cho rằng khả năng suy luận (mô hình AI sử dụng trí thông minh để tạo ra câu trả lời cho người dùng) sẽ làm tăng nhu cầu tính toán, từ đó thúc đẩy nhu cầu với chip Nvidia.
Sau cuộc họp với các nhà phân tích, cổ phiếu Nvidia đã tăng gần 2%. Trước đó, cổ phiếu này giảm 3,4% hôm 18.3 khi các nhà đầu tư tỏ ra chưa bị thuyết phục bởi lập luận của Jensen Huang rằng Nvidia có vị thế tốt để thích ứng với sự thay đổi trong thị trường AI, khi doanh nghiệp dần chuyển từ việc đào tạo mô hình sang tối ưu hóa kết quả từ chúng.
Tại hội nghị dành cho các nhà phát triển của Nvidia hôm 18.3, Jensen Huang giải thích cách các sản phẩm mới nhất của Nvidia có thể cải thiện đáng kể khả năng suy luận cho các mô hình AI như DeepSeek-R1.
Ông mô tả Dynamo, phần mềm suy luận mã nguồn mở mới của Nvidia, là “hệ điều hành của một nhà máy AI”. Theo Nvidia, Dynamo (hiện đã có trên nền tảng mã nguồn mở GitHub) có thể cải thiện hiệu suất lên đến 30 lần trên các bộ xử lý đồ họa (GPU) và kiến trúc hiện có dành cho các tác vụ suy luận AI.
Một bài viết gần đây của Nvidia cho biết hệ thống Nvidia DGX với tám GPU Blackwell có thể đạt tốc độ suy luận 253 token/giây mỗi người dùng, hoặc đạt thông lượng tối đa hơn 30.000 token/giây trên mô hình DeepSeek-R1 với 671 tỉ tham số. Từ tháng 1 đến nay, đội ngũ Nvidia đã cải thiện thông lượng của R1 lên 36 lần.
1. Trong lĩnh vực AI và xử lý ngôn ngữ tự nhiên (NLP), token là đơn vị ngôn ngữ được sử dụng để phân chia văn bản thành các phần nhỏ hơn, giúp mô hình AI hiểu và xử lý văn bản dễ dàng hơn. Một token có thể là một từ, một ký hiệu, một phần của từ hoặc thậm chí một ký tự, tùy thuộc vào cách hệ thống NLP xử lý văn bản. Token giúp AI hiểu cấu trúc ngữ pháp, ngữ nghĩa và mối quan hệ giữa các từ trong câu. Khi được huấn luyện, mô hình ngôn ngữ lớn học cách dự đoán hoặc xử lý một chuỗi token thay vì xử lý toàn bộ câu hoặc văn bản dài trong một lần.
2. Trong AI, đặc biệt là NLP, thông lượng thường đề cập đến số lượng token mà một mô hình AI có thể xử lý một giây.
Thông lượng là thuật ngữ dùng để chỉ lượng dữ liệu hoặc số lượng tác vụ có thể được xử lý trong một khoảng thời gian nhất định. Nó thường được sử dụng trong nhiều lĩnh vực khác nhau như công nghệ, mạng máy tính, sản xuất và AI.
Tại hội nghị nêu trên, Jensen Huang đã trình chiếu video so sánh mô hình ngôn ngữ truyền thống của Meta Platforms với DeepSeek-R1 ở một bài toán sắp xếp chỗ ngồi. Trong khi mô hình của Meta Platforms chỉ sử dụng 439 token nhưng không đưa ra được đáp án đúng, R1 sử dụng 8.559 token nhưng cuối cùng đã tìm ra câu trả lời chính xác sau khi thử nghiệm nhiều kịch bản khác nhau.
Jensen Huang lập luận rằng các mô hình suy luận sẽ tạo ra nhu cầu tính toán tăng vọt và "định luật mở rộng" (quy tắc cho rằng hệ thống AI càng mạnh khi có nhiều tài nguyên hơn) vẫn sẽ có hiệu quả trong các giai đoạn phát triển AI khác nhau.
Các gã khổng lồ công nghệ Trung Quốc như Baidu, Alibaba Cloud và ByteDance tham gia hội nghị của Nvidia năm nay. DeepSeek không tham dự hội nghị này. Thế nhưng, quỹ đầu tư định lượng High-Flyer (công ty mẹ DeepSeek) đã tham gia hội nghị năm 2022 của Nvidia và giới thiệu công nghệ lập lịch tài nguyên tính toán AI của mình.
Dịch chuyển sản xuất về Mỹ
Trả lời câu hỏi từ một nhà phân tích về tác động của mức thuế cao hơn dưới thời ông Trump, Jensen Huang cho biết Nvidia không thấy ảnh hưởng lớn trong ngắn hạn nhưng có thể sẽ chuyển sản xuất về Mỹ trong dài hạn. Tuy nhiên, ông không đưa ra thời gian cụ thể.
TSMC đã công bố kế hoạch đầu tư thêm 100 tỉ USD vào Mỹ để xây dựng năm cơ sở sản xuất chip mới. Khoản đầu tư này từ TSMC sẽ thúc đẩy sản xuất trong nước và giúp Mỹ giảm sự phụ thuộc vào việc sản xuất chất bán dẫn tại châu Á. Đây là khoản đầu tư bổ sung so với tuyên bố của TSMC hồi tháng 4.2024, khi cho biết sẽ mở rộng đầu tư tại Mỹ thêm 25 tỉ USD lên tổng cộng 65 tỉ USD và bổ sung một nhà máy thứ ba ở bang Arizona vào năm 2030.
TSMC không đưa ra mốc thời gian cụ thể cho các khoản đầu tư mới mà chỉ cho biết kế hoạch sẽ tạo ra 40.000 việc làm trong ngành xây dựng trong 4 năm tới. Việc xây dựng nhà máy đầu tiên tại bang Arizona từng bị trì hoãn, nhưng TSMC cuối cùng đã kịp bắt đầu sản xuất chip vào năm 2024.
Là đối tác sản xuất quan trọng của Nvidia, Qualcomm và AMD, TSMC đóng vai trò trung tâm trong ngành công nghiệp chip Mỹ. Việc đưa nhiều dây chuyền sản xuất hơn sang Mỹ có thể giúp giảm rủi ro chuỗi cung ứng với các công ty Đài Loan này.
"Chúng tôi tham gia vào đó", Jensen Huang nói, đề cập đến nhà máy sản xuất chip mới của TSMC ở bang Arizona (Mỹ). "Chúng tôi hiện đang sản xuất chip tại Arizona".
Tháng 12.2024, Reuters đưa tin TSMC đang đàm phán với Nvidia để sản xuất chip Blackwell tại nhà máy mới của họ ở Arizona.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/ceo-jensen-huang-nvidia-chua-nhan-duoc-de-nghi-mua-co-phan-intel-tu-tsmc-nhu-cau-chip-blackwell-rat-lon-230585.html