Đầu tư 190 tỷ USD nâng cấp hạ tầng dữ liệu và vi xử lý TPU thế hệ 8
Kế hoạch tài chính mới nhất của Google cho thấy dòng vốn đầu tư vào cơ sở hạ tầng trí tuệ nhân tạo (AI) đang tăng mạnh. Tổng Giám đốc Sundar Pichai xác nhận mức chi phí vốn đầu tư dự kiến đạt 180 tỷ đến 190 tỷ USD trong năm 2026, cao gấp sáu lần so với con số 31 tỷ USD ghi nhận năm 2022. Trọng tâm của khoản giải ngân này được phân bổ vào công tác nghiên cứu và phát triển dòng chip xử lý tùy chỉnh. Tại sự kiện, Google giới thiệu bộ vi xử lý tensor (TPU) thế hệ thứ 8 với thiết kế kiến trúc phân tách gồm phiên bản TPU 8t và TPU 8i.
Dòng TPU 8t được thiết kế chuyên biệt cho công đoạn tiền huấn luyện mô hình, cung cấp hiệu suất tính toán thô cao gấp ba lần thế hệ trước. Việc kết hợp hệ thống vi xử lý này với nền tảng JAX và Pathways cho phép hệ thống phân bổ tác vụ huấn luyện linh hoạt qua nhiều trung tâm dữ liệu, mở rộng mạng lưới lên hơn 1 triệu chip TPU trên toàn cầu. Năng lực kết nối phần cứng giúp các kỹ sư công nghệ rút ngắn thời gian huấn luyện các mô hình AI lớn từ vài tháng xuống chỉ còn vài tuần. Ở dải sản phẩm còn lại, dòng chip TPU 8i tập trung tối ưu hóa các tác vụ suy luận và phản hồi truy vấn của người dùng. Cả hai phiên bản vi xử lý đều cải thiện hiệu suất trên mỗi watt điện thêm hai lần, tiết giảm đáng kể mức năng lượng tiêu thụ. Năng lực tính toán của hệ thống được minh chứng qua khối lượng dữ liệu thực tế, khi máy chủ của Google hiện tiếp nhận và xử lý hơn 3,2 triệu tỷ token mỗi tháng, cao gấp bảy lần mức xử lý của năm trước.
Tích hợp Gemini Omni và loạt ứng dụng mới vào hệ sinh thái nền tảng
Về mặt ứng dụng thương mại, Google hiện quản lý 13 sản phẩm có hơn một tỷ người dùng hoạt động hằng tháng, trong đó năm dịch vụ đã vượt mốc ba tỷ người dùng. Tập đoàn đang đẩy nhanh tiến độ đưa các mô hình AI tạo sinh vào toàn bộ hệ sinh thái dịch vụ hiện hữu. Đối với công cụ Tìm kiếm, tính năng AI Overviews hiện ghi nhận hơn 2,5 tỷ người dùng thường xuyên. Việc áp dụng cơ chế phản hồi theo dạng hội thoại liên tiếp thay vì các lệnh đơn lẻ đã đẩy số lượng yêu cầu xử lý hằng ngày trên ứng dụng Gemini tăng gấp bảy lần, đưa tổng lượng người dùng thường xuyên vượt mốc 900 triệu.
Thay vì hoạt động độc lập, trí tuệ nhân tạo của Google được cấu trúc thành một hệ sinh thái các mô hình chuyên biệt. Nổi bật là mô hình Gemini Omni với khả năng nhận diện và xuất dữ liệu đa định dạng, khởi đầu với video và tiếp tục mở rộng sang hình ảnh, văn bản. Đối với nhóm khách hàng doanh nghiệp và lập trình viên, công cụ Gemini Spark được phát triển thành trợ lý ảo hoạt động liên tục, kết hợp sức mạnh của phiên bản Gemini 3.5 và Antigravity để hỗ trợ thực thi các tác vụ lập trình chuyên sâu. Tiện ích này sẽ được tích hợp trực tiếp vào trình duyệt Chrome vào cuối mùa hè năm nay.
Các dịch vụ tiện ích khác cũng tiếp nhận đợt cập nhật thuật toán lớn. Nền tảng Google Maps bổ sung tính năng Ask Maps để xử lý các truy vấn hành trình phức tạp, còn nền tảng YouTube tích hợp công cụ Ask YouTube giúp người dùng trích xuất trực tiếp thông tin từ các đoạn video đang phát. Tại phân khúc ứng dụng văn phòng, tính năng Docs Live thay đổi phương thức soạn thảo văn bản bằng việc cho phép người dùng khởi tạo và chỉnh sửa tài liệu thông qua định dạng giọng nói thay vì gõ văn bản vật lý. Tính năng Docs Live sẽ được thương mại hóa cho tệp khách hàng đăng ký các gói trả phí trong thời gian tới, trước khi được công ty mở rộng tích hợp sang Gmail và Google Keep.
Khánh An