Việc Google phát hành mô hình AI (trí tuệ nhân tạo) mới nhất Gemini 3 làm dấy lên cuộc tranh luận về tương lai cuộc chiến giữa Mỹ và Trung Quốc trong lĩnh vực AI. Ngoài ra, Gemini 3 là bằng chứng cho thấy các nhà phát triển Trung Quốc đối mặt với nhiều thách thức để theo kịp gã khổng lồ công nghệ Mỹ như Google.
Trình làng rạng sáng 19.11 giờ Việt Nam, Gemini 3 Pro đã nhanh chóng vượt qua GPT-5.1 của OpenAI để lần đầu tiên đưa Google lên vị trí số 1 bảng xếp hạng Intelligence Index của Artificial Analysis.
Artificial Analysis là tổ chức độc lập uy tín chuyên đánh giá và so sánh hiệu suất các mô hình AI. Phiên bản Intelligence Index v3.0 của Artificial Analysis kết hợp 10 chuẩn đánh giá: MMLU-Pro, GPQA Diamond, Humanity's Last Exam, LiveCodeBench, SciCode, AIME 2025, IFBench, AA-LCR, Terminal-Bench Hard, ²-Bench Telecom.
Gemini 3 Pro vượt GPT-5.1 để dẫn đầu BXH Intelligence Index của Artificial Analysis - Ảnh PV chụp màn hình
Sundar Pichai, Giám đốc điều hành Google, mô tả Gemini 3 là "mô hình thông minh nhất của chúng tôi".
Ông cho biết Gemini 3 được “xây dựng để nắm bắt chiều sâu và sắc thái, giỏi hơn nhiều trong việc nhận biết ngữ cảnh và mục đích đằng sau yêu cầu của người dùng, giúp bạn có được điều mình cần với ít gợi ý hơn”.
"Các câu trả lời do Gemini 3 cung cấp sẽ bỏ qua những lời sáo rỗng và tâng bốc, thay vào đó cung cấp thông tin thực sự hữu ích, nói với bạn điều cần biết, chứ không phải điều bạn muốn nghe”, theo Demis Hassabis - Giám đốc điều hành Google DeepMind. Các nhà phê bình trong ngành cho rằng chatbot AI hiện nay thường quá xu nịnh.
Google DeepMind là bộ phận nghiên cứu và phát triển AI tiên tiến của Google.
Trong khi Josh Woodward, Phó chủ tịch Google Labs và Gemini, cho biết Gemini 3 là “mô hình vibe coding tốt nhất từ trước đến nay” trong buổi họp báo. Vibe coding là khái niệm mới trong cộng đồng AI, mô tả cách viết mã kết hợp với AI một cách linh hoạt, thay vì thực hiện thủ công. Nói cách khác, thay vì ngồi suy nghĩ rồi gõ từng dòng mã, bạn sẽ trao đổi với AI để thử nhiều hướng tiếp cận khác nhau, tinh chỉnh và xây dựng dự án theo kiểu “đi theo cảm hứng”, giống làm việc song hành cùng cộng tác viên thông minh.
Hôm 13.11 vừa qua, OpenAI thông nâng cấp GPT-5 bằng hai phiên bản: GPT-5.1 Instant (phản hồi thân thiện và tự nhiên hơn, thông minh hơn và làm theo hướng dẫn của bạn tốt hơn) và GPT-5.1 Thinking (dễ hiểu hơn và nhanh hơn với các tác vụ đơn giản, kiên trì hơn với các tác vụ phức tạp).
Trên bảng xếp hạng mô hình AI của trang LMArena về khả năng đa nhiệm, độ chính xác ngôn ngữ và mức độ hiểu biết về bối cảnh văn hóa trong văn bản, Gemini 3 Pro vượt Grok 4.1 để xếp thứ nhất.
LMArena cho phép mọi người so sánh mô hình AI khác nhau bằng các câu lệnh để xác định cái nào tốt hơn. Người dùng có thể bình chọn mức độ hiệu quả của nhiều mô hình AI và so sánh chúng trên bảng xếp hạng.
Ra mắt hôm 18.11, Grok 4.1 được thiết kế để giảm ảo giác và đưa ra câu trả lời chính xác hơn. Elon Musk, Giám đốc điều hành xAI, cho biết Grok 4.1 là bước tiến lớn so với các phiên bản trước, đặc biệt ở hai yếu tố quan trọng là tốc độ và chất lượng phản hồi.
Grok 4.1 không chỉ trả lời nhanh hơn mà còn đưa ra câu trả lời chính xác, hợp lý và ít sai lệch hơn. Đây là những điểm mà người dùng thường phàn nàn ở các mô hình AI trước đây, gồm cả chính Grok 3 và Grok 4.
Gemini 3 Pro nhận được nhiều lời khen từ các đối thủ, lãnh đạo startup AI hàng đầu Trung Quốc nhận thua
Gemini 3 Pro đã nhận được sự khen ngợi từ các đối thủ cạnh tranh trong ngành AI, gồm cả Sam Altman (Giám đốc điều hành OpenAI) và Lin Junyang (trưởng nhóm kỹ thuật của dòng mô hình Qwen thuộc Alibaba Cloud). Alibaba Cloud là đơn vị AI và điện toán đám mây của tập đoàn thương mại điện tử Alibaba (Trung Quốc).
Gemini 3 Pro đã đẩy mô hình AI hàng đầu Trung Quốc, Kimi K2 Thinking của công ty khởi nghiệp Moonshot AI, xuống vị trí thứ 4 trên bảng xếp hạng Intelligence Index. Điều này làm nổi bật thách thức khó khăn mà các công ty khởi nghiệp Trung Quốc phải đối mặt khi cạnh tranh với các hyperscaler (nhà cung cấp dịch vụ điện toán đám mây siêu quy mô) như Google.
Lãnh đạo một công ty khởi nghiệp AI hàng đầu Trung Quốc (yêu cầu giấu tên) nói với trang SCMP rằng: "Theo quan điểm của tôi, chúng tôi có lẽ sẽ thua trong cuộc chơi này".
Theo vị lãnh đạo đó, Google cuối cùng sẽ dẫn đầu tại Mỹ nhờ năng lực toàn diện, gồm chip AI nội bộ, mô hình nền tảng và dịch vụ đám mây.
Google tiết lộ Gemini 3 Pro được huấn luyện bằng các TPU do hãng tự thiết kế. TPU là loại chip AI chuyên xử lý những tác vụ tính toán khổng lồ cần thiết để huấn luyện các mô hình lớn nhất hiện nay.
Dù Google chưa tiết lộ quy mô của Gemini 3 Pro, ước tính trong ngành cho thấy nó nằm trong khoảng từ 5.000 tỉ đến 10.000 tỉ tham số và trở thành một trong những mô hình lớn nhất đến nay.
Tham số là các giá trị số mà mô hình AI học được và điều chỉnh trong suốt quá trình huấn luyện trên lượng lớn dữ liệu. Tham số là các biến nội bộ của mô hình AI, quyết định cách nó xử lý thông tin đầu vào và tạo kết quả đầu ra. Mục tiêu của quá trình huấn luyện là tìm ra bộ tham số tối ưu nhất để mô hình AI có thể thực hiện nhiệm vụ (dự đoán từ tiếp theo trong câu, dịch ngôn ngữ, trả lời câu hỏi...) chính xác nhất có thể dựa trên dữ liệu đã học.
Số lượng tham số thường là chỉ số về kích thước và khả năng của mô hình AI. Mô hình AI càng có nhiều tham số thì tiềm năng học được các mẫu phức tạp hơn càng lớn, nhưng cũng đòi hỏi nhiều dữ liệu, tài nguyên tính toán để huấn luyện.
Gemini 3 Pro được cho có quy mô khoảng từ 5.000 tỉ đến 10.000 tỉ tham số - Ảnh: Getty Images
Mở rộng quy mô thuần túy vẫn còn hiệu quả
Gemini 3 Pro cho thấy chiến lược mở rộng quy mô thuần túy vẫn còn hiệu quả, theo Oriol Vinyals - Phó chủ tịch phụ trách nghiên cứu của Google DeepMind.
Trong một bài đăng trên mạng xã hội X, Oriol Vinyals cho biết đội ngũ Google DeepMind đã tạo ra “bước nhảy vọt mạnh mẽ” ở giai đoạn tiền huấn luyện Gemini 3 Pro, “trái ngược với quan niệm phổ biến rằng việc mở rộng quy mô đã chạm trần”.
"Khoảng cách giữa Gemini 2.5 và 3.0 là lớn nhất từ trước đến nay. Không có bức tường giới hạn nào ở phía trước!", Oriol Vinyals viết. Ông ám chỉ đến "bức tường" mà một số người cho rằng việc mở rộng quy mô AI đang chạm tới.
Đầu năm nay, phương pháp mở rộng quy mô đã bị đặt dấu hỏi sau khi DeepSeek và các công ty Trung Quốc khác tung ra mô hình AI có hiệu suất chỉ kém một chút so với nhóm dẫn đầu của Mỹ nhưng chi phí huấn luyện thấp hơn rất nhiều.
Song kể từ đó, OpenAI và các gã khổng lồ công nghệ Mỹ đã tăng tốc đầu tư vào hạ tầng AI để huấn luyện thế hệ mô hình ngôn ngữ lớn thế hệ tiếp theo.
Một số công ty khởi nghiệp Trung Quốc, chẳng hạn Zhipu AI, đã bày tỏ nghi ngờ về phương pháp mở rộng quy mô thuần túy. Trong khi những công ty khác như Moonshot AI lại ủng hộ phương pháp này, đồng thời tiếp tục khám phá các kiến trúc hiệu quả hơn để cắt giảm chi phí và vô hiệu hóa tác động của biện pháp kiểm soát xuất khẩu từ Mỹ với chip AI tiên tiến.
Các hyperscaler Trung Quốc với nguồn lực điện toán lớn như Alibaba, Baidu và Tencent đã thể hiện khả năng chống chịu tốt hơn. Quanquan Gu, nhà khoa học nghiên cứu tại ByteDance Seed, đã viết trên X để phản hồi về việc Google phát hành Gemini 3 Pro: "Đúng là không hề có bức tường giới hạn nào".
ByteDance Seed là đội nghiên cứu AI then chốt và tiên tiến của ByteDance (công ty mẹ TikTok), chuyên phát triển các mô hình ngôn ngữ lớn đa phương thức cho cả mục đích nghiên cứu và ứng dụng.
Florian Brand, nghiên cứu sinh tiến sĩ tại Đại học Trier (Đức) và là chuyên gia về hệ sinh thái AI Trung Quốc, cho biết yếu tố quan trọng với khả năng cạnh tranh của các công ty Trung Quốc là liệu nước này có thể tiếp tục mở rộng quy mô sản xuất chip để hỗ trợ đào tạo mô hình AI hay không.
Hồi tháng 10, Ant Group (hãng công nghệ tài chính thuộc Alibaba) cho biết trong một báo cáo rằng "chi phí điện toán quá cao vẫn là thách thức lớn" với việc huấn luyện các mô hình nghìn tỉ tham số.
Sơn Vân