Mới đây, Alphabet đã ra mắt phiên bản mới nhất của mô hình trí tuệ nhân tạo Gemini, đồng thời cho biết các tính năng mới sẽ được áp dụng ngay lập tức trong một số sản phẩm tạo doanh thu như công cụ tìm kiếm của hãng.
Gemini 3 ra mắt 11 tháng sau thế hệ thứ hai của mô hình, được kỳ vọng giúp Google duy trì vị thế dẫn đầu trong cuộc đua AI. Trong một buổi họp báo, các lãnh đạo của công ty nhấn mạnh rằng Gemini 3 đang đứng đầu trên nhiều bảng xếp hạng ngành phổ biến, nơi đánh giá hiệu suất của các mô hình AI.
CEO Sundar Pichai mô tả Gemini 3 là mô hình thông minh nhất của công ty trong một bài đăng trên blog chính thức. Tuy nhiên, cuộc đua AI đang dần dịch chuyển từ việc so sánh hiệu suất sang ứng dụng công nghệ nhằm tạo ra lợi nhuận. Giá cổ phiếu của Alphabet trong năm nay phần lớn được hỗ trợ bởi thành công tài chính từ các sản phẩm AI thuộc mảng điện toán đám mây.
Ngay cả với sự hậu thuẫn từ những nhà phát triển hàng đầu như Google, OpenAI và Anthropic, các bản cập nhật mô hình AI mới vẫn gặp khó khăn trong việc tạo dấu ấn riêng, thường chỉ thu hút sự chú ý khi xảy ra thất bại, tương tự như tình huống Meta từng trải qua vào đầu năm nay.
Về tính năng mới, các cải tiến của Gemini 3 trong lĩnh vực lập trình và tư duy logic đã cho phép Google phát triển nhiều tính năng mới phục vụ cả người dùng cá nhân lẫn doanh nghiệp.
Gemini 3 mở ra khả năng học tập, xây dựng và lập kế hoạch một cách toàn diện. Được thiết kế từ đầu để tổng hợp thông tin về bất kỳ chủ đề nào, Gemini 3 kết hợp nhiều phương thức như văn bản, hình ảnh, video, âm thanh và mã.
Đồng thời, mở rộng khả năng lý luận đa phương thức với thị giác và hiểu biết không gian tiên tiến, hỗ trợ đa ngôn ngữ và xử lý ngữ cảnh lên tới 1 triệu token.
Trong lĩnh vực học tập, Gemini 3 có thể giải mã và dịch các công thức viết tay nhiều ngôn ngữ để tạo thành một cuốn sách nấu ăn gia đình. Khi tìm hiểu một chủ đề mới, mô hình có thể phân tích bài báo học thuật, video bài giảng dài hay các hướng dẫn, tạo mã cho flashcard tương tác, hình ảnh trực quan hoặc các định dạng khác giúp nắm vững kiến thức.
Ngay cả các hoạt động thể thao cũng có thể được hỗ trợ. Gemini 3 phân tích video trận đấu, xác định các điểm cần cải thiện và lập kế hoạch tập luyện chi tiết. Chế độ AI trên tìm kiếm tận dụng Gemini 3 để mang đến trải nghiệm giao diện sinh tạo hoàn toàn mới với bố cục trực quan sống động, công cụ và mô phỏng tương tác được tạo ngay lập tức dựa trên truy vấn.
Gemini 3 hiện có thể được sử dụng trên Google AI Studio, Vertex AI, Gemini CLI và nền tảng phát triển tác nhân mới Google Antigravity, hỗ trợ các nền tảng bên thứ ba như Cursor, GitHub, JetBrains, Manus, Replit và nhiều nền tảng khác, mở ra cơ hội xây dựng mọi ý tưởng một cách linh hoạt và mạnh mẽ.
Công ty cũng giới thiệu Gemini Agent, một tính năng có khả năng hoàn thành các tác vụ nhiều bước, chẳng hạn như sắp xếp hộp thư đến của người dùng hoặc đặt các chuyến đi, nhằm tiến gần hơn đến tầm nhìn về một trợ lý toàn diện mà giám đốc AI Demis Hassabis từng nhắc đến nội bộ với tên gọi AlphaAssist.
Google cũng đã thiết kế lại ứng dụng Gemini để trả về câu trả lời tương tự như một website hoàn chỉnh, gây thêm áp lực lên các nhà xuất bản nội dung vốn phụ thuộc vào lưu lượng truy cập web để tạo doanh thu.
Josh Woodward, Phó chủ tịch phụ trách ứng dụng đã trình diễn cách Gemini hiện có thể phản hồi những yêu cầu phức tạp. Ví dụ như tạo một phòng trưng bày Van Gogh kèm bối cảnh đời sống cho từng tác phẩm bằng cách tạo giao diện theo yêu cầu với các yếu tố trực quan và tương tác.
Đối với khách hàng doanh nghiệp, Google cũng giới thiệu trước một sản phẩm mới có tên Antigravity, một nền tảng phát triển phần mềm nơi các tác nhân AI có thể tự lập kế hoạch và thực hiện các nhiệm vụ lập trình một cách độc lập.
Đức Anh