Gemma 3n được huấn luyện trên dữ liệu từ hơn 140 ngôn ngữ nói, cải thiện đáng kể hiệu suất đa ngôn ngữ
Gemma 3n hiện đã có bản xem trước từ ngày 20.5, là một mô hình đa phương thức, có thể xử lý âm thanh, văn bản, hình ảnh và video. Điểm nổi bật của Gemma 3n là khả năng hoạt động offline mà không cần kết nối đám mây, giúp giảm chi phí sử dụng và bảo vệ quyền riêng tư bằng cách không cần truyền dữ liệu đến các trung tâm dữ liệu từ xa.
Bên cạnh đó, Gemma 3n còn được giới thiệu có một loạt ưu điểm khác như tối ưu hóa cho thiết bị di động. Gemma 3n được thiết kế để hoạt động cực kỳ hiệu quả trên các thiết bị có tài nguyên thấp, giảm đáng kể yêu cầu về bộ nhớ và tính toán. Điều này đạt được nhờ các đổi mới như Per-Layer Embedding (PLE) parameter caching và kiến trúc MatFormer.
Ngoài ra, mô hình này có khả năng xử lý và hiểu nhiều loại đầu vào, bao gồm văn bản, hình ảnh, video và âm thanh. Điều này mở ra nhiều ứng dụng mới, ví dụ như hiểu ngữ cảnh từ môi trường người dùng trong thời gian thực.
Bên cạnh đó, Gemma 3n được huấn luyện trên dữ liệu từ hơn 140 ngôn ngữ nói, cải thiện đáng kể hiệu suất đa ngôn ngữ. Hiện tại, Gemma 3n đang có sẵn ở dạng xem trước cho các nhà phát triển thông qua Google AI Studio (để khám phá trên đám mây) và Google AI Edge (để phát triển trên thiết bị).
Trong bài phát biểu tại I/O, Giám đốc sản phẩm Gemma là Gus Martins cho biết mô hình này có thể chạy trên các thiết bị với RAM dưới 2GB, mở ra tiềm năng ứng dụng rộng rãi trên nhiều loại thiết bị.
Gemma 3n nằm trong chiến lược mở rộng dòng mô hình AI “mở” của Google, vốn đã đạt hơn 150 triệu lượt tải về tính đến ngày 12.5 năm nay. Tuy nhiên, Gemma vẫn đang đối mặt với thách thức cạnh tranh từ các mô hình khác như Llama của Meta, vốn đã vượt mốc 1,2 tỉ lượt tải vào tháng 4.2025.
Cả Gemma và Llama đều bị chỉ trích vì các điều khoản cấp phép không chuẩn, khiến một số nhà phát triển lo ngại về rủi ro khi sử dụng thương mại.
Với việc ra mắt Gemma 3n, Google không chỉ thúc đẩy sự phát triển của AI di động mà còn khẳng định cam kết mang công nghệ AI đến gần hơn với người dùng toàn cầu, đồng thời cạnh tranh mạnh mẽ trong cuộc đua AI toàn cầu.
Giới thiệu MedGemma chuyên cho lĩnh vực y tế
Ngoài Gemma 3n, Google cũng ra mắt MedGemma, một mô hình AI chuyên biệt dành cho phân tích văn bản và hình ảnh y tế, thông qua chương trình Health AI Developer Foundations.
MedGemma được giới thiệu là mô hình AI mở mạnh mẽ nhất của Google trong lĩnh vực y tế, hứa hẹn hỗ trợ các chuyên gia chăm sóc sức khỏe trong chẩn đoán và nghiên cứu.
Anh Tú