Google vừa chính thức công bố Gemma 4, dòng mô hình trí tuệ nhân tạo (AI) mở được phát triển dựa trên những đột phá từ hệ thống Gemini 3 Pro. Đây là dự án chiến lược nhằm mang công nghệ AI cao cấp đến gần hơn với cộng đồng nhà phát triển, cho phép tùy chỉnh linh hoạt cho nhiều mục đích khác nhau.
Cấu trúc đa tầng tối ưu cho mọi loại thiết bị
Để đảm bảo hiệu suất trên nhiều nền tảng, Google đã phân chia Gemma 4 thành bốn phiên bản riêng biệt. Đối với người dùng di động, hai phiên bản dòng "Effective" với cấu trúc 2 tỷ và 4 tỷ tham số được thiết kế để hoạt động mượt mà ngay cả trên các thiết bị có cấu hình khiêm tốn.
Google Gemma 4 có tới hai phiên bản cho điện thoại với cấu trúc 2 tỷ và 4 tỷ tham số
Trong khi đó, các hệ thống máy tính chuyên dụng có thể sử dụng phiên bản "Mixture of Experts" (26 tỷ tham số) hoặc bản "Dense" (31 tỷ tham số). Sự phân hóa này giúp Gemma 4 đáp ứng tốt từ các tác vụ cơ bản hàng ngày đến những nghiên cứu khoa học dữ liệu phức tạp.
Hiệu năng thực tế ấn tượng trên bảng xếp hạng quốc tế
Dù sở hữu kích thước tham số khiêm tốn hơn so với các siêu AI, Gemma 4 lại gây bất ngờ về độ thông minh thực tế. Trên bảng xếp hạng năng lực viết văn bản của Arena AI, hai phiên bản cao cấp nhất của dòng này đã xuất sắc vươn lên vị trí thứ 3 và thứ 6.
Gemma 4 dễ dàng đánh bại những mô hình trí tuệ nhân tạo khác có kích thước lớn hơn gấp 20 lần
Kết quả kiểm tra cho thấy Gemma 4 đủ khả năng vượt mặt nhiều mô hình AI khác có kích thước lớn hơn gấp 20 lần. Điều này minh chứng cho nỗ lực tối ưu hóa thuật toán của Google, tập trung vào chất lượng thay vì chỉ chạy đua về số lượng tham số.
Khả năng xử lý đa phương tiện và hoạt động ngoại tuyến
Cả bốn phiên bản Gemma 4 đều sở hữu khả năng đọc hiểu văn bản trong hình ảnh và phân tích dữ liệu video. Đặc biệt, các phiên bản dành cho điện thoại còn được tối ưu hóa sâu để nghe hiểu giọng nói và xử lý âm thanh trực tiếp. Hệ thống hỗ trợ tới hơn 140 ngôn ngữ, giúp xóa bỏ rào cản giao tiếp toàn cầu.
Hai phiên bản Gemma 4 dành cho điện thoại có khả năng nghe hiểu giọng nói và xử lý âm thanh cực tốt
Đáng chú ý nhất là khả năng hoạt động hoàn toàn ngoại tuyến. Người dùng có thể yêu cầu AI hỗ trợ viết mã lập trình hoặc phân tích dữ liệu ngay cả khi thiết bị không có kết nối internet, đảm bảo tính liên tục trong công việc và bảo mật dữ liệu tuyệt đối.
Tự do tùy chỉnh với giấy phép mở Apache 2.0
Thay vì giữ bản quyền đóng, Google phát hành Gemma 4 dưới dạng giấy phép mở Apache 2.0. Quyết định này cho phép các nhà phát triển toàn cầu tự do thay đổi, chỉnh sửa và triển khai AI trên máy chủ riêng của họ cho các mục đích thương mại hoặc cá nhân. Việc triển khai tại chỗ (on-premise) giúp các doanh nghiệp duy trì quyền kiểm soát dữ liệu, tránh sự phụ thuộc vào các dịch vụ đám mây bên thứ ba.
PHỐ HỘI