Viettel phát triển mô hình AI tiếng Việt 120 tỷ tham số, hướng tới AI chủ quyền

Viettel phát triển mô hình AI tiếng Việt 120 tỷ tham số, hướng tới AI chủ quyền
3 giờ trướcBài gốc
Viettel AI làm chủ mô hình ngôn ngữ lớn tiếng Việt quy mô 120 tỷ tham số. (Ảnh minh họa).
Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) cho biết đã phát triển thành công VT-Super-120B-A12B - mô hình ngôn ngữ lớn (LLM) tiếng Việt quy mô 120 tỷ tham số, hướng tới xây dựng các hệ thống AI am hiểu sâu dữ liệu, ngôn ngữ và tri thức Việt Nam.
Theo Viettel AI, thông qua các bài kiểm tra đánh giá, VT-Super-120B-A12B đạt hiệu suất cao và nằm trong nhóm dẫn đầu về độ chính xác so với các mô hình cùng quy mô. Mô hình được xây dựng trên kiến trúc mở NVIDIA Nemotron 3 Super với 120 tỷ tham số, do đội ngũ kỹ sư Việt Nam trực tiếp huấn luyện, tinh chỉnh và tối ưu cho tiếng Việt.
Đại diện Viettel AI cho biết điểm nổi bật của mô hình là được huấn luyện trên các nguồn dữ liệu mang tính bản địa như dữ liệu hành chính, nghiệp vụ doanh nghiệp, hội thoại thực tế và hệ thống văn bản chuyên ngành tại Việt Nam. Quá trình phát triển bao gồm nhiều giai đoạn từ tiếp tục tiền huấn luyện để mở rộng năng lực ngôn ngữ và tri thức tiếng Việt, đến tinh chỉnh có giám sát và học tăng cường nhằm nâng cao khả năng suy luận, độ chính xác phản hồi và xử lý nghiệp vụ.
Viettel AI cho biết VT-Super-120B-A12B tăng cường đáng kể năng lực xử lý tiếng Việt nhưng vẫn duy trì hiệu năng tiếng Anh của mô hình gốc, đồng thời hạn chế hiện tượng "quên kiến thức cũ" thường gặp trong quá trình huấn luyện AI.
Ông Nguyễn Mạnh Quý - Giám đốc Viettel AI, nhận định AI đang chuyển từ vai trò hỗ trợ sang lớp hạ tầng công nghệ mới. Theo ông, việc làm chủ mô hình ngôn ngữ lớn tiếng Việt là bước đi cốt lõi để hình thành các giải pháp AI chủ quyền phục vụ hiệu quả nhu cầu của các tổ chức và doanh nghiệp trong nước.
Trên nền tảng VT-Super-120B-A12B, Viettel AI đang phát triển hệ thống AI Agent dành cho người Việt. Trong đó, Trợ lý AI Pháp luật là một trong những ứng dụng đầu tiên, được kỳ vọng hỗ trợ phân tích hồ sơ, đối chiếu quy định, tổng hợp dữ liệu và đề xuất phương án xử lý cho người dùng.
Theo doanh nghiệp, việc làm chủ mô hình ngôn ngữ lớn tiếng Việt không chỉ có ý nghĩa về mặt công nghệ mà còn góp phần thúc đẩy phát triển hệ sinh thái AI "Make in Vietnam", phù hợp định hướng làm chủ công nghệ chiến lược, công nghệ lõi và trí tuệ nhân tạo theo Nghị quyết 57-NQ/TW.
Vũ Đậu
Nguồn Doanh nhân & Công lý : https://doanhnhan.congly.vn/viettel-phat-trien-mo-hinh-ai-tieng-viet-120-ty-tham-so-huong-toi-ai-chu-quyen.html