MAI-Voice-1 là công cụ chuyển văn bản thành âm thanh, có thể tạo ra đoạn âm thanh trong chưa đầy một giây trên một GPU đơn, theo Microsoft. Họ đã dùng mô hình này để phát triển Copilot Daily, cung cấp bản tin âm thanh về tin tức, thời tiết và mẹo hằng ngày, cũng như Copilot Podcasts, có thể tạo các tương tác âm thanh giữa hai AI. Người dùng có thể thử nghiệm MAI-Voice-1 ngay tại Copilot Labs. Khi nhập văn bản, người dùng còn có thể chọn tâm trạng cho đoạn âm thanh, với chế độ Emotive bao gồm nhiều giọng và phong cách, hay chế độ Story cho kiểu kể chuyện như đọc sách.
MAI-1-preview là mô hình đầu tiên được Microsoft phát triển hoàn toàn nội bộ. Mô hình này được xây dựng dựa trên nhiều mô hình ngôn ngữ lớn (LLM) và đã được huấn luyện trước và sau trên khoảng 15.000 GPU Nvidia H100. Microsoft chia sẻ rằng mô hình này được thiết kế để cung cấp khả năng mạnh mẽ cho người dùng cần các mô hình chuyên về thực hiện hướng dẫn và đưa ra câu trả lời hữu ích cho các câu hỏi thường ngày.
Microsoft giới thiệu 2 mô hình AI nội bộ trong bối cảnh cạnh tranh ngày càng gia tăng - Ảnh: msn.com
Hiện MAI-1-preview đang được thử nghiệm trên LMArena, một nền tảng đánh giá AI cộng đồng. Microsoft cho biết mô hình này sẽ sớm được dùng trong một số trường hợp xử lý văn bản trên Copilot.
Đội ngũ MAI đã phát triển hai mô hình AI này từ năm ngoái với mục tiêu tạo ra một nền tảng AI ứng dụng thực tế, cung cấp các sản phẩm mà người dùng có thể tin tưởng và sử dụng để đáp ứng nhu cầu riêng biệt của từng cá nhân. Nói cách khác, họ muốn làm ra một loại AI thông minh, chủ động và hiểu rõ người dùng, điều mà trong giới công nghệ gọi là AI chủ động (agentic AI).
Thông thường, trong ngành công nghệ, một bài thông báo hiếm khi lại trở thành cơ hội tuyển dụng lớn. Nhưng vì cạnh tranh tìm kiếm nhân tài AI ngày càng gay gắt, Microsoft đã tận dụng ngay dịp này để mời gọi thêm nhiều người gia nhập đội ngũ MAI của họ.
Việc Microsoft phát triển hai mô hình AI riêng này và tích cực mở rộng đội ngũ cho thấy họ đang rất nghiêm túc trong cuộc đua AI ngày càng gay gắt. Bằng cách xây dựng các công cụ AI mạnh mẽ và tin cậy, Microsoft không chỉ muốn tạo ra trải nghiệm tốt hơn cho người dùng mà còn đặt mục tiêu dẫn đầu thị trường công nghệ mới này. Trong tương lai gần, AI sẽ trở thành một phần không thể thiếu trong công việc và cuộc sống hằng ngày, và những bước tiến như MAI-Voice-1 hay MAI-1-preview chính là minh chứng rõ nhất cho tầm nhìn đó của Microsoft.
Lê Hà