Trong một thế giới mà sự phát triển của trí tuệ nhân tạo bị chi phối bởi một vài cường quốc toàn cầu, trí tuệ nhân tạo tự chủ, tức là trí tuệ nhân tạo do một quốc gia phát triển và sở hữu, là điều cần thiết để tự lực. Đối với Ấn Độ, với sự đa dạng về ngôn ngữ và kinh tế, việc xây dựng các giải pháp trí tuệ nhân tạo nội địa có tầm quan trọng chiến lược sống còn.
AI4Bharat, một sáng kiến được khởi xướng tại IIT Madras vào năm 2020, là một ví dụ điển hình cho cách tiếp cận này. Nó tập trung vào các công cụ AI được thiết kế riêng cho các ngôn ngữ Ấn Độ và những hạn chế thực tế. Không giống như các mô hình đòi hỏi nhiều sức mạnh tính toán của Thung lũng Silicon, AI4Bharat xây dựng các hệ thống gọn nhẹ chạy trên điện thoại thông minh cấu hình thấp và mạng băng thông thấp, giúp thu hẹp khoảng cách kỹ thuật số.
Đây là cách LeanSpark đang vận hành: giải quyết các bài toán quy mô lớn trong điều kiện hạn chế về chi phí, băng thông và cơ sở hạ tầng .
Ấn Độ là một bức tranh khảm gồm hơn 1.600 phương ngữ và 22 ngôn ngữ chính thức. Trong một xã hội đa ngôn ngữ như vậy, các mô hình trí tuệ nhân tạo toàn cầu được xây dựng cho tiếng Anh đơn giản là không hiệu quả. Đó là lý do tại sao trí tuệ nhân tạo độc lập, được phát triển tại Ấn Độ, không phải là một thứ xa xỉ mà là một nhu cầu thiết yếu. Nó đảm bảo công nghệ nói được ngôn ngữ của tất cả mọi người, chứ không chỉ ngôn ngữ của người giàu.
“ChatGPT ra mắt vào tháng 11/2023,” Vivek Raghavan nói, “thực sự khiến tôi kinh ngạc. Đây là một công nghệ giảm phát thực sự theo mọi nghĩa. Ngay lập tức, tôi có thể thấy một cách để Ấn Độ đạt được những bước đột phá lớn trong lĩnh vực y tế và giáo dục. Đây là cơ hội để đưa một gia sư cá nhân vào túi của mỗi đứa trẻ Ấn Độ, và một bác sĩ riêng vào tay mỗi người lớn Ấn Độ. Ví dụ, một gia sư AI sẽ có chi phí thấp hơn nhiều so với các trường học hiện nay và cung cấp hướng dẫn cá nhân hóa hơn nhiều.”
Vivek nhận ra trí tuệ nhân tạo tạo sinh (Generative AI) có thể thay đổi cuộc sống theo những cách mà anh chưa từng tưởng tượng hoặc thậm chí nghĩ là có thể. Nhưng điều quan trọng là phải xây dựng một thứ phù hợp với bối cảnh Ấn Độ: một thứ có giá cả phải chăng, có khả năng mở rộng, dựa trên giọng nói và các ngôn ngữ Ấn Độ.
Đó là thời điểm Sarvam AI ra đời. Sứ mệnh của công ty là tạo ra các mô hình AI có khả năng mở rộng và tiết kiệm chi phí, đáp ứng nhu cầu đặc thù của xã hội Ấn Độ. Công ty khởi nghiệp này sẽ phát triển các giải pháp AI toàn diện, phù hợp với bối cảnh ngôn ngữ và văn hóa đa dạng của Ấn Độ.
Krutrim và Sarvam AI đại diện cho một xu hướng đang phát triển trong hệ sinh thái công nghệ Ấn Độ, nơi các công ty khởi nghiệp trong nước đang tận dụng trí tuệ nhân tạo để giải quyết các nhu cầu và thách thức đặc thù của đất nước.
Tầm nhìn của công ty chịu ảnh hưởng sâu sắc bởi niềm tin của Vivek vào các mô hình “Trí tuệ nhân tạo tự chủ” tôn trọng quyền riêng tư dữ liệu và các sắc thái văn hóa. Công ty sẽ xây dựng dựa trên các nguyên tắc thiết kế tiết kiệm. Cách tiếp cận sẽ bao gồm việc mã nguồn mở các mô hình AI và hợp tác với các doanh nghiệp Ấn Độ để xây dựng các giải pháp chuyên biệt theo từng lĩnh vực. Chiến lược này không chỉ thúc đẩy sự đổi mới mà còn trao quyền cho các nhà nghiên cứu và phát triển địa phương để vượt qua những giới hạn của công nghệ AI.
Pratyush Kumar đồng sáng lập Sarvam AI cùng với Vivek, sau khi cả hai cùng làm việc tại dự án AI4Bharat ở IIT Madras. Với bằng tiến sĩ từ ETH Zurich và bằng cấp từ IIT Bombay, Pratyush mang đến cho công ty kiến thức chuyên sâu về trí tuệ nhân tạo và kỹ thuật hệ thống.
Khi thành lập Sarvam AI, Pratyush và Vivek đã chọn mô hình kinh doanh vì lợi nhuận cho công ty khởi nghiệp, tin rằng để thực sự mở rộng tầm ảnh hưởng của AI trên khắp Ấn Độ, đặc biệt là trong các lĩnh vực như chăm sóc sức khỏe và giáo dục, cần có sự đầu tư đáng kể và cạnh tranh trên thị trường. Mục tiêu của Sarvam AI là đưa trí tuệ nhân tạo tạo sinh (generative AI) đến với 800 triệu người dân Ấn Độ sử dụng điện thoại thông minh, giúp họ sử dụng các công cụ AI để cải thiện cuộc sống một cách có ý nghĩa.
Trong lĩnh vực chăm sóc sức khỏe, Sarvam AI đang triển khai các trợ lý ảo đa ngôn ngữ, hỗ trợ giọng nói, cho phép bệnh nhân ở vùng nông thôn tiếp cận tư vấn y tế, lên lịch hẹn và tham khảo ý kiến bác sĩ thông qua WhatsApp và các giao diện băng thông thấp. Các mô hình của họ, chẳng hạn như Sarvam 2B và Sarvam-M, được tinh chỉnh để suy luận y tế và phân loại triệu chứng bằng ngôn ngữ địa phương, mà không cần thiết bị cao cấp hoặc kết nối Internet liên tục. Các hệ thống này có thể tóm tắt ghi chú của bệnh nhân, cung cấp hướng dẫn chẩn đoán và thậm chí ưu tiên các trường hợp, hoạt động như những trợ lý AI tiết kiệm chi phí, hiệu quả cho các nhân viên y tế đang quá tải.
Trong lĩnh vực giáo dục, Sarvam AI đang xây dựng các giải pháp độc lập, tiết kiệm chi phí, đáp ứng sự đa dạng ngôn ngữ rộng lớn của Ấn Độ. Với mô hình chủ lực SarvamM, một mô hình ngôn ngữ lớn (LLM) với 24 tỷ tham số được huấn luyện trên 10 ngôn ngữ Ấn Độ, Sarvam cho phép các trợ lý học tập bằng ngôn ngữ bản địa có khả năng hiểu các truy vấn pha trộn ngôn ngữ và cung cấp hướng dẫn cá nhân hóa bằng tiếng mẹ đẻ của học sinh. Các mô hình nhẹ , được tối ưu hóa này giúp các gia sư AI điều chỉnh bài học toán và lập trình phù hợp với bối cảnh giáo dục khu vực, vượt xa những gì các nền tảng chỉ tập trung vào tiếng Anh có thể làm được.
Những công ty khởi nghiệp này phản ánh sức mạnh ngày càng tăng của hệ sinh thái trí tuệ nhân tạo (AI) của Ấn Độ - giải quyết các thách thức địa phương mang tầm quan trọng toàn cầu.
OpenHathi, được phát triển bởi Sarvam AI, là một dự án tiết kiệm và mã nguồn mở được thiết kế để dạy kỹ năng ngôn ngữ Ấn Độ cho những người học ngôn ngữ hiện có. Thay vì xây dựng một mô hình từ đầu - một quá trình tốn kém và tiêu tốn nhiều tài nguyên - Sarvam đã điều chỉnh các mô hình được huấn luyện sẵn như LlaMA của Meta (viết tắt của Large Language Model Meta AI) và Mistral của Pháp để hiểu các ngôn ngữ Ấn Độ, bắt đầu với tiếng Hindi.
Như Vivek giải thích, “Ý tưởng là tích hợp các kỹ năng ngôn ngữ Ấn Độ vào các mô hình hiện có. Sau khi hoàn thành, chúng ta có thể tạo ra các mô hình nhỏ hơn, chuyên biệt theo từng lĩnh vực như tài chính hoặc y tế, với chi phí và hiệu quả sử dụng thấp hơn nhiều.” Bằng cách xây dựng trên các nền tảng mã nguồn mở và phát hành các mô hình trên Hugging Face, OpenHathi trao quyền cho các nhà phát triển tạo ra các giải pháp AI bản địa bằng các ngôn ngữ Ấn Độ, đưa AI tự chủ đến gần hơn với người dân, từng ngôn ngữ một.
Khi Sarvam AI xây dựng các mô hình ngôn ngữ Ấn Độ, họ đã gặp phải một thách thức bất ngờ: ngôn ngữ tốn kém. Không phải vì phí dịch thuật hay bản quyền, mà vì cách AI phân tích ngôn ngữ thành các token. Ví dụ, một câu đơn giản trong tiếng Hindi cần số token nhiều gấp ba đến bốn lần so với cùng một câu trong tiếng Anh. Điều đó có nghĩa là mọi tương tác của AI với ngôn ngữ Ấn Độ đều tốn kém hơn đáng kể.
Như Vivek nói, “Cùng một câu hỏi, khi được hỏi bằng tiếng Anh, chỉ tốn một phần năm chi phí so với khi hỏi bằng một ngôn ngữ Ấn Độ.”
Thành công của họ sẽ phụ thuộc vào việc xây dựng trí tuệ nhân tạo không chỉ tiên tiến mà còn phải có giá cả phải chăng, toàn diện và nhận biết được ngữ cảnh.
Để giải quyết vấn đề này, nhóm Sarvam đã tạo ra các token tốt hơn cho các ngôn ngữ Ấn Độ và cải thiện hiệu suất mà không làm tăng chi phí, tập trung vào việc xây dựng các bộ dữ liệu chất lượng cao để nâng cao mô hình. Bằng cách giải quyết vấn đề tận gốc, Sarvam AI đã giúp việc chạy các mô hình AI bằng các ngôn ngữ Ấn Độ trở nên rẻ hơn và hiệu quả hơn, một bước quan trọng hướng tới việc giúp AI dễ tiếp cận hơn đối với các nhân viên y tế, sinh viên và người dùng thông thường trên khắp Ấn Độ.
Sarvam AI có các đối tác và đối thủ cạnh tranh tại Ấn Độ. Vào tháng 4 năm 2023, Bhavish Aggarwal, đồng sáng lập của Ola Cabs, đã ra mắt Krutrim, một công ty khởi nghiệp về trí tuệ nhân tạo tập trung vào phát triển các mô hình quản lý học tập (LLM) được thiết kế riêng cho thị trường Ấn Độ. Cùng nhau, Krutrim và Sarvam AI đại diện cho một xu hướng đang phát triển trong hệ sinh thái công nghệ Ấn Độ, nơi các công ty khởi nghiệp trong nước đang tận dụng trí tuệ nhân tạo để giải quyết các nhu cầu và thách thức đặc thù của đất nước .
Được huấn luyện trên hơn 2 nghìn tỷ token, Krutrim có thể hiểu và tạo văn bản bằng 22 ngôn ngữ Ấn Độ, trở thành một trong những mô hình toàn diện nhất được thiết kế cho dân số đa dạng của Ấn Độ. Nhưng sức mạnh thực sự của Krutrim nằm ở khả năng tiết kiệm chi phí. Được xây dựng dựa trên cơ sở hạ tầng của Ấn Độ, nó được tối ưu hóa để hoạt động hiệu quả mà không cần đến siêu máy tính. Điều này làm cho nó trở nên lý tưởng cho các trường học, công ty khởi nghiệp và các dịch vụ chính phủ muốn có trí tuệ nhân tạo mạnh mẽ với chi phí thấp.
Cùng nhau, Krutrim, Sarvam và làn sóng các công ty khởi nghiệp AI đang lên của Ấn Độ đang viết lại cẩm nang AI toàn cầu với các giải pháp không chỉ thông minh mà còn có khả năng mở rộng, giá cả phải chăng và đa ngôn ngữ. Và họ không đơn độc. Hệ sinh thái khởi nghiệp AI đang phát triển mạnh mẽ của Ấn Độ là nơi quy tụ nhiều dự án sáng tạo đang đạt được những bước tiến đáng kể trong lĩnh vực AI tạo sinh.
Những công ty khởi nghiệp này phản ánh sức mạnh ngày càng tăng của hệ sinh thái AI của Ấn Độ - giải quyết các thách thức địa phương với tầm ảnh hưởng toàn cầu. Thành công của họ sẽ phụ thuộc vào việc xây dựng AI không chỉ tiên tiến mà còn phải có giá cả phải chăng, toàn diện và nhận biết ngữ cảnh.
Vivek tin rằng Ấn Độ có một cơ hội độc đáo để định hình tương lai của trí tuệ nhân tạo, không phải bằng cách theo đuổi những mô hình khổng lồ, tốn kém như ở Thung lũng Silicon, mà bằng cách tập trung vào trí tuệ nhân tạo tiết kiệm, hướng đến mục đích và giải quyết các vấn đề thực tế. Cách tiếp cận ưu tiên Ấn Độ này đối với trí tuệ nhân tạo - tiết kiệm, toàn diện và đa ngôn ngữ - cung cấp một mô hình cho các nước đang phát triển.
--------
Đồng tác giả:
- Jaideep Prabhu là giáo sư marketing tại trường Judge Business School thuộc Đại học Cambridge.
- Priyank Narayan là phó giáo sư thực hành, chuyên ngành khởi nghiệp và quản lý tại Đại học Ashoka, Ấn Độ.
- Mukesh Sud là giảng viên thỉnh giảng tại Khoa Khởi nghiệp của Đại học Ashoka, Ấn Độ.
(Theo ROW)
Hà Minh