Theo số liệu của Hugging Face, hiện có khoảng hơn 1,4 triệu mô hình AI trên toàn thế giới. Dưới đây là những mô hình AI nổi bật nhất đã được biết đến từ năm 2024 trở lại đây:
OpenAI o3-mini
Đây là mô hình chatbotAI mới nhất của OpenAI và được tối ưu hóa cho các nhiệm vụ liên quan đến STEM như mã hóa, toán học và khoa học. Đây không phải là mô hình mạnh nhất của OpenAI nhưng vì nó nhỏ gọn nên chi phí phát triển không tốn quá nhiều tiền. Nền tảng o3-mini được cung cấp miễn phí, nhưng người dùng nhiều sẽ phải đăng ký thuê bao.
OpenAI Deep Research
Mô hình OpenAI Deep Research được thiết kế để người dùng thực hiện nghiên cứu chuyên sâu về một chủ đề nào đó. Dịch vụ này chỉ khả dụng với gói đăng ký Pro trị giá 200 USD mỗi tháng của ChatGPT. OpenAI khuyên dùng cho mọi thứ, từ nghiên cứu khoa học đến nghiên cứu mua sắm, nhưng hãy cẩn thận vì ảo giác vẫn là vấn đề đối với AI.
Mistral Le Chat
Mistral đã ra mắt phiên bản ứng dụng của Le Chat, một trợ lý cá nhân AI đa phương thức. Mistral tuyên bố Le Chat phản hồi nhanh hơn bất kỳ chatbot nào khác. Nó cũng có phiên bản trả phí với báo chí cập nhật từ AFP. Các thử nghiệm từ Le Monde cho thấy hiệu suất của Le Chat rất ấn tượng, mặc dù nó mắc nhiều lỗi hơn ChatGPT.
OpenAI Operator
OpenAI Operator được thiết kế như một trợ lý cá nhân có thể làm mọi việc một cách độc lập, như giúp người dùng mua đồ online. Để sử dụng Operator, người dùng phải đăng ký ChatGPT Pro với giá 200 USD một tháng. Các trợ lý AI có tiềm năng rất hứa hẹn, nhưng chúng vẫn đang trong giai đoạn thử nghiệm. Một người dùng Operator đã bình luận trên Washington Post rằng ứng dụng này đã tự quyết định đặt mua một tá trứng với giá 31 USD (quá đắt), thanh toán bằng thẻ tín dụng của anh ta.
Google Gemini 2.0 Pro bản Thử nghiệm
Google Gemini 2.0 vượt trội về khả năng mã hóa và hiểu kiến thức chung. Nó cũng có cửa sổ ngữ cảnh siêu dài với 2 triệu token (mã thông báo), giúp người dùng xử lý nhanh khối lượng văn bản lớn. Dịch vụ này yêu cầu tối thiểu đăng ký Google One AI Premium với giá 19,99 USD một tháng.
DeepSeek R1
Mô hình AI của Trung Quốc này đã gây bão tại Thung lũng Silicon. Phiên bản DeepSeek R1 hoạt động tốt về mã hóa và toán học, trong khi bản chất mã nguồn mở của nó có nghĩa là bất kỳ ai cũng có thể chạy nó tại máy tính hay máy chủ nội bộ. Hơn nữa, ứng dụng này miễn phí. Tuy nhiên, R1 tích hợp kiểm duyệt của chính phủ Trung Quốc và phải đối mặt với lệnh cấm ngày càng tăng vì có khả năng gửi dữ liệu người dùng trở lại Trung Quốc.
Gemini Deep Research
Deep Research tóm tắt kết quả tìm kiếm của Google trong một tài liệu đơn giản và được trích dẫn đầy đủ. Dịch vụ này hữu ích cho sinh viên và bất kỳ ai khác cần tóm tắt nghiên cứu nhanh. Tuy nhiên, chất lượng của nó được đánh giá là chưa tốt lắm. Deep Research yêu cầu đăng ký Google One AI Premium với giá 19,99 USD.
Meta Llama 3.3 7B
Đây là phiên bản mới nhất và tiên tiến nhất của các mô hình Llama AI mã nguồn mở của Meta. Meta đã quảng cáo phiên bản này là rẻ nhất và hiệu quả nhất từ trước đến nay, đặc biệt là đối với toán học, kiến thức chung và các hướng dẫn. Phiên bản này miễn phí và sử dụng mã nguồn mở.
OpenAI Sora
Sora là một mô hình tạo ra các video dựa trên văn bản. Mặc dù có thể tạo ra toàn bộ cảnh quay thay vì chỉ các clip, OpenAI thừa nhận rằng nó thường tạo ra "hình ảnh hơi phi thực tế". Hiện tại, nó chỉ khả dụng trên các phiên bản trả phí của ChatGPT, bắt đầu từ Plus với giá 20 USD một tháng.
Alibaba Qwen QwQ-32B- bản Preview
Mô hình này của hãng Alibaba (Trung Quốc) là một trong số ít mô hình có thể cạnh tranh với mô hình o1 của OpenAI trên một số tiêu chuẩn nhất định, chẳng hạn như toán học và mã hóa. Tuy nhiên, nó cũng có điểm yếu là chịu sự kiểm duyệt của chính phủ Trung Quốc, theo thử nghiệm của TechCrunch. Mô hình này miễn phí và sử dụng mã nguồn mở.
Computer Use
Computer Use của hãng Anthropic giống như một trợ lý, có quyền sử dụng máy tính của người dùng để thực hiện các nhiệm vụ như mã hóa hoặc đặt vé máy bay. Nó cũng tương tự như mô hình Operator của OpenAI. Tuy nhiên, việc sử dụng Computer Use vẫn đang trong giai đoạn thử nghiệm. Giá sử dụng thông qua API: 0,80 USD cho một triệu token đầu vào và 4 USD cho một triệu token đầu ra.
Grok 2
x.AI - công ty AI thuộc sở hữu của Elon Musk, đã ra mắt phiên bản nâng cao của chatbot Grok 2 mà họ tuyên bố là "nhanh hơn gấp ba lần". Người dùng miễn phí bị giới hạn 10 câu hỏi sau mỗi hai giờ trên Grok, trong khi những người đăng ký gói Premium và Premium+ của X được hưởng giới hạn sử dụng cao hơn. x.AI cũng đã ra mắt trình tạo hình ảnh Aurora, tạo ra hình ảnh cực kỳ chân thực.
Grok 3
Đây là ứng dụng vừa được Elon Musk cho ra mắt ngày 18/2 và tuyên bố rằng mô hình này sẽ cách mạng hóa sự hiểu biết của con người với sức mạnh tính toán và sự sáng tạo chưa từng có. Một trong những tính năng nổi bật nhất của Grok-3 là tính sáng tạo. Chatbot AI này có thể lên ý tưởng cho một chương trình, chẳng hạn như lên ý tưởng cho một trò chơi kết hợp giữa Tetris và Puyo Puyo theo một cách mới lạ. Musk và nhóm của ông cho biết Grok-3 cũng sẽ có khả năng suy luận giống DeepSeek R1 và OpenAI o3-mini.
OpenAI o1
o1 của OpenAI được thiết kế để tạo ra những câu trả lời tốt hơn bằng cách "suy nghĩ" thông qua một tính năng lý luận ẩn. OpenAI tuyên bố rằng mô hình này vượt trội về mã hóa, toán học và bảo mật, nhưng cũng có thể đôi lúc đưa ra câu trả lời sai. Để sử dụng o1, người dùng phải đăng ký ChatGPT Plus có giá 20 USD một tháng.
Claude Sonnet 3.5
Claude Sonnet 3.5 là một mô hình mà Anthropic tuyên bố là tốt nhất trong các mô hình AI của hãng. Nó được biết đến với khả năng mã hóa và được coi là chatbot được người trong ngành công nghệ lựa chọn. Mô hình này có thể được truy cập miễn phí trên Claude mặc dù người dùng nhiều sẽ cần đăng ký gói Pro hàng tháng với giá 20 USD. Mặc dù nó có thể hiểu hình ảnh, nhưng không thể tạo ra hình ảnh như một số ứng dụng AI đồ họa khác.
GPT 4o-mini
OpenAI đã giới thiệu GPT 4o-mini là mô hình giá cả phải chăng và nhanh nhất nhờ kích thước nhỏ. Nó được thiết kế để hỗ trợ nhiều tác vụ như chatbot dịch vụ khách hàng. Mô hình này có sẵn miễn phí trên ChatGPT. Nó phù hợp với các tác vụ đơn giản.
Cohere Command R+
Mô hình Command R+ của Cohere vượt trội trong các ứng dụng Retrieval-Augmented Generation (hay RAG) - một kỹ thuật kết hợp giữa việc truy xuất thông tin và sinh ngôn ngữ tự nhiên. Đây là một mô hình dành cho doanh nghiệp. Nó có thể tìm và trích dẫn các thông tin cụ thể thực sự tốt. Tuy nhiên, RAG vẫn chưa giải quyết hoàn toàn vấn đề ảo giác của AI.
Đăng Khoa