OpenAI nêu các tính năng ưu việt của ứng dụng Sora: 'ChatGPT cho lĩnh vực tạo video'

OpenAI nêu các tính năng ưu việt của ứng dụng Sora: 'ChatGPT cho lĩnh vực tạo video'
2 giờ trướcBài gốc
Đây là nỗ lực của OpenAI nhằm thay đổi trải nghiệm với công nghệ mới nổi này giống như những gì ChatGPT làm với chatbot ba năm trước.
Ứng dụng Sora miễn phí, có sẵn từ ngày 30.9 theo lời mời, được vận hành bằng mô hình tạo video AI mới nhất của OpenAI là Sora 2. Giống mô hình Sora trình làng vào tháng 12.2024, bạn có thể tạo video ngắn từ câu lệnh bằng văn bản, nhưng ứng dụng mới cho phép chúng ta xem video do người khác tạo. Ngoài ra, bạn có thể tạo avatar AI và giọng nói chân thực của mình, rồi chèn vào video do người khác tạo bằng ứng dụng Sora.
Dù thành công vang dội với ChatGPT, chatbot AI hiện có hơn 700 triệu người dùng hàng tuần, OpenAI vẫn chưa thể biến Sora thành cái tên quen thuộc. Công ty khởi nghiệp AI hàng đầu đang phải đối mặt với sự cạnh tranh gay gắt từ Google, Runway AI và Midjourney - cả ba đều cung cấp mô hình AI có khả năng tạo ra video ngắn nhanh chóng.
Với ứng dụng mới, OpenAI cũng đang thực hiện bước tiến lớn nhất từ trước đến nay trong việc xây dựng một sản phẩm truyền thông xã hội. Động thái này đặt OpenAI vào thế cạnh tranh gay gắt hơn với các dịch vụ từ TikTok và Meta Platforms, công ty gần đây đã giới thiệu nguồn cấp dữ liệu video AI có tên Vibes. Trong quá trình đó, OpenAI có thể mở ra cánh cửa cho các nguồn doanh thu mới từ quảng cáo và cũng gia tăng mức độ hiện diện cho công nghệ của mình.
"Nhiều người trong chúng tôi, ngay cả trong nội bộ, cũng có phần hoài nghi về ý tưởng về nguồn cấp dữ liệu do AI tạo. Theo thời gian, tôi nhận thấy rất nhiều nền tảng xã hội khác thực sự đã dần rời xa ý tưởng về kết nối và bạn bè. Tính năng cameo, cho phép người dùng chèn hình ảnh họ vào video, khiến nhân viên OpenAI nghĩ rằng nguồn cấp dữ liệu có thể tốt cho thế giới", Thomas Dimson, kỹ sư phần mềm OpenAI, nói trong một cuộc họp báo.
OpenAI đang phát hành ứng dụng mạng xã hội độc lập, được vận hành bởi mô hình tạo video AI Sora 2 - Ảnh: AFP
Khắc phục những hạn chế của công nghệ tạo video bằng AI
Ứng dụng Sora cũng được thiết kế để khắc phục những hạn chế lâu nay của công nghệ tạo video bằng AI. OpenAI cho biết ứng dụng này được thiết kế để tạo ra các video có hình ảnh tuân theo các định luật vật lý tốt hơn, điều mà từ lâu đã là thách thức với các dịch vụ khác, gồm cả mô hình Sora gốc.
Ứng dụng Sora cũng được cải thiện trong việc bám sát yêu cầu của người dùng, đặc biệt là khi video gồm nhiều cảnh liên tiếp.
Bill Peebles, người đứng đầu nhóm Sora của OpenAI, cho biết: "Chúng tôi thực sự tin rằng mình đang nắm trong tay thứ gì đó có thể trở thành ‘khoảnh khắc ChatGPT’ cho lĩnh vực tạo video".
Bill Peebles nói ứng dụng mới nhất của OpenAI có khả năng tạo các đoạn video có hình ảnh phức tạp hơn, chẳng hạn một người thực hiện cú lộn ngược trên ván chèo giữa dòng nước, với đầy đủ các yếu tố động lực học chất lỏng và lực nổi. Sora cũng được thiết kế để tạo ra các cảnh riêng lẻ và tự động ghép chúng lại với nhau, thay vì yêu cầu người dùng phải tự chỉnh sửa.
Chưa hết, ứng dụng này cũng có thể sử dụng AI để tạo âm thanh mà sau đó được đồng bộ hóa với video, gồm hiệu ứng âm thanh, tiếng ồn nền và hội thoại bằng nhiều ngôn ngữ. Những tính năng đó có thể giúp Sora trở nên hấp dẫn hơn ở Hollywood, ngành công nghiệp mà OpenAI tiếp cận trong nhiều tháng qua nhưng kết quả vẫn chưa thật sự rõ ràng.
Tuy nhiên, khi năng lực của Sora được OpenAI cải thiện, điều này chắc chắn sẽ làm dấy lên lo ngại về việc ảnh hưởng đến sinh kế của nhiều người ở ngành điện ảnh, cũng như khiến việc phân biệt nội dung thật – giả trên mạng ngày càng khó khăn.
OpenAI thông báo sẽ không cho phép mọi người tạo video có nhân vật của công chúng, trừ khi những cá nhân đó chọn tự đóng vai khách mời qua tính năng cameo. Công ty cũng sẽ không cho phép tạo video về người dựa trên một bức ảnh.
“Cha đẻ ChatGPT” cho biết các video tạo bằng ứng dụng Sora sẽ được gắn dấu hiệu nhận diện để đảm bảo người dùng biết đang xem video do AI tạo. OpenAI sẽ vô hiệu hóa tính năng ghi màn hình ứng dụng Sora để giúp kiểm soát cách chia sẻ video.
Ứng dụng Sora sẽ có sẵn trên hệ điều hành iOS của Apple trước, với kế hoạch mở rộng sang Android của Google trong tương lai.
Ngoài ra, OpenAI sẽ cung cấp mô hình tạo video AI mới nhất Sora 2 thông qua trang web sora.com, hiện chưa mở cho người dùng tại Việt Nam.
Sam Altman: “Khoảnh khắc ChatGPT dành cho sáng tạo”
Trên tài khoản mạng xã hội X và blog của mình, Sam Altman (Giám đốc điều hành OpenAI) đã đăng bài viết giới thiệu về ứng dụng Sora với nội dung như sau:
“Chúng tôi đang ra mắt ứng dụng mới có tên Sora. Đây là sự kết hợp giữa mô hình mới mang tên Sora 2 với sản phẩm mới giúp việc tạo, chia sẻ và xem video trở nên dễ dàng hơn bao giờ hết.
Với nhiều người trong chúng tôi, đây giống như một 'khoảnh khắc ChatGPT dành cho sáng tạo', vừa thú vị vừa mới mẻ. Có một điều tuyệt vời là khi việc biến một ý tưởng thành sản phẩm thực tế trở nên dễ dàng và nhanh chóng thì cũng kéo theo những động lực xã hội mới xuất hiện.
Sự sáng tạo có thể sắp trải qua một 'vụ nổ kỷ Cambri' và cùng với đó, chất lượng nghệ thuật và giải trí có thể tăng vọt. Ngay cả trong những ngày đầu tiên thử nghiệm Sora, nhiều người trong chúng tôi đã cảm thấy bất ngờ về việc sân chơi sáng tạo bỗng trở nên rộng mở như thế nào.
Vụ nổ kỷ Cambri là thuật ngữ trong sinh học tiến hóa, chỉ một giai đoạn cách đây khoảng 541 triệu năm, khi sự sống trên Trái đất bùng nổ mạnh mẽ: Trong khoảng thời gian ngắn về mặt địa chất (khoảng 20-25 triệu năm), hầu hết nhóm động vật lớn xuất hiện và đa dạng hóa nhanh chóng.
Đặc biệt, khả năng đưa chính bạn và bạn bè vào trong video qua tính năng cameo (nhóm phát triển đã làm việc rất chăm chỉ để đảm bảo tính nhất quán của nhân vật), mang lại cho chúng tôi nhiều trải nghiệm thú vị trong giai đoạn thử nghiệm. Với nhiều người, đây là cách kết nối mới mẻ và hấp dẫn đến bất ngờ.
Tuy vậy, chúng tôi cũng có những lo ngại. Mạng xã hội từng mang lại một số tác động tích cực cho thế giới, nhưng cũng để lại không ít hệ quả tiêu cực. Chúng tôi nhận thức được rằng một dịch vụ như thế này có thể trở nên gây nghiện đến mức nào và dễ hình dung được nó có thể bị lạm dụng để bắt nạt người khác ra sao.
Rất dễ tưởng tượng ra một 'trường hợp suy đồi' của việc tạo video bằng AI, nơi tất cả chúng ta bị cuốn vào luồng dữ liệu được tối ưu hóa bằng học tăng cường chỉ để gây nghiện. Đội ngũ đã dồn nhiều tâm huyết và suy nghĩ để tìm ra cách tạo ra một sản phẩm hấp dẫn mà không sa vào chiếc bẫy đó, và đã đưa ra một số ý tưởng hứa hẹn. Trong giai đoạn đầu, chúng tôi sẽ thử nghiệm các phương pháp tiếp cận khác nhau.
Ngoài các biện pháp bảo vệ đã được triển khai (chẳng hạn ngăn chặn việc lạm dụng hình ảnh cá nhân để làm deepfake, biện pháp phòng ngừa với nội dung gây sốc hoặc bất hợp pháp, kiểm tra định kỳ về việc Sora ảnh hưởng đến tâm trạng và sức khỏe tinh thần của người dùng ra sao), chúng tôi chắc chắn sẽ còn phát hiện ra nhiều việc cần phải làm thêm nếu Sora trở nên thành công.
Để giúp OpenAI hướng đến nhiều điều tốt đẹp hơn và ít điều xấu hơn, sau đây là một số nguyên tắc mà chúng tôi áp dụng cho sản phẩm này:
- Tối ưu hóa cho sự hài lòng lâu dài của người dùng. Phần lớn người dùng, khi nhìn lại 6 tháng đã qua, nên cảm thấy cuộc sống của họ tốt hơn nhờ sử dụng Sora so với khi không dùng. Nếu điều đó không xảy ra, chúng tôi sẽ thực hiện những thay đổi lớn. Nếu không thể khắc phục, chúng tôi sẽ ngừng cung cấp dịch vụ.
- Khuyến khích người dùng kiểm soát nguồn cấp dữ liệu. Bạn có thể yêu cầu Sora hiển thị những gì mình muốn, ví dụ muốn xem video giúp thư giãn hay truyền năng lượng? Hoặc chỉ những video phù hợp với một sở thích cụ thể? Hoặc chỉ trong một khoảng thời gian nhất định? Trong tương lai, khi công nghệ tiến bộ hơn, bạn sẽ có thể nói với Sora chi tiết bằng ngôn ngữ tự nhiên. Tuy nhiên, chế độ kiểm soát của phụ huynh dành cho thanh thiếu niên sẽ gồm cả tùy chọn không sử dụng luồng dữ liệu cá nhân hóa, cùng các tính năng khác như tắt tin nhắn trực tiếp.
- Ưu tiên việc sáng tạo. Chúng tôi muốn mọi người đều có thể tham gia dễ dàng và được khuyến khích trong quá trình sáng tạo. Chúng tôi tin rằng con người vốn dĩ là những nhà sáng tạo. Việc sáng tạo đóng vai trò quan trọng với sự thỏa mãn của chúng ta.
- Giúp người dùng đạt được mục tiêu lâu dài. Chúng tôi muốn hiểu được mục tiêu thực sự của người dùng và hỗ trợ họ đạt được. Nếu bạn muốn gắn kết hơn với bạn bè, chúng tôi sẽ cố gắng hỗ trợ điều đó. Nếu bạn muốn rèn luyện sức khỏe, chúng tôi có thể gợi ý nội dung thể hình để tạo động lực cho bạn. Nếu bạn muốn khởi nghiệp, chúng tôi muốn giúp bạn học kỹ năng cần thiết. Nếu bạn thực sự chỉ muốn lướt video vô thức thì cũng được thôi, chúng tôi sẽ hỗ trợ, dù mong người dùng dành thời gian sử dụng ứng dụng khi họ thấy đáng giá.
Sơn Vân
Nguồn Một Thế Giới : https://1thegioi.vn/openai-neu-cac-tinh-nang-uu-viet-cua-ung-dung-sora-chatgpt-cho-linh-vuc-tao-video-238272.html