Ảnh tạo bởi Google Imagen 4
Imagen 4 được tích hợp vào hệ sinh thái Gemini, có mặt trên Google AI Studio, Vertex AI và các công cụ văn phòng như Google Slides và Docs. Với tốc độ xử lý nhanh gấp 10 lần phiên bản tiền nhiệm, Imagen 4 cho phép người dùng tạo ra những hình ảnh rõ nét, chi tiết và sống động chỉ từ một đoạn mô tả ngắn.
Đặc biệt, khả năng thể hiện văn bản trong ảnh của mô hình này được cải thiện đáng kể – một điểm yếu tồn tại từ lâu của các mô hình tạo ảnh AI. Người dùng có thể tạo ra các poster, thiệp mừng, truyện tranh và nhiều ấn phẩm đòi hỏi độ chính xác cao về chữ viết một cách dễ dàng.
Bên cạnh đó, Imagen 4 Ultra – phiên bản được tối ưu hóa về độ chính xác trong việc hiểu và thực thi prompt, cũng mang đến kết quả gần như tuyệt đối trong việc mô phỏng đúng yêu cầu của người dùng. Mức giá để sử dụng dịch vụ cũng được công bố cụ thể: 0,04 USD mỗi ảnh cho Imagen 4 và 0,06 USD mỗi ảnh với Imagen 4 Ultra. Trước mắt, người dùng có thể trải nghiệm miễn phí trên nền tảng AI Studio.
Một điểm đáng chú ý khác là việc Google tích hợp công nghệ gắn watermark không thể nhìn thấy bằng mắt thường (SynthID) lên các hình ảnh do Imagen tạo ra. Điều này giúp người dùng xác minh được nguồn gốc của hình ảnh và là bước đi chiến lược nhằm đảm bảo tính minh bạch, chống lại các hành vi lạm dụng AI trong việc tạo nội dung giả mạo.
So với các đối thủ như DALL·E 3, vốn nổi bật nhờ tích hợp trong ChatGPT, Imagen 4 gây ấn tượng bởi khả năng thể hiện chi tiết nhỏ như chất liệu vải, ánh sáng, bóng đổ, độ sâu không gian cũng như khả năng xử lý bố cục phức tạp. Các thử nghiệm cho thấy Imagen 4 có khả năng tái hiện hình ảnh vượt trội ở nhiều phong cách, từ siêu thực cho tới hoạt hình và tranh trừu tượng.
Với sự kết hợp giữa tốc độ, chất lượng và tính chính xác trong từng chi tiết, Google kỳ vọng Imagen 4 sẽ trở thành công cụ đắc lực không chỉ cho nhà thiết kế và nhà phát triển, mà còn cho các doanh nghiệp, nhà giáo dục và người dùng sáng tạo nội dung trong thời đại số. Đây là bước tiến mạnh mẽ trong lĩnh vực AI sáng tạo hình ảnh, đưa Google trở thành một trong những đối thủ hàng đầu cạnh tranh với các công cụ như DALL·E 3 của OpenAI hay Midjourney.
Dưới đây là một số prompt và hình ảnh được tạo bởi Imagen 4:
Prompt: Truyện tranh sử thi vũ trụ gồm 3 khung hình. Khung 1: 'Tàu Stardust' nhỏ bay trong vũ trụ; radar cho thấy sự bất thường (khung văn bản hiện chữ "ANOMALY DETECTED", chữ trên thân tàu là "STARDUST". Phi công thì thầm. Khung 2: Quái vật biển phát quang sinh học xuất hiện; bảng điều khiển có văn bản màu đỏ "WARNING!". Khung 3: Quái vật biển đuổi theo tàu qua các tiểu hành tinh; bảng điều khiển có chữ "SHIELD CRITICAL!", chữ trên màn hình là 'EVADE!'. Phi công hét lên "CRUNCH!", "ROOOOAAARR!".
Prompt: Mặt trước của một tấm bưu thiếp du lịch cổ điển về Kyoto: ngôi chùa biểu tượng dưới những tán hoa anh đào, dãy núi phủ tuyết ở phía xa, bầu trời trong xanh, màu sắc rực rỡ.
Prompt: Bức ảnh chụp một cặp đôi phiêu lưu đang leo núi lên đến đỉnh vào lúc bình minh, giơ tay lên đầy chiến thắng, phía dưới là khung cảnh toàn cảnh hùng vĩ của những thung lũng, ánh sáng huy hoàng và ấn tượng.
Prompt: Ảnh bìa thời trang: một người mẫu trong bộ váy cầu kỳ hai màu đứng trong một khung cảnh lấp lánh như hành tinh lạ, dưới hoàng hôn hai mặt trời, màu sắc siêu thực, concept cao cấp, đậm chất điện ảnh.
Đăng Khoa