Google vừa chính thức đưa mô hình AI tạo video Veo 2 vào nền tảng Gemini Advanced – gói dịch vụ cao cấp dành cho người dùng đăng ký trả phí. Đây được xem là bước đi nhằm đối đầu trực diện với Sora của OpenAI, trong bối cảnh thị trường AI video đang ngày càng cạnh tranh khốc liệt.
Từ tuần này, người dùng Gemini Advanced có thể chọn Veo 2 trong menu mô hình của ứng dụng Gemini để tạo video. Các đoạn clip tạo ra có độ dài tối đa 8 giây, độ phân giải 720p và tỷ lệ khung hình 16:9, phù hợp để chia sẻ lên TikTok, YouTube hoặc tải về dưới định dạng MP4. Mỗi video đều được đánh dấu bằng công nghệ nhận dạng nội dung SynthID của Google.
Dù vậy, Google cho biết người dùng sẽ bị giới hạn số lượng video có thể tạo mỗi tháng, và hiện tại mô hình Veo 2 chưa hỗ trợ người dùng trong các gói Google Workspace dành cho doanh nghiệp hoặc giáo dục.
Bên cạnh tích hợp vào Gemini, Veo 2 còn xuất hiện trong một tính năng thử nghiệm mới mang tên Whisk thuộc nền tảng Google Labs. Whisk cho phép người dùng dùng hình ảnh làm prompt để tạo hình ảnh mới, còn Whisk Animate sẽ biến những hình ảnh đó thành video Veo 2 kéo dài 8 giây. Google Labs hiện được mở khóa thông qua gói AI Premium với giá 20 USD/tháng.
CEO của Google DeepMind – ông Demis Hassabis – gần đây chia sẻ rằng Google có kế hoạch kết hợp mô hình Gemini với Veo để nâng cao khả năng hiểu biết về thế giới vật lý trong các hệ thống AI. Tuy nhiên, ở thời điểm hiện tại, các ứng dụng của Veo 2 vẫn ở mức cơ bản, chủ yếu phục vụ mục đích sáng tạo nội dung ngắn.
Mặt khác, sự phát triển nhanh chóng của công nghệ tạo video AI cũng khiến nhiều nghệ sĩ và nhà sáng tạo lo ngại. Một nghiên cứu do Animation Guild công bố năm 2024 ước tính rằng hơn 100,000 việc làm trong ngành phim, truyền hình và hoạt hình tại Mỹ có thể bị ảnh hưởng bởi AI vào năm 2026.