Gen-3 Alpha đối thủ nặng ký của Sora trong việc sáng tạo video từ văn bản

Gen-3 Alpha đối thủ nặng ký của Sora trong việc sáng tạo video từ văn bản


Runway, công ty dựng kỹ xảo AI cho phim đoạt Oscar "Everything Everywhere All At Once", công bố mô hình tạo video từ văn bản và nhanh chóng gây sốt.


Ra mắt đầu tháng 7, Gen-3 Alpha là bước thay đổi lớn so với mô hình Gen-2 được cung cấp miễn phí trước đó, khi "cải tiến đáng kể về độ trung thực, tính nhất quán và chuyển động so với trước". Bên cạnh đó, tốc độ tạo video cũng nhanh hơn nhiều thế hệ cũ.

Ngay sau khi xuất hiện, trên mạng xã hội, nhiều người chia sẻ các video do Gen-3 Alpha tạo ra và thu hút hàng trăm bình luận. Hầu hết khen công cụ mới "tuyệt vời, chân thực", "không thể tưởng tượng được", thậm chí lo ngại nhà quay phim, người sáng tạo nội dung video "sẽ mất việc sớm hơn dự tính". Họ cũng so sánh với Sora của OpenAI và đánh giá "một 9 một 10", là "đối thủ lớn nhất của Sora".

 

Một số video tạo bằng Runway Gen-3 Alpha. Video: X/Runway

 

Theo Runway, Gen-3 Alpha được phát triển lại từ đầu, sử dụng cơ sở hạ tầng thế hệ mới được xây dựng có mục đích cho đào tạo đa phương thức quy mô lớn. Mô hình mới được huấn luyện trên hình ảnh và video cùng lúc nhằm cải thiện tính chân thực.

Bên cạnh đó, Runway cũng đưa vào thuật toán AI cho phép cải thiện và kiểm soát chuyển động trong video theo hướng chân thực hơn, "hiểu" chuyển động trong thế giới thực và tái tạo chính xác cho video đầu ra. "Kết quả là, mọi người có thể tạo video gần với thực tế", đại diện Runway viết trên blog.

So với Gen-2 tạo video dài bốn giây trong khoảng một phút, Gen-3 Alpha có thể xuất video tối thiểu 10 giây trong thời gian chưa tới 30 giây. Người dùng có thể nhập video, hình ảnh hoặc chỉ cần đoạn văn bản ngắn để tạo video. Bản cũ chỉ hỗ trợ ảnh và văn bản.

Khác với Sora vẫn chưa được cung cấp cho người dùng cuối, Gen-3 Alpha đã có mặt để trải nghiệm, nhưng với phí 15 USD mỗi tháng hoặc 144 USD mỗi năm.

Runway ra đời năm 2018, là startup nổi tiếng về AI với 45 nhân viên toàn thời gian. Công ty đang cung cấp công cụ hỗ trợ người dùng chỉnh sửa video nhanh, như xóa phông hay thêm hiệu ứng. Ví dụ trong phim Everything Everywhere All At Once, đoạt giải Oscar 2023, nghệ sĩ hiệu ứng hình ảnh Evan Halleck đã sử dụng AI tiên tiến từ Runway để tạo kỹ xảo. "AI cắt chủ thể tốt hơn so với mắt thường", ông nói. "Tôi có thể cắt nhân vật ra khỏi khung hình, đặt gọn gàng trên một tấm ảnh trong vài phút, so với việc mất nửa ngày như trước kia".

Runway được định giá 1,5 tỷ USD sau khi huy động được 141 triệu USD từ các nhà đầu tư như Google, Nvidia. Theo The Infomation ngày 3/7, công ty có thể sắp nhận thêm khoản vốn mới 450 triệu USD, qua đó sẽ được định giá khoảng bốn tỷ USD.