6 Mô hình AI tạo video từ văn bản: Bước tiến mới trong sáng tạo nội dung

21/02/2024

Bên cạnh Sora của OpenAI đang thu hút sự chú ý toàn cầu, nhiều mô hình AI khác cũng đang tạo nên những bước tiến ấn tượng trong việc biến văn bản thành video.

Cơn sốt Dall-E với khả năng biến văn bản thành hình ảnh đã khơi dậy cuộc đua phát triển các mô hình AI sáng tạo nội dung. Nổi bật trong lĩnh vực này là các mô hình AI tạo video từ văn bản, hứa hẹn mang đến những thay đổi đột phá trong cách thức sản xuất video.

1. Sora: "Ngôi sao mới nổi" của OpenAI, Sora thu hút sự chú ý bởi khả năng tạo ra những nhân vật có biểu cảm sinh động và chân thực. Tuy nhiên, công cụ này vẫn đang được hoàn thiện để đảm bảo an toàn và mượt mà trước khi ra mắt công chúng.

2. Lumiere: Google "ghi điểm" với Lumiere, mô hình AI dựa trên thuật toán khuếch tán STUNet. Lumiere có khả năng theo dõi và chuyển động các chi tiết trong video, giúp tạo ra những thước phim mượt mà và tự nhiên.

3. VideoPoet: Mô hình ngôn ngữ lớn (LLM) này được đào tạo trên kho dữ liệu khổng lồ gồm video, ảnh, âm thanh và văn bản. VideoPoet có thể thực hiện nhiều nhiệm vụ đa dạng như tạo video từ văn bản, ảnh, video, chỉnh sửa video theo phong cách, nội dung, chuyển video thành âm thanh...

4. Emu Video: "Sản phẩm" của Meta sử dụng công nghệ chuyển đổi hình ảnh thành văn bản và kết hợp với văn bản để tạo video. Emu Video nhận được đánh giá cao từ các nhà đánh giá, vượt trội so với các công cụ khác như Imagen Video của Google, Pyoco (Nvidia) và Make-A-Video của Meta.

5. Phenaki: Mô hình này sử dụng Mask GIT trong PyTorch để tạo video từ văn bản với độ dài tối đa hai phút. Phenaki được đánh giá cao bởi tính linh hoạt, cho phép các nhà phát triển dễ dàng huấn luyện AI và tạo ra video theo ý muốn.

6. CogVideo: Nhóm nghiên cứu từ Đại học Thanh Hoa, Trung Quốc đã phát triển CogVideo, mô hình AI được đào tạo trên dữ liệu quy mô lớn. CogVideo đã tạo ấn tượng mạnh mẽ với khả năng tạo ra video chất lượng cao, thậm chí được tham dự giải thưởng Điện ảnh Viện Hàn lâm Anh (BAFTA).

Kết luận:

Sự phát triển của các mô hình AI tạo video từ văn bản mở ra những tiềm năng to lớn trong lĩnh vực sáng tạo nội dung. Các công nghệ này có thể giúp con người tạo ra video một cách nhanh chóng, dễ dàng và hiệu quả hơn, đồng thời mở ra những phương thức sáng tạo mới mẻ và độc đáo.

Like & Share

Like Topit.vn

Facebook
Disqus

Tin mới

Tên truy nhập:
Mật khẩu:
	Ghi nhớ mật khẩu
Quên mật khẩu ?