Rețeaua neuronală Nvidia poate crea un videoclip pe baza textului pe care îl introduci

Rețeaua neuronală Nvidia poate crea un videoclip pe baza textului pe care îl introduci

NVIDIA, în colaborare cu cercetătorii de la Universitatea Cornell, a lansat VideoLDM, un model de inteligență artificială capabil să genereze videoclipuri de înaltă rezoluție de până la 2048×1280 p, la 24 fps și cu o durată de 4,7 secunde, pe baza unor descrieri text.

Modelul se bazează pe tehnologia rețelei neuronale Stable Diffusion și are până la 4,1 miliarde de parametri, ceea ce îl face unul dintre cele mai avansate generatoare de text video. VideoLDM poate genera, de asemenea, videoclipuri de până la 5 minute, la o rezoluție de 1024x512, pentru scenarii de condus, folosind o singură fotografie. În plus, VideoLDM poate prezice mai multe scenarii de condus plauzibile pe baza aceluiași cadru.

Modelul de inteligență artificială NVIDIA VideoLDM poate fi utilizat într-o varietate de aplicații, inclusiv producția de film și televiziune și dezvoltarea de jocuri video.

Citește sursa