NVIDIA-მ, კორნელის უნივერსიტეტის მკვლევრებთან თანამშრომლობით, წარმოადგინა VideoLDM, ხელოვნური ინტელექტის მოდელი, რომელსაც შეუძლია ტექსტური აღწერილობების საფუძველზე 2048×1280 p-მდე მაღალი გარჩევადობის ვიდეოს გენერირება, სიხშირით 24 კადრი/წმ და 4.7 წამის ხანგრძლივობით.
მოდელი დაფუძნებულია სტაბილური დიფუზიის ნეირონული ქსელის ტექნოლოგიაზე და აქვს 4.1 მილიარდამდე პარამეტრი, რაც მას ერთ-ერთ ყველაზე მოწინავე ვიდეო ტექსტის გენერატორად აქცევს. VideoLDM-ს ასევე შეუძლია ერთი ფოტოს გამოყენებით 5 წუთამდე ხანგრძლივობის 1024x512 გარჩევადობის ვიდეოების გენერირება მართვის სცენარებისთვის. გარდა ამისა, VideoLDM-ს შეუძლია ერთი და იგივე კადრის საფუძველზე მრავალი შესაძლო მართვის სცენარის პროგნოზირება.
NVIDIA VideoLDM AI მოდელის გამოყენება შესაძლებელია სხვადასხვა სფეროში, მათ შორის კინოსა და ტელევიზიის წარმოებასა და ვიდეო თამაშების შემუშავებაში.




