Nvidia-ს ნეირონულ ქსელს შეუძლია ვიდეოს შექმნა თქვენს მიერ შეყვანილი ტექსტის საფუძველზე

Nvidia-ს ნეირონულ ქსელს შეუძლია ვიდეოს შექმნა თქვენს მიერ შეყვანილი ტექსტის საფუძველზე

NVIDIA-მ, კორნელის უნივერსიტეტის მკვლევრებთან თანამშრომლობით, წარმოადგინა VideoLDM, ხელოვნური ინტელექტის მოდელი, რომელსაც შეუძლია ტექსტური აღწერილობების საფუძველზე 2048×1280 p-მდე მაღალი გარჩევადობის ვიდეოს გენერირება, სიხშირით 24 კადრი/წმ და 4.7 წამის ხანგრძლივობით.

მოდელი დაფუძნებულია სტაბილური დიფუზიის ნეირონული ქსელის ტექნოლოგიაზე და აქვს 4.1 მილიარდამდე პარამეტრი, რაც მას ერთ-ერთ ყველაზე მოწინავე ვიდეო ტექსტის გენერატორად აქცევს. VideoLDM-ს ასევე შეუძლია ერთი ფოტოს გამოყენებით 5 წუთამდე ხანგრძლივობის 1024x512 გარჩევადობის ვიდეოების გენერირება მართვის სცენარებისთვის. გარდა ამისა, VideoLDM-ს შეუძლია ერთი და იგივე კადრის საფუძველზე მრავალი შესაძლო მართვის სცენარის პროგნოზირება.

NVIDIA VideoLDM AI მოდელის გამოყენება შესაძლებელია სხვადასხვა სფეროში, მათ შორის კინოსა და ტელევიზიის წარმოებასა და ვიდეო თამაშების შემუშავებაში.

წაიკითხეთ წყარო