Tehnologija
| 07.08.2024
|
access_time
14:15
ShengShu Technology/Handout via Xinhua
Vidu, model za generisanje velikih video zapisa koji su razvili kineska kompanija za veštačku inteligenciju (AI) ŠengŠu tehnologija i Univerzitet Tsinghua i koji omogućava generisanje videa iz teksta u video i iz slike u video, nedavno je postao dostupan za globalnu upotrebu.
Vidu je sposoban da kreira klipove od četiri sekunde za 30 sekundi i može generisati videa do 32 sekunde u jednom potezu, piše Sinhua.
“Vidu može simulirati stvarni fizički svet, stvarajući detaljne scene koje se pridržavaju fizičkih zakona, poput prirodnog osvetljenja i efekata senki, kao i složenih facijalnih izraza. Pored toga, može generisati nadrealistični sadržaj sa dubinom i složenošću” rekao je Džu Đun, zamenik direktora Instituta za veštačku inteligenciju Univerziteta Tsinghua.
Džu je dodao da za različite žanrove poput naučne fantastike, romantike i animacije, Vidu može proizvesti scene koje hvataju suštinu svakog stila i može stvoriti visokokvalitetne kinematografske efekte, kao što su dim i refleksije sočiva.
AI model može upravljati raznim tipovima kadrova, uključujući široke kadrove, bliske kadrove i srednje kadrove i može bez napora proizvesti efekte kao što su dugi kadrovi, promene fokusa i glatki prelazi scena.
Korisnici mogu učitati portrete ili prilagođene slike likova i koristiti tekstualne opise da bi usmerili likove da izvode bilo koju radnju u bilo kojoj sceni. Ova funkcija pojednostavljuje proces produkcije videa i poboljšava kreativnu slobodu.
Kompanija je saopštila da je osnovna arhitektura Vidua predložena još 2022. godine.