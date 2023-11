Startup-ul AI din spatele Stable Diffusion testează acum videoclipuri generative. Stable Video Diffusion poate genera până la 25 de cadre dintr-o imagine statică.

Ce face Stable Video Diffusion

Arta generativă a lui Stable Diffusion poate fi acum animată, a anunțat dezvoltatorul Stability AI. Compania a lansat un nou produs numit Stable Video Diffusion într-o previzualizare de cercetare, permițând utilizatorilor să creeze videoclipuri dintr-o singură imagine.

„Acest model video AI generativ de ultimă generație reprezintă un pas semnificativ în călătoria noastră către crearea de modele pentru toată lumea, de orice tip”, a scris compania.

Noul instrument a fost lansat sub forma a două modele imagine-to-video, fiecare capabil să genereze între 14 și 25 de cadre la viteze între 3 și 30 de cadre pe secundă, la o rezoluție de 576 × 1024. Este capabil să sinteze mai multe vizualizări dintr-un singur cadru cu reglaj fin pe seturi de date cu mai multe vizualizari.

„La momentul lansării în forma lor de bază, prin evaluare externă, am constatat că aceste modele depășesc modelele închise de top în studiile de preferințe ale utilizatorilor”, a spus compania, comparând-o cu platformele text-to-video Runway și Pika Labs.

Viitorul videoclipurilor AI

Difuzarea video stabilă este disponibilă doar în scopuri de cercetare în acest moment, nu pentru aplicații reale sau comerciale. Utilizatorii potențiali se pot înscrie pentru a intra pe o listă de așteptare, pentru a avea acces la o „experiență web viitoare, cu o interfață text-video”, a scris Stability AI. Instrumentul va prezenta aplicații potențiale în sectoare precum publicitate, educație, divertisment și multe altele.

Mostrele prezentate în videoclipul de mai jos par a fi de o calitate relativ înaltă, potrivindu-se cu sistemele generative rivale. Cu toate acestea, are unele limitări, a scris compania: generează un videoclip relativ scurt (mai puțin de 4 secunde), nu are un fotorealism perfect, nu are control text, nu poate genera text lizibil și poate nu generează în mod corespunzător oameni și chipuri.

Instrumentul a fost antrenat pe un set de date de milioane de videoclipuri și apoi ajustat pe un set mai mic, Stability AI spunând doar că a folosit videoclipuri care erau disponibile public în scopuri de cercetare. Originea setului de date este importantă, având în vedere că Stability AI a fost dat recent în judecată de către Getty Images.

Videoclipul este un obiectiv cheie pentru IA generativă, datorită potențialului său de a simplifica crearea de conținut. Cu toate acestea, este și un instrument cu cel mai mare potențial de abuz prin deepfake, încălcări ale drepturilor de autor și multe altele. Și, spre deosebire de OpenAI cu produsul său ChatGPT, Stability a avut mai puțin succes în comercializarea produsului său Stable Diffusion.