18 apr. 2024 | 10:46

Cum faci videoclipuri cu Google Imagen și de ce vine să „pună bețe în roate” competitorului OpenAI

ACTUALITATE
Cum faci videoclipuri cu Google Imagen și de ce vine să „pună bețe în roate” competitorului OpenAI

Nu a trecut prea mult timp de când OpenAI a prezentat Sora, care a impresionat și a speriat mulți oameni cu capacitatea sa de a crea clipuri video (într-o oarecare măsură) realiste din prompturi de text. Dar avem și Imagen.

Google vine și el cu propriile sale metode de generare a videoclipurilor, cu noi modele AI sub umbrela Imagen 2 promițând lucruri mari, de asemenea.

Google a introdus Imagen 2, o familie de modele în cadrul platformei sale Vertex AI

Google a fost criticat pentru modelul său de generare a imaginilor din cadrul Gemini, care a fost puțin cam… nu prea bun.

A fost înlăturat, și în timp ce Gemini nu include Imagen 2 (cel puțin nu acum), vine cu o serie de îmbunătățiri care îl fac în general mai bun pentru generarea de imagini sau chiar video.

Îmbunătățirile aduse Imagen 2 includ funcții de inpainting și outpainting, permițând manipularea imaginilor, cum ar fi eliminarea elementelor nedorite sau adăugarea de componente noi.

Actualizarea cea mai semnificativă, totuși, este introducerea „imagini live din text”, permițând crearea de clipuri video scurte din intrări de text.

Cu toate acestea, ar trebui să ții cont că aceasta nu este Sora. În comparație cu instrumentele existente de generare a videoclipurilor, capacitățile Imagen 2 ar putea să nu fie la fel de bune în ceea ce privește rezoluția și opțiunile de personalizare. Va trebui să vedem cât de bine se descurcă în utilizarea reală.

De asemenea, este un aspect tehnic, dar acesta generează „imagini live”, care sunt clipuri scurte de 4 secunde.

Gigantul, preocupat de fenomenul deepfake

Totuși, este un început, și acest lucru ar putea servi ca o bază pentru un model real de text-to-video în lunile sau ani următori.

Google încorporează tehnologia SynthID pentru a aplica marcaje criptografice pe imaginile live, având în vedere autenticitatea și siguranța în contextul fenomenului deepfake.

În ciuda accentului pus de Google pe măsurile de siguranță, rămân întrebări cu privire la eficacitatea abordării și transparența referitoare la sursele de date de antrenament.

Primul meu contact cu presa s-a întâmplă la vârsta de 11 ani, când ziarul călărășean Pământul mi-a oferit ocazia să public în rubrica destinată copiilor. Peste ani, ajungeam la Galați unde ... vezi toate articolele