Google, Veo 3 genera video con audio realistico

Google ha aperto le porte del futuro al Google I/O 2025, l’evento annuale dedicato agli sviluppatori, presentando una serie di strumenti basati sull’intelligenza artificiale che promettono di trasformare il modo in cui creiamo contenuti digitali.

Tra le novità più attese spiccano Veo 3, il primo modello di generazione video capace di integrare audio sincronizzato, e Imagen 4, un generatore di immagini che porta la qualità visiva a un livello mai visto prima. Questi strumenti, integrati con la piattaforma Gemini e il nuovo ambiente di produzione Flow, segnano un’evoluzione significativa nella capacità dell’AI di supportare creativi e aziende.

Veo 3: Video realistici con audio sincronizzato

Annunciato il 20 maggiodurante il keynote di Google I/O, Veo 3 rappresenta un passo avanti epocale nella generazione di video tramite intelligenza artificiale. A differenza dei modelli precedenti, questo strumento non si limita a creare immagini in movimento, ma integra suono sincronizzato, inclusi effetti sonori, rumori di fondo e dialoghi realistici.

Il modello è in grado di produrre clip di 8 secondi che catturano scene complesse, come una città trafficata con clacson e rumori ambientali o un paesaggio naturale accompagnato dal canto degli uccelli. La sincronizzazione labiale è straordinariamente precisa, e la simulazione della fisica del mondo reale, come il movimento degli oggetti o la dinamica dei fluidi, risulta incredibilmente realistica. Tuttavia, l’accesso a Veo 3 è attualmente limitato agli abbonati Google AI Ultra (al costo di $249 al mese negli Stati Uniti) tramite l’app Gemini e agli utenti aziendali su Vertex AI.

Flow: Un nuovo alleato per i filmmaker

Accanto a Veo 3, Google ha introdotto Flow, una piattaforma di produzione video pensata per i creativi, non ancora disponibile in Italia. Flow combina le capacità di Veo 3, Imagen 4 e il modello linguistico Gemini, permettendo agli utenti di creare clip cinematografiche a partire da semplici descrizioni testuali. Questo strumento si rivolge sia ad amatori che a professionisti, offrendo un’interfaccia web che consente di gestire personaggi, ambientazioni e stili visivi con facilità.

Flow è disponibile per gli abbonati Google AI Pro e Ultra negli Stati Uniti, con un’espansione prevista in altri paesi nei prossimi mesi.

Imagen 4: Immagini di qualità superiore

Parallelamente, Google ha presentato Imagen 4, il suo generatore di immagini più avanzato. Disponibile tramite l’app Gemini, Vertex AI e applicazioni Google Workspace come Docs, Slides e Vids, Imagen 4 eccelle nella creazione di immagini fotorealistiche e astratte con una risoluzione massima di 2.000 pixel. Rispetto al predecessore, Imagen 3, questo modello offre una gestione migliorata dei dettagli, come tessuti complessi, pellicce e tipografia, un’area in cui i generatori di immagini AI spesso mostravano lacune.

Secondo Google, una versione ottimizzata di Imagen 4, dieci volte più veloce, sarà disponibile a breve, rendendo il processo di creazione ancora più fluido. Gli utenti possono già accedere a Imagen 4 per generare contenuti visivi di alta qualità direttamente dalle piattaforme Google, integrandolo nei loro flussi di lavoro creativi.

Veo 2: Continuità e flessibilità creativa

Nonostante l’entusiasmo per Veo 3, Google continua a supportare Veo 2, che rimane un’opzione versatile per chi cerca maggiore controllo creativo. Questo modello consente di utilizzare immagini di riferimento per costruire scene, regolare l’angolazione della telecamera, controllare lo zoom e modificare il formato del video, passando da verticale a orizzontale. Gli utenti possono anche aggiungere o rimuovere elementi visivi, rendendo Veo 2 ideale per progetti che richiedono personalizzazioni dettagliate.

Veo 2 è accessibile tramite il piano Google AI Pro (a $20 al mese), che offre anche un pacchetto di prova di 10 generazioni video con Veo 3 per gli utenti Android e iOS tramite l’app Gemini.

Accesso ampliato e misure di sicurezza

Google sta gradualmente ampliando l’accesso a Veo 3. A partire dal 30 maggio, il piano Google AI Ultra è stato esteso a 73 paesi, inclusa la Gran Bretagna, mentre gli abbonati al piano Pro possono ora provare Veo 3 attraverso l’app Gemini e Flow, con un limite di 10 generazioni video che non si resetta mensilmente. Gli utenti vengono avvisati quando si avvicinano al limite di generazioni, con un contatore visibile nell’app.  

Per garantire trasparenza e combattere la disinformazione, Google ha introdotto un watermark visibile su tutti i video generati da Veo 3 tramite Gemini, ad eccezione di quelli creati con Flow da abbonati Ultra, che utilizzano invece un watermark invisibile basato sulla tecnologia SynthID. Il rollout del SynthID Detector, che aiuta a identificare contenuti generati dall’AI, è iniziato la settimana scorsa per un gruppo ristretto di tester e sarà presto disponibile a un pubblico più ampio.