Modelli mondiali: la nuova frontiera dell’IA secondo Google DeepMind

News - 20/01/2025

di Redazione

Google DeepMind sta creando un nuovo team di ricercatori sull’intelligenza artificiale con l’obiettivo di sviluppare “modelli mondiali” in grado di simulare ambienti fisici. Questa iniziativa sarà guidata da Tim Brooks, ex co-leader del progetto Sora di OpenAI, che si è unito a DeepMind a ottobre per lavorare sui simulatori mondiali e sulla generazione video di Google.

Cosa sono i modelli mondiali?

I modelli mondiali rappresentano uno sviluppo relativamente nuovo nel campo dell’IA e potrebbero avere diverse applicazioni, come la creazione di ambienti multimediali interattivi in tempo reale per videogiochi e film, e scenari di addestramento realistici per robot e altri sistemi di IA. Questo progetto si inserisce anche nella strategia di Google per raggiungere un sistema di intelligenza artificiale generale (AGI) prima dei suoi concorrenti.

Le ambizioni di DeepMind

“DeepMind ha piani ambiziosi per creare enormi modelli generativi che simulano il mondo”, ha annunciato Brooks in un post su X. Brooks ha incluso due annunci di lavoro aperti per ingegneri e scienziati della ricerca che contribuiranno a far progredire i “modelli mondiali” dell’IA, in grado di simulare scenari del mondo reale risolvendo problemi relativi all’addestramento “su scala massiccia”, alla cura dei dati di addestramento e allo studio di come possono essere integrati con modelli linguistici multimodali.

DeepMind has ambitious plans to make massive generative models that simulate the world. I'm hiring for a new team with this mission. Come build with us!https://t.co/pqvALtAvLs https://t.co/vtwgeXl9Dl
— Tim Brooks (@_tim_brooks) January 6, 2025

Obiettivo: l’intelligenza artificiale generale

“Riteniamo che il ridimensionamento del pre-addestramento su video e dati multimodali sia fondamentale per l’intelligenza artificiale generale”, ha affermato DeepMind nelle descrizioni dei lavori. “I modelli mondiali alimenteranno numerosi domini, come il ragionamento visivo e la simulazione, la pianificazione per agenti embodied e l’intrattenimento interattivo in tempo reale”.

La corsa all’AGI

La corsa per essere i primi a dichiarare l’AGI si sta intensificando, quindi l’attenzione di Google in questo settore non sorprende. Il CEO di OpenAI, Sam Altman, ha di recente affermato che l’azienda ha trovato il modo per raggiungere il punto di riferimento a lungo ricercato nel settore tecnologico e che gli agenti autonomi di IA potrebbero iniziare a unirsi in modo significativo alla forza lavoro quest’anno.

Collaborazione con altri progetti Google AI

Il nuovo team di DeepMind lavorerà insieme a progetti Google AI esistenti, inclusi i suoi modelli di IA Gemini di punta, il generatore video Veo e Genie, il precedente modello mondiale di Google per simulare ambienti 3D giocabili in tempo reale.

Genie: il modello mondiale di Google

Genie è l’interpretazione di Google di un modello mondiale: un’IA che può simulare giochi e ambienti 3D in tempo reale. L’ultimo modello Genie di Google, presentato in anteprima a dicembre, può generare un’enorme varietà di mondi 3D giocabili.

Sviluppo di strumenti di generazione interattivi

Secondo la descrizione, il nuovo team di Brooks cercherà di sviluppare strumenti di “generazione interattiva in tempo reale” basati sui modelli che costruiscono e studierà come integrare i loro modelli con modelli multimodali esistenti come Gemini.

Impatto sul settore creativo

Diverse startup e grandi aziende tecnologiche stanno inseguendo i modelli mondiali, tra cui World Labs dell’influente ricercatrice di IA Fei-Fei Lee, la startup israeliana Decart e Odyssey. Queste credono che i modelli mondiali un giorno potrebbero essere utilizzati per creare media interattivi, come videogiochi e film, ed eseguire simulazioni realistiche come ambienti di addestramento per robot.

Tuttavia, i creativi hanno sentimenti contrastanti riguardo a questa tecnologia. Una recente indagine di Wired ha scoperto che gli studi di videogiochi come Activision Blizzard, che ha licenziato decine di lavoratori, stanno utilizzando l’IA per tagliare i costi, aumentare la produttività e compensare l’abbandono. E uno studio del 2024 commissionato dall’Animation Guild, un sindacato che rappresenta animatori e fumettisti di Hollywood, ha stimato che entro il 2026 l’IA distruggerà oltre 100.000 posti di lavoro nel cinema, nella televisione e nell’animazione solo negli Stati Uniti.

Alcune startup nel nascente spazio di modellazione del mondo, come Odyssey, si sono impegnate a collaborare con i professionisti creativi, non a sostituirli. Google farà lo stesso?

La questione del copyright

C’è anche la questione irrisolta del copyright. Alcuni modelli mondiali sembrano essere addestrati su clip di gameplay di videogiochi, il che potrebbe rendere le aziende che sviluppano quei modelli oggetto di azioni legali nei casi in cui i video non fossero concessi in licenza.

Google, che possiede YouTube, afferma di avere il permesso di addestrare i suoi modelli sui video di YouTube in conformità con i termini di servizio della piattaforma. Ma l’azienda non ha specificato quali video specifici sta utilizzando per l’addestramento.

Fonti: The Verge e TechCrunch.

Questo contenuto è stato scritto da un utente della Community. Il responsabile della pubblicazione è esclusivamente il suo autore.