OpenAI sfida Google e Anthropic con il nuovo Operator o3: cosa cambia?
News - 24/05/2025
di Redazione
OpenAI ha annunciato un importante aggiornamento per il suo agente AI Operator, passando dal modello GPT-4o al più avanzato o3, parte della nuova serie di modelli di ragionamento dell’azienda.
Progettato per navigare sul web e interagire con software in macchine virtuali ospitate nel cloud, il nuovo Operator promette maggiore intelligenza, sicurezza e affidabilità.
Il modello o3: un salto nel ragionamento
Il modello o3, appartenente alla nuova serie di sistemi di ragionamento di OpenAI, rappresenta un progresso significativo rispetto al precedente GPT-4o. Secondo OpenAI, o3 eccelle in attività che richiedono un ragionamento complesso, in particolare in matematica e risoluzione di problemi. I benchmark indicano che o3 supera i modelli precedenti, offrendo una base più solida per le capacità di Operator. “Stiamo sostituendo il modello basato su GPT-4o per Operator con una versione basata su OpenAI o3”, ha dichiarato l’azienda in un recente post sul blog, sottolineando le prestazioni superiori del nuovo modello. Tuttavia, la versione API di Operator continuerà a utilizzare il modello 4o, garantendo continuità per gli sviluppatori.
Sicurezza e affidabilità potenziate
La sicurezza rimane una priorità fondamentale per OpenAI, soprattutto per un agente AI come Operator che interagisce direttamente con internet. Il nuovo modello o3 Operator è stato ottimizzato con dati di sicurezza aggiuntivi, inclusi set di dati progettati per definire “i confini decisionali su conferme e rifiuti”. Questa ottimizzazione riduce la probabilità che il modello intraprenda attività illecite o acceda a dati personali sensibili. Secondo un rapporto tecnico rilasciato da OpenAI, o3 Operator è anche meno vulnerabile agli attacchi di prompt injection, una tecnica che manipola le uscite del modello attraverso input accuratamente progettati.
OpenAI ha sottolineato il suo approccio multilivello alla sicurezza, dichiarando: “o3 Operator utilizza lo stesso approccio multilivello alla sicurezza adottato per la versione 4o di Operator”. Tuttavia, l’azienda ha chiarito che, sebbene o3 Operator erediti le capacità di codifica di o3, non ha accesso nativo a un ambiente di codifica o terminale, garantendo interazioni controllate con sistemi esterni.
Il panorama competitivo: Google e Anthropic
Operator di OpenAI non è l’unico protagonista nella corsa alla supremazia nella tecnologia degli agenti AI. Google ha introdotto un agente per “uso del computer” attraverso la sua Gemini API, in grado di navigare sul web ed eseguire azioni per conto degli utenti. Inoltre, l’offerta consumer-oriented di Google, Mariner, si rivolge a funzionalità simili, posizionandosi come diretto concorrente di Operator. Nel frattempo, Anthropic, nota per i suoi modelli Claude, ha sviluppato sistemi AI capaci di eseguire compiti come aprire file e navigare su pagine web, intensificando ulteriormente la competizione.
Il Gemini 2.5 Pro di Google, lanciato a marzo 2025, è stato elogiato per le sue capacità di ragionamento integrate e le solide prestazioni in benchmark, inclusi compiti di codifica e multimodali. I modelli Claude Opus 4 e Claude Sonnet 4 di Anthropic, annunciati il 22 maggio scorso, hanno attirato attenzione per le loro avanzate capacità di automazione nei contesti lavorativi.
Cosa rende unico o3 Operator?
Il modello o3 Operator si distingue per la sua capacità di integrare un ragionamento avanzato con applicazioni pratiche. A differenza dei suoi predecessori, o3 Operator è progettato per gestire compiti complessi e multi-step con maggiore precisione ed efficienza. Ad esempio, i test iniziali hanno mostrato miglioramenti in attività che richiedono un’interazione prolungata con i browser web, come completare transazioni online o navigare su siti web complessi. Il rapporto tecnico di OpenAI evidenzia che o3 Operator raggiunge punteggi più alti rispetto al modello GPT-4o Operator in valutazioni di sicurezza specifiche, riducendo il rischio di comportamenti indesiderati.