Prenotare, acquistare, interagire: cosa può fare Operator di OpenAI

OpenAI ha annunciato il lancio di Operator, il primo vero tentativo della società di introdurre un agente di intelligenza artificiale (AI).

Giovedì scorso, l’azienda ha presentato in anteprima una versione di ricerca del prodotto, capace di navigare sul web ed eseguire operazioni come la compilazione di moduli, l’ordine di generi alimentari, la prenotazione di viaggi e la creazione di contenuti come meme.

Al momento, il servizio è disponibile esclusivamente negli Stati Uniti per gli utenti abbonati al piano Pro di ChatGPT, che ha un costo di 200 dollari al mese e garantisce l’accesso ai modelli più avanzati, tra cui o1. Nei prossimi mesi, OpenAI prevede di estendere il servizio agli abbonati ai piani ChatGPT Plus, con un costo di 20 dollari al mese, e di renderlo disponibile in altri Paesi.

“Operator sarà presto disponibile in altri Paesi”, ha dichiarato, infatti, Sam Altman, CEO di OpenAI, durante una diretta streaming di presentazione. Tuttavia, Altman ha precisato che l’Europa dovrà attendere più a lungo, senza fornire ulteriori dettagli sui motivi di questo ritardo. Ha inoltre definito il rilascio come una “anteprima di ricerca”, sottolineando che Operator verrà migliorato nei prossimi mesi e che OpenAI ha in programma il lancio di ulteriori agenti AI.

Gli agenti AI, a differenza dei chatbot come ChatGPT, sono progettati per agire in modo autonomo e supportare gli utenti senza richiedere input costanti. Questi strumenti raccolgono dati in base alle preferenze dell’utente e possono eseguire compiti senza intervento umano diretto.

Operator si distingue dai chatbot tradizionali, che si concentrano su conversazioni simili a quelle umane e fungono da assistenti. Secondo OpenAI, l’agente è in grado di utilizzare un browser, analizzare pagine web e interagire con esse attraverso azioni come la digitazione, i clic del mouse e lo scorrimento, oltre a “vedere” contenuti tramite screenshot.

L’interfaccia di Operator è simile a quella di ChatGPT, consentendo agli utenti di formulare richieste come “prenota una cena alle 19:00” e selezionare siti specifici, come OpenTable, o effettuare ricerche generiche tramite Google. L’agente fornisce un riepilogo dei passaggi seguiti in una barra laterale, permettendo agli utenti di individuare eventuali errori.

Gli utenti possono anche caricare immagini, come una lista della spesa scritta a mano, e chiedere a Operator di effettuare gli acquisti.

La tecnologia alla base di Operator è il Computer-Using Agent (CUA), un modello che combina le capacità visive di GPT-4o con avanzati meccanismi di ragionamento basati sull’apprendimento per rinforzo.

L’azienda ha sottolineato che il prodotto è ancora in fase di sviluppo e potrebbe commettere errori, soprattutto in presenza di interfacce complesse come la creazione di presentazioni o la gestione di calendari.

L’introduzione di Operator da parte di OpenAI non rappresenta una novità assoluta nel settore. Aziende come Microsoft, Google e Slack hanno già sviluppato agenti AI con funzionalità simili.

Secondo le previsioni del settore, il 2025 vedrà una proliferazione di agenti AI in ambiti come il customer service, le risorse umane, la sicurezza dei dati e le organizzazioni del settore pubblico, con l’obiettivo di ottimizzare il tempo degli utenti e migliorare l’efficienza operativa. Gli esperti ritengono che il prossimo anno sarà cruciale per la diffusione su larga scala di queste tecnologie, e OpenAI sembra essere in linea con queste previsioni.

Fonti: Yahoo! ed Euronews.

Questo contenuto è stato scritto da un utente della Community.  Il responsabile della pubblicazione è esclusivamente il suo autore.