ChatGPT vola con GPT-4o, il modello AI più veloce di OpenAI: come funziona

News - 14/05/2024

di Redazione

OpenAI ha alzato la posta nel competitivo mondo dell’intelligenza artificiale generativa introducendo un nuovo modello, GPT-4o, che si augura possa attrarre più utenti sulla sua piattaforma e respingere i tentativi della concorrenza.

Caratteristiche principali di GPT-4o

GPT-4o è una versione aggiornata della tecnologia di modelli linguistici di grandi dimensioni che alimenta ChatGPT. La scorsa settimana si vociferava che sarebbe stato lanciato un motore di ricerca per sfidare Google, ma Reuters ha riportato che OpenAI ha ritardato il lancio. Il CEO di OpenAI, Sam Altman, ha smentito la notizia per poi pubblicare su X che l’azienda ha “lavorato duramente su alcune novità che pensiamo piaceranno alle persone”.

La “o” nel nome sta per “omni”, indicando l’intenzione di creare un modello per tutti.

Un nuovo modello di punta

In breve: GPT-4o, secondo OpenAI, è il suo “nuovo modello di punta che può ragionare su audio, visione e testo in tempo reale”. È anche il modello di intelligenza artificiale più veloce di OpenAI. Il nome “omni” si riferisce a “un passo verso un’interazione uomo-computer molto più naturale”, ha detto OpenAI in un post sul proprio blog.

Velocità di GPT-4o

OpenAI afferma che GPT-4o può rispondere agli input audio in soli 232 millisecondi, con una media di 320 millisecondi, simile al tempo di risposta umano in una conversazione. Di conseguenza, GPT-4o richiede l’uso di meno token nei linguaggi, l’unità di base nell’IA che calcola la lunghezza del testo e può includere segni di punteggiatura e spazi. Tra le lingue evidenziate da OpenAI che utilizzano meno token con GPT-4o ci sono l’arabo, il gujarati, l’hindi, il coreano e il cinese.

Come Funziona GPT-4o

La risposta più semplice è che OpenAI ha semplificato il processo di conversione degli input in output. Nei modelli di IA precedenti di OpenAI, la Modalità Voce veniva utilizzata per parlare con ChatGPT a latenze di 2,8 secondi (GPT-3.5) e 5,4 secondi (GPT-4) in media. Questo processo significa che la principale fonte di intelligenza, GPT-4, perdeva molte informazioni, come il tono o rumori di fondo. Ma con GPT-4o, OpenAI è riuscita a unire tutte queste funzioni in un unico modello, riducendo significativamente il tempo consumato e le informazioni elaborate.

Limiti di GPT-4o

OpenAI ha riconosciuto diverse limiti nel modello GPT-4o, comprese incoerenze nelle risposte e difficoltà nel riconoscere il sarcasmo. OpenAI continua a perfezionare il comportamento del modello attraverso il post-addestramento per affrontare le preoccupazioni sulla sicurezza. L’azienda ha creato nuovi sistemi di sicurezza e testato il modello con più di 70 esperti nei campi della psicologia sociale, pregiudizi, equità e disinformazione per identificare eventuali rischi.

Costi e disponibilità di GPT-4o

Buone notizie: GPT-4o è gratuito per tutti gli utenti, con quelli paganti che godono di “fino a cinque volte i limiti di capacità” dei loro pari non paganti.

Competizione

La mossa di OpenAI di introdurre un nuovo modello di linguaggio di grandi dimensioni gratuito e più veloce è un’indicazione di quanto sia impegnata contro la concorrenza nell’IA generativa. Google, probabilmente il suo più grande rivale nello spazio, ha Gemini, il primo modello di IA a battere gli esperti umani sulla comprensione linguistica multitasking massiva. Fonte: The National News.