ChatGPT Plus si fa più ‘umano’: arriva la modalità voce per le conversazioni naturali
News - 05/08/2024
di Redazione Innovation Island
Un gruppo privilegiato di utenti di ChatGPT Plus ha già accesso alla versione alfa della nuova modalità voce dell’intelligenza artificiale generativa di OpenAI. Come rivelato su X e LinkedIn, la società di Sam Altman faciliterà la comunicazione con un linguaggio naturale e in tempo reale, con la possibilità di interrompere la conversazione in qualsiasi momento, mentre il sistema rileva e risponde alle emozioni degli interlocutori.
Obiettivi Futuri
La società prevede di estendere gradualmente l’accesso nelle prossime settimane, “con l’obiettivo che tutti gli utenti di ChatGPT Plus possano godere di questa funzione in autunno. Gli utenti che partecipano alla fase alfa riceveranno una notifica nell’applicazione ChatGPT e un’e-mail con le istruzioni per utilizzarla”, spiegano fonti dell’azienda. Tuttavia, la condivisione di video e schermo dovrà attendere una versione successiva.
Priorità alla qualità e alla sicurezza delle conversazioni
In linea con le priorità strategiche di OpenAI, la qualità e la sicurezza nelle conversazioni saranno due linee guida fondamentali per l’azienda. Per quanto riguarda la qualità, l’obiettivo è “fornire la migliore esperienza possibile, rafforzando la capacità del modello di supportare milioni di conversazioni vocali simultanee in tempo reale, mantenendo bassa latenza e alta qualità”. Per quanto riguarda la sicurezza, lo scorso giugno è stato riferito che “si stavano apportando miglioramenti alla capacità del modello di rilevare e rifiutare contenuti inappropriati”. In particolare, negli ultimi due mesi, l’azienda “ha testato le capacità vocali del modello con oltre 100 membri esterni, che parlano 45 lingue diverse e rappresentano 29 aree geografiche”.
Tutela della privacy e dei diritti
Al fine di garantire il rispetto della privacy delle persone, “la modalità vocale avanzata utilizza quattro voci preimpostate sviluppate in collaborazione con attori di doppiaggio”. In questo modo, ChatGPT è stato progettato “in modo che non possa imitare le voci di altre persone, siano esse individui o personaggi pubblici, e bloccherà gli output che non corrispondono a una di queste voci proposte”.
Per proteggere i diritti, sono stati implementati nuovi filtri che rileveranno e bloccheranno le richieste di generazione di musica o altri audio protetti da copyright. Per garantire che ChatGPT sia utile e vantaggioso, “le stesse misure di sicurezza sono state applicate a tutte le modalità, sia di testo che di voce, assicurando che GPT-4o rispetti la legislazione vigente e non generi alcun tipo di contenuto dannoso”. Nel corso del mese di agosto, l’azienda prevede di pubblicare un rapporto dettagliato sugli sforzi compiuti per ottimizzare la sicurezza e migliorare l’esperienza di questa nuova modalità vocale avanzata.
Fase Alfa
Fonti dell’azienda ricordano che la fase alfa “ha lo scopo di testare, imparare e perfezionare il sistema, garantendo così la migliore esperienza possibile”. Inoltre, effettuando un lancio graduale, si consente un attento monitoraggio dell’uso dello strumento, facilitando le regolazioni e i miglioramenti delle capacità e della sicurezza in base al feedback del pubblico reale. Fonte: El Economista.
Questo contenuto è stato scritto da un utente della Community. Il responsabile della pubblicazione è esclusivamente il suo autore.