La startup francese di intelligenza artificiale Mistral ha presentato il suo primo modello di IA multimodale, chiamato Pixtral 12GB, in grado di elaborare sia immagini che testo, proprio come i modelli ChatGPT di OpenAI.
Basato su uno dei modelli esistenti di Mistral, Nemo 12B, Pixtral può (oltre a generare risposte testuali ai prompt) didascalizzare immagini, identificare e contare gli oggetti al loro interno e rispondere a domande relative ad esse.
È scaricabile gratuitamente (con licenza Apache 2.0) ed è un modello open source (come molti dei modelli di IA di Mistral), il che significa che chiunque può scaricarlo da GitHub o Hugging Face, perfezionarlo e addestrarlo per le proprie esigenze personalizzate, senza alcuna restrizione.
Anche se non esiste ancora una demo funzionale, gli utenti potranno accedere a Pixtral tramite il chatbot di Mistral, Le Chat, o la loro piattaforma API, Le Platforme, nei prossimi giorni.
Il lancio di Pixtral arriva dopo che Mistral ha raccolto con successo 645 milioni di dollari a giugno, in un round guidato da General Catalyst, portando la sua valutazione a 6 miliardi di dollari in un solo anno, mettendola in competizione con OpenAI, che ha avuto una traiettoria simile, con persone che definiscono Pixtral la versione europea di ChatGPT.
Questo contenuto è stato scritto da un utente della Community. Il responsabile della pubblicazione è esclusivamente il suo autore.