Sakana AI, una start-up giapponese specializzata in intelligenza artificiale, ha presentato il suo nuovo modello, “The AI Scientist“. Sviluppato in collaborazione con le università di Oxford e della British Columbia, questo modello è progettato per condurre ricerche scientifiche, e secondo Sakana AI, può automatizzare diverse fasi del processo di scoperta scientifica.
“The AI Scientist” si basa su grandi modelli di linguaggio (LLM) capaci di replicare il processo di scoperta scientifica. Il modello è in grado di generare idee e valutarne la novità e l’originalità. Successivamente, modifica una base di codice open source disponibile su GitHub utilizzando strumenti di generazione di codice. Segue la fase di sperimentazione, durante la quale raccoglie dati numerici e produce riassunti visivi.
Utilizzando questi elementi, il modello redige un rapporto in linguaggio LaTeX, ampiamente utilizzato dalla comunità scientifica, con risultati giustificati e contestualizzati. Sakana AI si avvale dello strumento Semantic Scholar, sviluppato dall’Allen Institute for AI, per trovare in modo autonomo articoli pertinenti e supportare il rapporto. Infine, la start-up ha implementato un generatore di revisione automatizzata per perfezionare il modello e creare un ciclo di feedback continuo.
Sakana AI sostiene che è possibile produrre un articolo scientifico per soli 15 dollari (13,73 euro), a seconda delle risorse di calcolo utilizzate. Durante la fase di test, l’IA ha proposto nuove tecniche per i modelli di linguaggio basati su un’architettura di transformers (modelli auto-attentivi) e per i modelli di diffusione.
“The AI Scientist” potrebbe accelerare la ricerca in molti campi, tra cui la scienza dei materiali, la scoperta di nuovi farmaci e le scienze ambientali. Tuttavia, ci sono ancora molte sfide da superare prima che il modello possa competere con le capacità umane.
Oltre a limitarsi allo sviluppo di software di IA, “The AI Scientist” richiede una base di codice per ogni esperimento, il che potrebbe sollevare dubbi sulla sua capacità di generare nuove idee. Sakana AI specifica inoltre che il modello non dispone di funzionalità di computer vision, il che potrebbe causare alcuni problemi nella generazione di contenuti visivi per gli articoli scientifici.
Fondata lo scorso anno da due ex ricercatori di Google, Sakana AI si concentra sullo sviluppo di modelli più piccoli e specializzati, piuttosto che su LLM che richiedono grandi capacità di elaborazione e sono più energivori.
La start-up ha già sviluppato un modello linguistico giapponese per il ragionamento matematico (EvoLLM-JP), un modello di visione-linguaggio che combina la comprensione visiva con le capacità linguistiche (EvoVLM-JP) e un modello di generazione di immagini ottimizzato per l’inferenza rapida (EvoSDXL-JP). Dopo un round di finanziamento seed di 30 milioni di dollari, la start-up ha avviato negoziati per raccogliere ulteriori 125 milioni di dollari, portando la sua valutazione a 1,1 miliardi di dollari (1,01 miliardi di euro). Fonte: L’Usine Digital.
Questo contenuto è stato scritto da un utente della Community. Il responsabile della pubblicazione è esclusivamente il suo autore.