DeepSeek, perché l’Intelligenza Artificiale cinese fa tremare i big del mondo tech
News - 28/01/2025
di Redazione Innovation Island
Il mercato dell’Intelligenza Artificiale corre veloce. Se, fino a oggi, a definire gli standard sono state aziende statunitensi come OpenAI e Google, adesso a dettare le regole del gioco è sempre più DeepSeek, una startup cinese fondata nel 2023 a Hangzhou da Liang Wenfeng. DeepSeek è l’app gratuita più scaricata negli Usa su iPhone: è un chatbot basato su un potente modello di IA generativa, che si è rapidamente imposto con modelli potenti, efficienti ed economici. Dopo aver annunciato di aver subito “cyber attacchi su larga scala“, nel mese di gennaio del 2025 l’app ha dichiarato che limiterà la registrazione di nuovi utenti ai suoi servizi.
Come funziona DeepSeek?
Nel novembre del 2023 DeepSeek ha lanciato DeepSeek Coder, un modello open source per attività di codifica, cui sono seguiti il modello linguistico DeepSeek LLM e, nel maggio 2024, il modello DeepSeek-V2, con prestazioni elevate e un costo molto inferiore, rispetto a quello dei concorrenti. I modelli si distinguono perché riescono a ridurre il consumo di risorse computazionali, ma anche per l’architettura MoE (Mixture of Experts), che attiva solo una parte dei parametri per ogni compito specifico.
Il modello DeepSeek-V3, inoltre, ha integrato l’attenzione latente multi-testa, riuscendo ad elaborare input complessi con più precisione. A gennaio del 2025 è stato lanciato il modello DeepSeek-R1, subito entrato in diretta competizione con le features più evolute di OpenAI. L’azienda ha anche sviluppato modelli distillati, come DeepSeek-R1-Distill.
Le sfide e lo spettro della censura
DeepSeek afferma di aver messo a punto un modello di linguaggio gratuito e open source che avrebbe richiesto solo due mesi e meno di 6 milioni di dollari per essere realizzato (con costi inferiori rispetto a quelli investiti negli Usa). In questo modo, non solo minaccia la leadership globale dei colossi a stelle e strisce, ma manda a tappeto i titoli tech in Borsa. L’azienda ha dimostrato che, pur avendo accesso a risorse più limitate, i risultati si possono raggiungere: non potendo utilizzare i processori di ultima generazione come gli H100, ha puntato sull’ottimizzazione, sviluppando modelli competitivi, grazie agli Nvidia H800.
La startup cinese ha reso disponibile parte del suo codice e del suo modello su piattaforme pubbliche, il che conferma un impegno verso l’open source e, almeno in teoria, garantisce un ecosistema di sviluppo più aperto e collaborativo, oltre che una maggiore trasparenza.
A fronte di tutto questo, va anche sottolineato che diversi test hanno dimostrato che, quando si interroga DeepSeek su argomenti politicamente sensibili per il governo cinese, spesso evita risposte dirette o propone versioni in linea con le narrazioni ufficiali. Non mancano, dunque, i dubbi su eventuali meccanismi di censura, che impedirebbero di porre specifiche domande in grado di imbarazzare il regime.
DeepSeek-V3
Come abbiamo anticipato, nel mese di gennaio del 2025 DeepSeek ha lanciato il suo modello V3 che, in poche settimane, ha superato ChatGPT come app gratuita più scaricata per iPhone negli Usa. L’impatto sui mercati finanziari è stato evidente, con un calo del 17% nel valore delle azioni Nvidia e un impatto negativo su Microsoft e Alphabet.
Tra luci e ombre, è certo che DeepSeek ha saputo conquistare spazio e notorietà. Se, da un lato, l’approccio open source è vantaggioso, non mancano i rischi legati a un uso improprio delle tecnologie IA. Ancora, i dubbi sulla censura sono da tenere in grande considerazione, poiché aprono la strada a domande sull’etica e sul controllo da parte dello stato cinese. La startup ha segnato un punto di svolta nel mercato dell’intelligenza artificiale ma, proprio per questo, le sue evoluzioni e le implementazioni della sua app vanno seguite con grande attenzione.