La start-up della tecnologia cinese Deepseek ha preso d’assalto il mondo tecnologico con il rilascio di due grandi modelli di linguaggio (LLM) che competono con le prestazioni degli strumenti dominanti sviluppati dai giganti della tecnologia statunitense, ma costruiti con una frazione del costo e della potenza di calcolo.
Gli scienziati affollano DeepSeek: come stanno usando il modello di successo AI
Il 20 gennaio, la società con sede a Hangzhou ha rilasciato Deepseek-R1, un modello di “ragionamento” in parte open source in grado di risolvere alcuni problemi scientifici secondo uno standard simile a O1, LLM più avanzato di Openi, che la società con sede a San Francisco, in California , svelato alla fine dell’anno scorso. E all’inizio di questa settimana, DeepSeek ha lanciato un altro modello chiamato Janus-Pro-7b, che può generare immagini da istruzioni di testo molto come Dall-E 3 di Openi e diffusione stabile, realizzata da Stability Ai a Londra.
Se la performance di Deepseek-R1 ha sorpreso molte persone al di fuori della Cina, i ricercatori all’interno del paese affermano che il successo della start-up è prevedibile e si adatta all’ambizione del governo di essere un leader globale nell’intelligenza artificiale (AI).
Era inevitabile che un’azienda come DeepSeek emergesse in Cina, dato gli enormi investimenti del capitale di rischio nelle aziende che sviluppano LLM e le molte persone che detengono dottorati in settori scientifici, tecnologici, ingegneristici o matematici, tra cui l’IA, afferma Yunji Chen, A Scienziata informatica che lavora su chip AI presso l’Istituto di tecnologia informatica dell’Accademia cinese delle scienze di Pechino. “Se non ci fosse profondo, ci sarebbero altri LLM cinesi che potrebbero fare grandi cose.”
In effetti, ci sono. Il 29 gennaio, la tecnologia Behemoth Alibaba ha pubblicato finora il suo LLM più avanzato, Qwen2.5-Max, che la società afferma che supera la V3 di Deepseek, un altro LLM che l’azienda ha rilasciato a dicembre. E la scorsa settimana, Moonshot AI e Bytedance hanno rilasciato nuovi modelli di ragionamento, Kimi 1.5 e 1.5-Pro, che le società sostengono possono superare O1 su alcuni test di riferimento.
Priorità del governo
Nel 2017, il governo cinese ha annunciato la sua intenzione per il paese di diventare leader mondiale nell’IA entro il 2030. Ha incaricato l’industria di completare le principali scoperte di AI “in modo tale che le tecnologie e le applicazioni raggiungano un livello leader mondiale” entro il 2025.
Lo sviluppo di una pipeline di “talento AI” è diventato una priorità. Entro il 2022, il Ministero della Pubblica Istruzione cinese aveva approvato 440 università per offrire lauree specializzate in AI, secondo un rapporto del Center for Security and Emerging Technology (CSET) presso la Georgetown University di Washington DC. In quell’anno, la Cina ha fornito quasi la metà dei principali ricercatori di intelligenza artificiale al mondo, mentre gli Stati Uniti rappresentavano solo il 18%, secondo il think tank Macropolo a Chicago, nell’Illinois.
DeepSeek probabilmente ha beneficiato degli investimenti del governo nell’istruzione e nello sviluppo dei talenti dell’IA, che comprende numerose borse di studio, borse di ricerca e partenariati tra il mondo accademico e l’industria, afferma Marina Zhang, ricercatore di politiche scientifiche presso l’Università della tecnologia Sydney in Australia Cina. Ad esempio, aggiunge, iniziative sostenute dallo stato come il National Engineering Laboratory for Deep Learning Technology and Application, guidato dalla società tecnologica Baidu a Pechino, hanno formato migliaia di specialisti di intelligenza artificiale.
Le figure esatte sulla forza lavoro di Deepseek sono difficili da trovare, ma il fondatore dell’azienda Liang Wenfeng ha detto ai media cinesi che la società ha reclutato laureati e studenti di dottorato dalle università cinesi di alto livello. Alcuni membri del team di leadership dell’azienda hanno meno di 35 anni e sono cresciuti testimoniando l’ascesa della Cina come superpotenza tecnologica, afferma Zhang. “Sono profondamente motivati da una spinta per l’autosufficienza nell’innovazione”.
Wenfeng, a 39 anni, è lui stesso un giovane imprenditore e si è laureato in informatica presso la Zhejiang University, una delle migliori istituzioni di Hangzhou. Ha co-fondato l’hedge fund ad alto volo quasi un decennio fa e ha fondato Deepseek nel 2023.
Jacob Feldgoise, che studia talento di intelligenza artificiale in Cina al CSET, afferma che le politiche nazionali che promuovono un ecosistema di sviluppo del modello per l’IA avranno aiutato aziende come DeepSeek, in termini di attrazione sia finanziamenti che talenti.
Ma nonostante l’aumento dei corsi di intelligenza artificiale nelle università, Feldgoise afferma che non è chiaro quanti studenti si stanno laureando con lauree dedicate e se vengono insegnate le competenze di cui le aziende hanno bisogno. Le società di intelligenza artificiale cinesi si sono lamentate negli ultimi anni che “i laureati di questi programmi non sono stati all’altezza della qualità che speravano”, afferma, portando alcune aziende a collaborare con le università.