Gli scienziati si stanno affrettando a DeepSeek-R1, un modello di “ragionamento” di intelligenza artificiale economica e potente (AI) che ha inviato a spirale il mercato statunitense dopo che è stato rilasciato da una società cinese la scorsa settimana.
Test ripetuti suggeriscono che la capacità di DeepSeek-R1 di risolvere i problemi di matematica e scienze si abbina a Athose del modello O1, rilasciato a settembre da Openi a San Francisco, in California, i cui modelli di ragionamento sono considerati leader del settore.
Le allucinazioni AI non possono essere fermate, ma queste tecniche possono limitare il loro danno
Sebbene R1 fallisca ancora in molti compiti che i ricercatori potrebbero voler svolgere, sta offrendo agli scienziati in tutto il mondo l’opportunità di formare modelli di ragionamento personalizzati progettati per risolvere i problemi nelle loro discipline.
“Sulla base della sua grande performance e a basso costo, crediamo che DeepSeek-R1 incoraggerà più scienziati a provare LLM nella loro ricerca quotidiana, senza preoccuparsi del costo”, afferma Huan Sun, ricercatore di intelligenza artificiale presso la Ohio State University di Columbus. “Quasi tutti i collega e il collaboratore che lavorano in AI ne parlano.”
Stagione aperta
Per i ricercatori, la economia e l’apertura di R1 potrebbero essere i cambiamenti di gioco: possono interrogare il modello a una frazione del costo dei rivali proprietari utilizzando l’interfaccia di programmazione dell’applicazione del modello (API) o gratuitamente utilizzando il suo chatbot online, Deepthink. Possono anche scaricare il modello sui propri server e correre e costruirlo gratuitamente, il che non è possibile con modelli chiusi in competizione come O1.
Dal lancio di R1 il 20 gennaio “tonnellate di ricercatori” hanno studiato la formazione dei propri modelli di ragionamento, basati e ispirati da R1, afferma Cong Lu, un ricercatore di intelligenza artificiale presso l’Università della British Columbia di Vancouver. Ciò è supportato dai dati di Huging Face, un repository di scienze aperte per l’IA che ospita il codice DeepSeek-R1. Nella settimana dal suo lancio, il sito aveva registrato oltre 3 milioni di download di diverse versioni di R1, comprese quelle già costruite da utenti indipendenti.
In che modo Chatgpt “pensa”? Psicologia e neuroscienza Crack Open Ai Big Language Model
Compiti scientifici
Nei test preliminari delle capacità di R1 sulle attività scientifiche basate sui dati-prelevate da documenti reali in argomenti tra cui bioinformatica, chimica computazionale e neuroscienze cognitive-il modello corrispondeva alle prestazioni di O1, afferma Sun. Il suo team ha sfidato entrambi i modelli AI a completare 20 compiti da una suite di problemi che hanno creato chiamato scienceagengbench. Questi includono attività come l’analisi e la visualizzazione dei dati. Entrambi i modelli hanno risolto correttamente solo circa un terzo delle sfide. È costato 13 volte meno per eseguire R1 usando l’API, ma ha avuto un tempo “pensiero” più lento di O1, osserva Sun.
R1 mostra anche promesse in matematica. Frieder Simon, matematico e informatica dell’Università di Oxford, nel Regno Unito, ha sfidato entrambi i modelli a creare una prova nel campo astratto dell’analisi funzionale e ha trovato l’argomento di R1 più promettente di O1. Ma dato che tali modelli commettono errori, per beneficiare di loro i ricercatori devono essere già armati di abilità come raccontare una buona e cattiva prova a parte, dice.
Gran parte dell’eccitazione su R1 è perché è stata rilasciata come “Open-Weight”, il che significa che sono disponibili le connessioni apprese tra le diverse parti del suo algoritmo. Gli scienziati che scaricano R1, o una delle versioni “distillate” molto più piccole anche rilasciate da DeepSeek, possono migliorare le sue prestazioni nel loro campo attraverso una formazione aggiuntiva, nota come messa a punto. Dato un set di dati adeguato, i ricercatori potrebbero addestrare il modello a migliorare le attività di codifica specifiche del processo scientifico, afferma Sun.
Il modello di AI a buon mercato in Cina Brills Deep -Wills