Home Politica Come stanno usando il modello Blockbuster AI

Come stanno usando il modello Blockbuster AI

9
0

Chiudi la vista dell'icona dell'app DeepSeek visualizzata su uno schermo per smartphone.

Il modello DeepSeek è accessibile tramite un’app Chatbot.Credito: Mladen Antonov/AFP tramite Getty

Gli scienziati si stanno affrettando a DeepSeek-R1, un modello di “ragionamento” di intelligenza artificiale economica e potente (AI) che ha inviato a spirale il mercato statunitense dopo che è stato rilasciato da una società cinese la scorsa settimana.

Test ripetuti suggeriscono che la capacità di DeepSeek-R1 di risolvere i problemi di matematica e scienze si abbina a Athose del modello O1, rilasciato a settembre da Openi a San Francisco, in California, i cui modelli di ragionamento sono considerati leader del settore.

Sebbene R1 fallisca ancora in molti compiti che i ricercatori potrebbero voler svolgere, sta offrendo agli scienziati in tutto il mondo l’opportunità di formare modelli di ragionamento personalizzati progettati per risolvere i problemi nelle loro discipline.

“Sulla base della sua grande performance e a basso costo, crediamo che DeepSeek-R1 incoraggerà più scienziati a provare LLM nella loro ricerca quotidiana, senza preoccuparsi del costo”, afferma Huan Sun, ricercatore di intelligenza artificiale presso la Ohio State University di Columbus. “Quasi tutti i collega e il collaboratore che lavorano in AI ne parlano.”

Stagione aperta

Per i ricercatori, la economia e l’apertura di R1 potrebbero essere i cambiamenti di gioco: possono interrogare il modello a una frazione del costo dei rivali proprietari utilizzando l’interfaccia di programmazione dell’applicazione del modello (API) o gratuitamente utilizzando il suo chatbot online, Deepthink. Possono anche scaricare il modello sui propri server e correre e costruirlo gratuitamente, il che non è possibile con modelli chiusi in competizione come O1.

Dal lancio di R1 il 20 gennaio “tonnellate di ricercatori” hanno studiato la formazione dei propri modelli di ragionamento, basati e ispirati da R1, afferma Cong Lu, un ricercatore di intelligenza artificiale presso l’Università della British Columbia di Vancouver. Ciò è supportato dai dati di Huging Face, un repository di scienze aperte per l’IA che ospita il codice DeepSeek-R1. Nella settimana dal suo lancio, il sito aveva registrato oltre 3 milioni di download di diverse versioni di R1, comprese quelle già costruite da utenti indipendenti.

Compiti scientifici

Nei test preliminari delle capacità di R1 sulle attività scientifiche basate sui dati-prelevate da documenti reali in argomenti tra cui bioinformatica, chimica computazionale e neuroscienze cognitive-il modello corrispondeva alle prestazioni di O1, afferma Sun. Il suo team ha sfidato entrambi i modelli AI a completare 20 compiti da una suite di problemi che hanno creato chiamato scienceagengbench. Questi includono attività come l’analisi e la visualizzazione dei dati. Entrambi i modelli hanno risolto correttamente solo circa un terzo delle sfide. È costato 13 volte meno per eseguire R1 usando l’API, ma ha avuto un tempo “pensiero” più lento di O1, osserva Sun.

R1 mostra anche promesse in matematica. Frieder Simon, matematico e informatica dell’Università di Oxford, nel Regno Unito, ha sfidato entrambi i modelli a creare una prova nel campo astratto dell’analisi funzionale e ha trovato l’argomento di R1 più promettente di O1. Ma dato che tali modelli commettono errori, per beneficiare di loro i ricercatori devono essere già armati di abilità come raccontare una buona e cattiva prova a parte, dice.

Gran parte dell’eccitazione su R1 è perché è stata rilasciata come “Open-Weight”, il che significa che sono disponibili le connessioni apprese tra le diverse parti del suo algoritmo. Gli scienziati che scaricano R1, o una delle versioni “distillate” molto più piccole anche rilasciate da DeepSeek, possono migliorare le sue prestazioni nel loro campo attraverso una formazione aggiuntiva, nota come messa a punto. Dato un set di dati adeguato, i ricercatori potrebbero addestrare il modello a migliorare le attività di codifica specifiche del processo scientifico, afferma Sun.

Fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here