AlphaFold3 è finalmente aperto. Sei mesi dopo che Google DeepMind ha nascosto in modo controverso il codice di un articolo che descrive il modello di previsione della struttura proteica, gli scienziati possono ora scaricare il codice del software e utilizzare lo strumento di intelligenza artificiale (AI) per applicazioni non commerciali, ha annunciato l’11 novembre la società con sede a Londra .
“Siamo molto entusiasti di vedere cosa ne faranno le persone”, afferma John Jumper, che guida il team AlphaFold presso DeepMind e il mese scorso, insieme al CEO Demis Hassabis, ha vinto una parte del Premio Nobel per la chimica 2024 per il loro lavoro sul Strumento di intelligenza artificiale.
Il principale aggiornamento di AlphaFold offre un impulso alla scoperta di farmaci
AlphaFold3, a differenza dei suoi predecessori, è in grado di modellare le proteine insieme ad altre molecole. Ma invece di rilasciare il codice sottostante – come è stato fatto con AlphaFold2 – DeepMind ha fornito l’accesso tramite un server web che limitava il numero e i tipi di previsioni che gli scienziati potevano fare.
Fondamentalmente, il server AlphaFold3 ha impedito agli scienziati di prevedere come si comportano le proteine in presenza di potenziali farmaci. Ma ora, la decisione di DeepMind di rilasciare il codice significa che gli scienziati accademici possono prevedere tali interazioni eseguendo da soli il modello.
Inizialmente la società aveva affermato che rendere AlphaFold3 disponibile solo tramite un server web rappresentava il giusto equilibrio tra consentire l’accesso per la ricerca e proteggere le ambizioni commerciali. Isomorphic Labs, una società spin-off di DeepMind a Londra, sta applicando AlphaFold3 alla scoperta di farmaci.
Ma la pubblicazione di AlphaFold3 senza il codice o i pesi del modello – parametri ottenuti addestrando il software sulle strutture proteiche e altri dati – ha attirato critiche da parte degli scienziati, che hanno affermato che la mossa ha minato la riproducibilità. DeepMind ha rapidamente invertito la rotta e ha affermato che avrebbe reso disponibile una versione open source dello strumento entro sei mesi.
Chiunque può ora scaricare il codice del software AlphaFold3 e utilizzarlo a scopo non commerciale. Ma per ora, solo gli scienziati con un’affiliazione accademica possono accedere ai pesi di formazione su richiesta.
Versioni accessibili
DeepMind ha avuto concorrenza: negli ultimi mesi diverse aziende hanno presentato strumenti open source di previsione della struttura delle proteine basati su AlphaFold3, basandosi sulle specifiche descritte nel documento originale noto come pseudocodice.
Due aziende cinesi – il colosso tecnologico Baidu e lo sviluppatore TikTok ByteDance – hanno lanciato i propri modelli ispirati ad AlphaFold3, così come una start-up a San Francisco, in California, chiamata Chai Discovery.
AlphaFold3: perché Nature lo ha pubblicato senza il suo codice?
Un limite fondamentale di questi modelli è che, come AlphaFold3, nessuno è concesso in licenza per applicazioni commerciali come la scoperta di farmaci, afferma Mohammed AlQuraishi, biologo computazionale della Columbia University di New York City. Tuttavia, il modello di Chai Discovery, Chai-1, può essere utilizzato tramite un server web per questo tipo di lavoro, afferma Jack Dent, cofondatore dell’azienda.
Un’altra azienda, Ligo Biosciences con sede a San Francisco, ha rilasciato una versione senza restrizioni di AlphaFold3. Ma non dispone ancora di tutte le funzionalità, inclusa la capacità di modellare farmaci e molecole diverse dalle proteine.
Altri team stanno lavorando su versioni di AlphaFold3 che non presentano tali limiti: AlQuraishi spera di avere un modello completamente open source chiamato OpenFold3 disponibile entro la fine dell’anno. Ciò consentirebbe alle aziende farmaceutiche di riqualificare le proprie versioni del modello utilizzando dati proprietari, come le strutture delle proteine legate a diversi farmaci, migliorando potenzialmente le prestazioni.
L’apertura è importante
L’ultimo anno ha visto un’ondata di nuovi modelli di intelligenza artificiale biologica rilasciati da aziende con diversi approcci all’apertura. Anthony Gitter, biologo computazionale presso l’Università del Wisconsin-Madison, non ha problemi con l’ingresso di aziende a scopo di lucro nel suo campo, a patto che rispettino le stesse regole degli altri scienziati quando condividono il loro lavoro su riviste e server di prestampa.
Se DeepMind fa affermazioni su AlphaFold3 in una pubblicazione scientifica, “Io e altri ci aspettiamo che condividano anche informazioni su come sono state fatte le previsioni e inseriscano i modelli e il codice di intelligenza artificiale in modo da poterli ispezionare”, aggiunge Gitter. “Il mio gruppo non si baserà e non utilizzerà gli strumenti che non possiamo ispezionare.”
Non tutti i modelli di IA ‘open source’ sono effettivamente aperti: ecco una classifica
Il fatto che siano già emerse diverse repliche di AlphaFold3 dimostra che il modello era riproducibile, anche senza codice open source, afferma Pushmeet Kohli, responsabile dell’intelligenza artificiale per la scienza di DeepMind. Aggiunge che in futuro gli piacerebbe vedere più discussioni sulle norme editoriali in un campo sempre più popolato da ricercatori sia accademici che aziendali.
La natura open source di AlphaFold2 ha portato a un’ondata di innovazione da parte di altri scienziati. Ad esempio, i vincitori di un recente concorso di progettazione di proteine hanno utilizzato lo strumento di intelligenza artificiale per progettare nuove proteine in grado di legarsi a un bersaglio tumorale. Il recente hack AlphaFold2 preferito di Jumper proveniva da un team che ha utilizzato lo strumento per identificare una proteina chiave che aiuta lo sperma ad attaccarsi agli ovuli.
Jumper non vede l’ora che queste sorprese emergano dopo aver condiviso AlphaFold3, anche se non sempre danno frutti. “Le persone lo useranno in modi strani”, prevede. “A volte fallirà e a volte avrà successo.”