Secondo David Kelley, Lauren Takahashi e Aditya Nandy, l’intelligenza artificiale (AI) non è qui per sostituire gli scienziati: è semplicemente un potente strumento che può essere utilizzato per migliorare il loro lavoro.
Queste stelle nascenti sono tra i ricercatori più prolifici all’inizio della carriera nel Nature Index in termini di risultati legati all’intelligenza artificiale. Qui discutono di come stanno sfruttando nuovi algoritmi e modelli per far avanzare la ricerca nella regolazione genetica, nello sviluppo dei materiali e nella dinamica delle proteine.
David Kelley: decodificatore della regolazione genetica
Quando lo scienziato bioinformatico David Kelley è passato dal mondo accademico a un ruolo nell’industria nel 2016, si è sentito come se stesse entrando in una cultura meno competitiva e più collaborativa. “Qui fanno tutti davvero parte della stessa squadra”, dice del suo attuale posto di lavoro, Calico Life Sciences, un’azienda di biotecnologia a San Francisco, California. Apprezza anche l’attenzione che il suo ruolo nel settore fornisce: la missione dell’azienda è comprendere la biologia che controlla l’invecchiamento umano e utilizzare tale conoscenza per orientare lo sviluppo di trattamenti per le malattie legate all’età. Questo, dice Kelley, funge da “luce guida” per lui e i suoi colleghi, aiutandoli a dare la priorità a quello che pensano sarà il lavoro di maggior impatto.
“Se fossi all’università, penso che… mi farei distrarre da questa o quella domanda”, dice Kelley. “Considerando che operando nell’industria, hai questa forte spinta verso: è davvero importante? È davvero questa la cosa più significativa su cui potrei lavorare in questo momento?
Kelley sta studiando la regolazione genetica come meccanismo alla base delle malattie legate all’età. La regolazione genetica è il processo attraverso il quale le cellule controllano l’espressione dei loro geni, determinando quando, dove e quanto determinati componenti, come proteine o RNA, vengono prodotti. Una delle grandi sfide nel comprendere come vengono controllati i geni è capire come determinate sequenze di DNA, chiamate regioni potenziatrici, interagiscono con i geni. Le regioni potenziatrici sono come interruttori che possono accendere un gene, rendendolo attivo. Tuttavia, questi interruttori possono essere posizionati lontano dai geni che controllano – fino a un milione di paia di basi del DNA – rendendo difficile trovare e studiare molte di queste connessioni.
In un articolo pubblicato in Metodi naturali1Kelley e i suoi coautori hanno riferito dello sviluppo di un modello di apprendimento profondo, chiamato Enformer, che potrebbe prevedere l’espressione di varianti genetiche, comprese quelle che hanno interazioni a lunga distanza con potenziatori. Il modello consiste “in realtà di poche righe di codice”, ma è diventato uno strumento potente, afferma Kelley. “È davvero sorprendente e profondo il livello di intelligenza artificiale che si può ottenere semplicemente ripetendo dopo ripetizione questo singolo tipo di operazione matematica che consente un apprendimento molto generale.”
Leader della ricerca 2024
Una grande preoccupazione di Kelley riguardo al suo campo è la mancanza di diversità etnica nei set di dati genomici. Molti studi sulla regolazione genetica dipendono dai dati di sequenziamento dell’intero genoma provenienti da risorse come la Biobanca del Regno Unito, che conta 500.000 partecipanti, circa il 95% dei quali sono bianchi2. Utilizzando set di dati così limitati, i ricercatori perdono indizi importanti sulla regolazione genetica, afferma. “Vuoi davvero profilare tutte le variazioni del mondo e vedere tutti i modi in cui queste varianti genetiche possono influenzare i fenotipi.”
Un’altra sfida è il fatto che il set principale di addestramento dell’IA di Kelley è l’intera sequenza del genoma umano, che è una risorsa finita di circa tre miliardi di paia di basi. “Se vogliamo grandi quantità di dati aggiuntivi sull’addestramento, non è del tutto ovvio dove trovarli”, afferma. Il suo team sta diventando creativo lavorando con dati provenienti da topi e umani e addestrando modelli su entrambe le specie contemporaneamente. “Funziona perché i fattori regolatori dei nostri tipi di cellule condivise sono altamente conservati”, afferma Kelley. “Profilare più primati o altri mammiferi potrebbe essere fruttuoso”.
Lauren Takahashi: ingegnere catalizzatore
Lauren Takahashi, ingegnere chimico e scienziato dell’informazione presso l’Università di Hokkaido a Sapporo, in Giappone, ha intrapreso un percorso tortuoso nei primi anni della sua carriera. Come studentessa universitaria presso l’Università dell’Arizona a Tucson, ha studiato linguistica; si è poi trasferita all’Università di Göteborg in Svezia per completare un master in scienze che prevedeva la costruzione di un prototipo di motore di ricerca. Il programma è stato progettato per rispondere a domande come “Dov’è questo?” o “Dove posso andare a cercarlo?” utilizzando mappe e posizioni, invece di affidarsi solo ai migliori risultati delle ricerche, afferma.
Durante la sua permanenza in Svezia, Takahashi ha assistito a una conferenza del fisico Andre Geim, che ha vinto una parte del Nobel per la fisica nel 2010 per gli esperimenti con il grafene, un materiale costituito da un singolo strato di atomi di carbonio disposti in un reticolo esagonale. Il discorso ha ispirato Takahashi ad applicare la sua conoscenza dei motori di ricerca per costruire un modello che i ricercatori potrebbero utilizzare per cercare nella letteratura scientifica informazioni dettagliate durante la creazione di grafene e altri materiali 2D.
All’inizio il progetto era un hobby, ma “è cresciuto a dismisura”, dice. Sulla base di questo lavoro, un amico ha invitato Takahashi a partecipare a un progetto di ricerca presso l’Istituto nazionale giapponese per la scienza dei materiali (NIMS) a Tsukuba, una delle più grandi istituzioni mondiali nel settore. Mentre era al NIMS, ha intrapreso un dottorato di ricerca in ingegneria chimica presso l’Università di Tokyo.
A Hokkaido, Takahashi studia l’uso di robot e intelligenza artificiale per produrre catalizzatori ad alte prestazioni, sostanze che accelerano le reazioni chimiche. Un modo in cui lei e i suoi colleghi stanno facendo questo è frugando la letteratura scientifica alla ricerca di condizioni sperimentali che aumentino le prestazioni dei catalizzatori. Inseriscono queste informazioni nel loro sistema di intelligenza artificiale in modo che possa progettare esperimenti per produrre composti come l’etilene – un elemento costitutivo della plastica e altri materiali – a temperature più basse e con rese più elevate rispetto ai metodi attuali.3.
“Attualmente stiamo lavorando allo sviluppo di un robot che faccia tutto da solo”, afferma Takahashi. In futuro, i robot potrebbero lavorare di concerto con l’intelligenza artificiale per eseguire esperimenti; raccogliere e analizzare i dati; prevedere nuove condizioni, impostazioni e combinazioni di catalizzatori; e poi eseguire l’esperimento successivo, hanno scritto Takahashi e un collega in un articolo del 20234.
Accogliere gli “scienziati robot” autodiretti rappresenterebbe un cambiamento importante per i laboratori, afferma Takahashi. “È più difficile per il robot funzionare in un ambiente sviluppato dalle persone. Se vogliamo utilizzare l’intelligenza artificiale con successo, dobbiamo considerare le esigenze dell’intelligenza artificiale e incorporarle ogni volta che sviluppiamo gli ambienti in cui lavoriamo”.