Home Politica Nell’era dei big data, dare priorità alla significatività statistica nella progettazione dello...

Nell’era dei big data, dare priorità alla significatività statistica nella progettazione dello studio

4
0

Uno scienziato che indossa un camice da laboratorio guarda una scansione del cervello su un computer con una macchina per la risonanza magnetica sullo sfondo

Scansione di risonanza magnetica presso il Laboratorio del cervello e del comportamento dell’Università di Ginevra, Svizzera.Credito: Salvatore Di Nolfi/EPA/Shutterstock

“Progettazione sperimentale”: queste parole segnalano una sezione di un documento di ricerca che molti lettori potrebbero essere inclini a scorrere fugacemente, prima di passare ai risultati effettivi. Ma uno studio in Natura questa settimana dovrebbe indurre tutti i ricercatori – sia lettori che autori di articoli – a considerare di soffermarsi un po’ di più sui metodi che fanno parte del processo scientifico.

Lo studio, condotto da Simon Vandekar, biostatistico presso il Vanderbilt University Medical Center di Nashville, Tennessee, riguarda come rendere più robusti gli studi di associazione a livello cerebrale (BWAS) (K. Kang et al. Natura https://doi.org/10.1038/s41586-024-08260-9; 2024). L’idea centrale di BWAS è studiare raccolte di immagini cerebrali utilizzando strumenti statistici e algoritmi di apprendimento automatico. Questo serve a prevedere quali caratteristiche specifiche del cervello o modelli di attività sono associati a tratti o comportamenti, ad esempio la capacità di ragionare in modo astratto o la tendenza a provare particolari emozioni negative.

Ma i BWAS hanno un perenne, e ben noto, problema di bassa replicabilità: due studi sullo stesso argomento possono giungere a conclusioni diverse. Gran parte del problema è che alcuni studi BWAS necessitano di enormi numeri di campioni per riflettere accuratamente gli effetti. Campioni di piccole dimensioni possono esagerare la relazione tra una determinata caratteristica cerebrale e un comportamento o tratto. Nel campo simile degli studi di associazione sull’intero genoma – che cercano di mettere in relazione le differenze nel DNA con i tratti della salute o della malattia – il problema dell’inaffidabilità viene superato raccogliendo set di dati con decine di migliaia di campioni dei partecipanti. Tuttavia, nel caso del cervello, ciò è molto più difficile, soprattutto per i ricercatori al di fuori dell’Europa e degli Stati Uniti. Un’ora di scansione in una macchina per la risonanza molecolare (MRI) costa circa 1.000 dollari. Il National Institutes of Health degli Stati Uniti distribuisce ogni anno circa 2 miliardi di dollari per la ricerca sul neuroimaging, ma pochi altri paesi dispongono di questo livello di risorse.

Vandekar e i suoi colleghi suggeriscono che concentrarsi sulla qualità, piuttosto che sulla quantità, potrebbe essere una risposta. Hanno analizzato più di 100.000 scansioni MRI di adulti e bambini sani, nonché scansioni di bambini con problemi di salute mentale.

Il loro scopo era esplorare il modo in cui fattori quali età, sesso, funzione cognitiva e salute mentale sono associati alla struttura e alla funzione del cervello attraverso diversi progetti di studio. Ad esempio, uno studio ha esplorato come il volume del cervello cambia con l’età. Vandekar e i suoi coautori hanno scoperto che, rispetto alle scansioni una tantum di più persone – studi trasversali – le scansioni MRI ripetute delle stesse persone nel tempo hanno prodotto risultati più robusti (vedi RJ Chauvin e NUF Dosenbach Natura https://doi.org/10.1038/d41586-024-03650-5; 2024).

Tali studi longitudinali hanno da tempo dimostrato il loro valore in aree della scienza come l’identificazione di biomarcatori per malattie croniche o degenerative (Y. Guo et al. Invecchiamento naturale 4247–260; 2024). Sebbene non funzionino per alcuni tipi di domande per le quali sono necessari studi trasversali, gli studi longitudinali sono efficaci nell’escludere fattori irrilevanti che sembravano poter essere implicati durante piccoli studi trasversali.

Ci sono però delle avvertenze: i ricercatori che conducono studi longitudinali devono, ad esempio, fare attenzione a lasciare intervalli sufficientemente lunghi tra le misurazioni in ciascun individuo se vogliono catturare differenze significative e statisticamente significative nel tempo. Vandekar e i suoi colleghi sottolineano inoltre che i ricercatori devono tenere conto sia dei cambiamenti che avvengono negli individui nel corso del tempo, sia delle differenze tra gli individui.

Tutta la ricerca deve essere pianificata. Per BWAS, selezionare i partecipanti in modo tale da ottenere risultati solidi e utilizzare i giusti modelli statistici può migliorare l’affidabilità dei risultati senza la necessità automatica di campioni di dimensioni enormi. I vantaggi del rigore statistico, a loro volta, evidenziano la necessità di una maggiore collaborazione tra statistici e neuroscienziati, poiché utilizzano metodi di gestione dei dati più sofisticati nella loro ricerca. Questi risultati saranno preziosi per la comunità delle neuroscienze e meritano un’attenzione più ampia.

Molti campi della scienza si stanno immergendo nella scoperta guidata dai dati, sempre più assistiti dalle capacità di ricerca di modelli degli algoritmi di intelligenza artificiale. Così facendo, le questioni relative alla correlazione e alla causalità, nonché a garantire che i risultati siano statisticamente significativi e riproducibili, stanno diventando sempre più pertinenti. Ciò significa che i ricercatori non devono pattinare sulla progettazione sperimentale, sia che stiano leggendo un articolo o scrivendone uno.

Una maggiore attenzione ai metodi di ricerca e al modo in cui uno studio ottiene il segnale dei suoi effetti è il modo per garantire che i risultati resistano alla prova del tempo.

Fonte

LEAVE A REPLY

Please enter your comment!
Please enter your name here