Google Scholar, il motore di ricerca accademico più grande e completo, compie 20 anni questa settimana. Nel corso dei suoi due decenni, dicono alcuni ricercatori, lo strumento è diventato uno dei più importanti nel campo della scienza. Ma negli ultimi anni sono emersi concorrenti che utilizzano l’intelligenza artificiale (AI) per migliorare l’esperienza di ricerca, così come altri che consentono agli utenti di scaricare i propri dati.
L’impatto che Google Scholar – di proprietà del gigante del web Google con sede a Mountain View, California – ha avuto sulla scienza è notevole, afferma Jevin West, uno scienziato sociale computazionale dell’Università di Washington a Seattle che utilizza quotidianamente il database. Ma “se mai ci fosse un momento in cui Google Scholar potrebbe essere spodestato come principale motore di ricerca, potrebbe accadere adesso, a causa di alcuni di questi nuovi strumenti e di alcune delle innovazioni che si stanno verificando in altri luoghi”, afferma West.
Molti dei vantaggi di Google Scholar – accesso gratuito, ampiezza delle informazioni e opzioni di ricerca sofisticate – “sono ora condivisi da altre piattaforme”, afferma Alberto Martín Martín, ricercatore di bibliometria presso l’Università di Granada in Spagna.
I chatbot basati sull’intelligenza artificiale come ChatGPT e altri strumenti che utilizzano modelli linguistici di grandi dimensioni sono diventati applicazioni di riferimento per alcuni scienziati quando si tratta di cercare, rivedere e riassumere la letteratura. E alcuni ricercatori hanno scambiato Google Scholar con loro. “Fino a poco tempo fa, Google Scholar era la mia ricerca predefinita”, afferma Aaron Tay, bibliotecario accademico presso la Singapore Management University. È ancora in cima alla sua lista, ma “recentemente ho iniziato a utilizzare altri strumenti di intelligenza artificiale”.
Tuttavia, date le dimensioni di Google Scholar e il suo profondo radicamento nella comunità scientifica, “ci vorrebbe molto per detronizzarlo”, aggiunge West.
Anurag Acharya, co-fondatore di Google Scholar, presso Google, afferma di accogliere con favore tutti gli sforzi volti a rendere le informazioni accademiche più facili da trovare, comprendere e sviluppare. “Più possiamo fare tutti, meglio è per il progresso della scienza”.
Il più grande e il più ampio
Google Scholar è entrato sulla scena della ricerca bibliografica nel 2004 e ha cambiato tutto. All’epoca, i ricercatori utilizzavano le biblioteche per trovare informazioni o cercavano articoli accademici accedendo a servizi online a pagamento come il database di citazioni scientifiche Web of Science. Un altro servizio a pagamento è stato lanciato lo stesso mese di Google Scholar: Scopus di Elsevier, un ampio database di riferimenti scientifici e abstract.
Google Scholar ha scansionato il Web alla ricerca di lavori accademici di qualsiasi tipo, come capitoli di libri, rapporti, prestamp e documenti web, compresi quelli in lingue diverse dall’inglese. L’obiettivo era “rendere i ricercatori di tutto il mondo più efficaci, per contribuire a consentire a tutti di posizionarsi su una frontiera comune della scienza”, afferma Acharya.
Gli accordi di Google Scholar con gli editori gli danno un accesso senza rivali al testo completo degli articoli dietro pagamento, non solo ai titoli e agli abstract, che è ciò che offre la maggior parte dei motori di ricerca. Classifica gli articoli in base alla loro pertinenza rispetto a una query di ricerca, in genere portando in alto gli articoli più citati, e suggerisce ulteriori query. La sua profondità di copertura facilita ricerche altamente specifiche.
Google ha rifiutato di condividere i dati sull’utilizzo del servizio, ma secondo il misuratore di traffico web Similarweb, Google Scholar riceve più di 100 milioni di visite al mese.
Il database è anche molto efficace nel indirizzare le persone alle versioni gratuite di un articolo, afferma Martín Martín. Ciò promuove il movimento per l’accesso aperto, afferma José Luis Ortega, bibliometrico presso l’Istituto di Studi Sociali Avanzati del Consiglio Nazionale delle Ricerche spagnolo a Córdoba.
Ma per altri versi Google Scholar è opaco. Tra le principali preoccupazioni c’è la mancanza di informazioni su quali contenuti, comprese quali riviste, ricerca e sull’algoritmo che utilizza per consigliare articoli. Limita inoltre i download in blocco dei suoi risultati di ricerca, che potrebbero essere utilizzati, tra le altre cose, per analisi bibliometriche. “Non abbiamo molte conoscenze su uno degli strumenti più preziosi di cui disponiamo nel campo della scienza”, afferma West.
Acharya afferma che Google Scholar è principalmente uno strumento di ricerca e il suo obiettivo principale è aiutare gli studiosi a trovare le ricerche più utili.
Motori aggiornati
Negli ultimi anni sono emersi concorrenti che offrono questo tipo di dati bibliometrici, anche se nessuno può battere le dimensioni di Google Scholar e l’accesso agli articoli full-text dietro pagamento. Un esempio degno di nota è l’indice OpenAlex, lanciato nel 2022. L’anno precedente, Microsoft Academic Graph, che scansionava il web alla ricerca di informazioni accademiche, era stato interrotto e il suo intero set di dati rilasciato. OpenAlex si basa su questa e altre fonti aperte di dati accademici. Gli utenti possono ricercare i contenuti catalogati per autori, istituzioni e citazioni e anche scaricarne gratuitamente l’intero record. “Stanno facendo quello che volevamo facesse Google Scholar”, afferma Martín-Martín.
Un altro popolare strumento di ricerca, Semantic Scholar, lanciato nel 2015, utilizza l’intelligenza artificiale per creare riassunti leggibili degli articoli e identificarne le citazioni più rilevanti. Un altro strumento, Consensus, lanciato nel 2022, si basa sul database di Semantic Scholar per trovare risposte a domande basate sulla ricerca (West è un consulente di Consensus). Uno dei preferiti di Tay è Undermind, che utilizza una ricerca più sofisticata basata su agenti, in cui un’entità autonoma analizza la letteratura scientifica come farebbe un essere umano, adattando la ricerca in base al contenuto che trova. Ci vogliono alcuni minuti, a differenza dei secondi di Google Scholar, per ottenere i risultati, ma Tay dice che vale la pena aspettare. “Trovo che la qualità dei risultati restituiti sia migliore di quella di Google Scholar.”
Acharya afferma che Google Scholar utilizza anche l’intelligenza artificiale per classificare gli articoli, suggerire ulteriori query di ricerca e consigliare articoli correlati. E all’inizio di questo mese, la società ha introdotto i profili degli articoli generati dall’intelligenza artificiale nel suo lettore PDF. Acharya afferma inoltre che lo strumento di ricerca cerca di comprendere l’intento e il contesto dietro una query. Questo approccio di ricerca semantica si basa su modelli linguistici ed è in uso da circa due anni, spiega.
Una cosa che Google Scholar non fa ancora è includere panoramiche delle risposte generate dall’intelligenza artificiale a una query ricercata, simili a quelle che ora si trovano nella parte superiore di una tipica ricerca su Google. Acharya afferma che riassumere le conclusioni di più articoli in modo conciso e includere un contesto importante è impegnativo. “Non abbiamo ancora visto una soluzione efficace a questa sfida”, afferma.