Deep-learning e biologia. Scavare tra i dati.

Il problema con i dati è che sono big, sono tanti, troppi. Scavare dentro l’immensa mole di informazioni di cui talvolta gli scienziati dispongono è un compito arduo che richiede una enorme quantità di tempo e lavoro. Un algoritmo di deep-learning spesso può aiutare a risolvere la situazione.

Per questo motivo è inevitabile che ogni tanto qualcosa venga tralasciato e qualcos’altro, invece, non si riesca a vederlo. Ma si tratta di un problema che nella ricerca scientifica non può essere ammesso, perché ogni complesso di dati potrebbe essere vitale per la ricerca stessa. Ci vorrebbe un meccanismo, una tecnologia insomma, capace di scavare profondamente nel complesso dei data e imparare ad estrapolare associazioni salienti. Un algoritmo che scavi e impari e che impari scavando. Esiste? Sì.

Il dottor Finkenberg e il suo team di ricerca al Gladstone Institute of Neurological Disease di San Francisco si trovavano alle prese con un problema del genere, quando Google decise di farsi avanti, portando in dono proprio un algoritmo di deep-learning. Cosa fa questo algoritmo?

Deep-learning algorithms take raw features from an extremely large, annotated data set, such as a collection of images or genomes, and use them to create a predictive tool based on patterns buried inside. Once trained, the algorithms can apply that training to analyse other data, sometimes from wildly different sources.

In sostanza, l’algoritmo prende in esame le caratteristiche chiave di un set di dati estremamente grande (può trattarsi di una collezione di immagini o di genomi) e le usa per creare uno strumento predittivo basato sulle strutture presenti all’interno di questi set. Questa è la parte deep. Il learning è il passo successivo, perché gli algoritmi, una volta addestrati, possono essere utilizzati per analizzare altri dati, anche diversissimi. In questo modo, si può rintracciare una struttura, una invariante, all’interno di un gran numero di dati e in un tempo relativamente brevissimo se paragonato a quello che sarebbe servito a un operatore umano per svolgere lo stesso compito.

Why-Deep-Learning-1024x742.png
Il miglioramento della curva d’apprendimento tramite deep learning. Da: https://machinelearningmastery.com/what-is-deep-learning/

È in corso la pubblicazione dei risultati della cooperazione tra Finkenberg e Google, e vi terremo aggiornati. A quanto pare, comunque, sembra trattarsi di un successo senza precedenti nell’ambito della ricerca neurologica. Il deep learning si rivela, dunque, uno strumento estremamente utile anche nel campo della ricerca biologica.

Per saperne di più: https://www.nature.com/articles/d41586-018-02174-z

What is deep learning?: https://machinelearningmastery.com/what-is-deep-learning/

Deep Learning Italia: http://www.deeplearningitalia.com

Per approfondire: Fundamentals of Deep Learning: Designing Next-Generation Artificial Intelligence Algorithms