Nell’ormai lontano 2016 Geoffrey Hinton, uno dei più noti scienziati dei nostri tempi in ambito di Deep Learning, fece una delle sue tanto famose quanto controverse dichiarazioni. Davanti alla platea di una importante conferenza di AI a Toronto annunciò la morte della professione del radiologo: “Se lavorate come radiologi oggi siete come il coyote che è già oltre il precipizio ma non ha ancora guardato in basso.”
Il Deep Learning era così abile a leggere e interpretare le immagini delle risonanze magnetiche o delle TAC che, secondo Hinton, nessuno avrebbe dovuto continuare la formazione come radiologo perché in cinque anni algoritmi accessibili a tutti avrebbero svolto quel lavoro meglio di qualsiasi persona.
Sette anni dopo quella potente dichiarazione continuiamo a vedere i corsi di radiologia pieni nelle università. Gli studi dimostrano infatti che persone e macchine sono complementari in ambito medico e insieme producono dei risultati migliori. Cosa abbiamo capito dopo tutti questi anni e dopo l’investimento di importanti risorse umane e finanziarie? Non solo che il Machine Learning in radiologia è più sfidante di quello che le aspettative iniziali indicavano, ma anche che le persone riescono a elaborare informazioni complesse di contesto spesso non codificate e normalizzate.
Il risultato è che oggi una azienda come IBM, per esempio, che ha investito decine di miliardi di dollari per sviluppare Watson Health, ha iniziato un processo di disinvestimento e svende (per “solo” un miliardo!) grossi database e algoritmi ad una Private Equity Firm (Francisco Partners). Watson Health era considerata la più promettente attività dove dimostrare l’utilità e il potere computazionale di Watson, esattamente come Google Flu Trends doveva dimostrare il potere informativo e l’utilità dei “big data” senza “big theory” e in questo caso i big data erano i dati immensi che produciamo noi ogni giorno con le ricerche che facciamo su Google. Il progetto fu chiuso qualche anno dopo perché il suo costo e i successivi bisogni di correzioni non giustificavano il beneficio che avremmo potuto trarre dal punto di vista delle politiche di salute.
Gli algoritmi da soli non bastano
Gli esempi di come il “fattore” umano sia fondamentale per il successo dei dati e degli algoritmi sono veramente tanti. Alcuni esempi includono la correzione e identificazione di bias, l’identificazione di fake news o classificazione di contenuti vari (incluso quelli non desiderati, attività fondamentale oggi per la moderazione delle reti social e per l’individuazione di contenuti critici), la creazione di algoritmi basati su teorie note e ben fondate e anche la creazione di database rilevanti su cui usare gli algoritmi.
Il caso di Amazon Alexa è emblematico. All’inizio non c’erano dati veri su cui lavorare. Amazon ha così creato ambienti finti, ma molto realistici, con attori che interagivano come normali famiglie o collaboratori per creare i database di voci, richieste e interazioni da usare per “insegnare” ad Alexa come capire una richiesta o rispondere ad una domanda. Ci sono altri esempi di app che anni fa raccontavano di avere algoritmi che identificavano gli oggetti presenti in una immagine. Anni dopo si scoprì che inizialmente c’era un vasto gruppo di lavoratori che classificavano le immagini real-time costruendo così un database molto diversificato di immagini che è stato usato per sviluppare i veri algoritmi che oggi sono veramente al centro di un servizio real time di classificazione di immagini molto preciso.
E quali lezioni stiamo traendo da questi e tanti altri esempi? Noi che lavoriamo e ricerchiamo in questi ambiti abbiamo innanzitutto capito che indubbiamente algoritmi e dati sono molto utili, ma che da soli non bastano. Ci sono contesti nei quali è difficile, se non impossibile, rinunciare all’intervento umano. Il campo medico è uno di questi, vista la sua complessità e anche perché è un settore ad alto rischio dove le decisioni hanno un impatto determinante sulle vite umane.
Ma anche nell’ambito del business, della comunicazione e del marketing, la complessità dei sistemi studiati e la variabilità umana richiede delle analisi e approfondimenti con un occhio – appunto – umano per leggere interpretare e mettere in prospettiva i risultati forniti dagli algoritmi. Ma anche per poter formulare le migliori strategie di analisi. I dati, siano essi in grandi volumi o no (big or small!), sono sempre molto importanti ma il ragionamento non deve mancare e neanche la conoscenza del contesto. L’input del data scientist o del data analyst, che va oltre l’applicare ciecamente gli algoritmi o accettare quello che ci forniscono, è diventato una delle skill più importanti oggi.
Questa è una ottima notizia per noi, vuol dire che avremo un ruolo fondamentale e che le macchine non andranno a sostituire noi umani in questi ambiti. Ma presenta anche una sfida importante. Da un lato dobbiamo formare le future generazioni per saper usare i dati e gli algoritmi e creare delle competenze tecniche molto forti. Allo stesso tempo dobbiamo formare queste stesse generazioni e insegnare loro a leggere fra le righe dei dati, a interpretare, applicare e usare i risultati nel contesto reale che è quello del mercato. Attività di pensiero critico e creativo non possono e non devono mancare.
Il Master Upa in Data Science per la Comunicazione digitale – Realtà potente di pensiero, dati e tecnologia
È per questo motivo che master come quello in “Data Science per la Comunicazione digitale” organizzato da UPA diventano fondamentali. L’obiettivo è quello di insegnare le basi dell’analisi dei dati, degli algoritmi, delle piattaforme ma allo stesso tempo stimolare il pensiero critico, provocare, e creare valore aggiunto.
E se qualcuno ribatte dicendo che già oggi dobbiamo capire le macchine e vendere alle macchine oltre che alle persone (un bell’esempio è il grande mercato intorno al Search Engine Optimization), possiamo sempre considerare che sicuramente anche quella task verrà eseguita meglio se dietro alla macchina, agli algoritmi e al potere computazionale ci sono persone come noi a dotare tutto di senso.