Michele di Nuzzo

Data Science and Machine Learning

Che cos’è l’Augmented Analytics

Nel luglio 2017 in una ricerca pubblicata per Gartner veniva introdotto per la prima volta il concetto di Augmented Analytics. L’argomento suscitò subito interesse e diventò immediatamente un trend di impatto nel campo della Business Intelligence, tanto che un solo anno dopo Gartner pubblicò il report “Hype Cycle for Analytics and Business Intelligence”.

Nella sua prima definizione il concetto di Augmented Analytics viene descritto come un nuovo approccio di analisi dei dati che sfrutta le tecnologie di Machine Learning e di linguaggio naturale (NLG), in modo da individuare automaticamente i risultati più rilevanti suggerire autonomamente le azioni concrete da intraprendere. Niente male come obiettivo…

Un nuovo approccio

In effetti, uno dei principali problemi attuali è dato dal fatto che i dati tendono a diventare sempre più numerosi e sempre più complessi. Spesso non si riesce ad integrarli velocemente anche a causa della loro estrema complessità. Il rischio di perdere informazioni diventa quindi molto alto, e proprio questa complessità non ci permette di esplorare tutte le possibili opportunità offerte dalle informazioni a nostra disposizione. Aumenta anche la probabilità di avere come risultati proprio quello che “cercavamo” e non quello che “potremmo trovare”.

Aggiungiamo il fatto che, ad oggi, tutte le attività di estrazione e trasformazione dei dati resta ancora completamente manuale (area “Artisanal” della figura più avanti riportata) aumentando notevolmente le possibilità di errore. Inoltre reperire ad oggi un data scientist, una professione relativamente recente che richiede competenze in campo informatico, statistico ed economico, e per quale esistono ancora pochi studi, è davvero molto difficile.

Pare naturale quindi che l’introduzione di strumenti di analisi in grado di interagire con l’essere umano nel suo linguaggio naturale e di individuare autonomamente i dati più significativi senza la mediazione degli analisti e senza l’intervento umano in generale, diventa una chiave fondamentale per il futuro della Business Intelligence.

L’approccio Tradizionale

Attualmente si approccia ai progetti tradizionali coinvolgendo diverse figure quali analisti, informatici, data scientist e manager, coinvolti nelle solite attività decisionali che porteranno poi alla richiesta finale. Seguono diverse attività di estrazione e pulizia dei dati effettuati da informatici o tecnici con specifiche competenze. Si cercherà di mettere insieme questi dati collegandoli tra loro e solo infine trasformandoli in informazioni quanto più sintetiche e “decisive”.

Come possiamo facilmente immaginare i costi ed i tempi di un’attività del genere sono assolutamente notevoli.

L’approccio Augmented Analytics

Con questo nuovo approccio si tenta di accentrare tutte le procedure in un’unica soluzione, dalla raccolta dati all’elaborazione delle analisi, al monitoraggio dei risultati. Si utilizzano algoritmi di Machine Learning e Intelligenza Artificiale che automatizzano le procedure rendendo agevole l’analisi dei dati. Si analizzano automaticamente miliardi di combinazioni di dati trovandone automaticamente le correlazioni e individuando eventuali scenari predittivi.

Il futuro dell’Augmented Analytics

Secondo la slide (fonte Oracle Corporation), ci sono diversi livelli:

Livello 0 – Artigiano: tutto è realizzato a mano, come nell’approccio classico. Il modello dati e la reportistica sono responsabilità dell’IT.

Livello 1 – Self Service: la gestione dei dati è ancora in gran parte manuale, ma l’interazione umana con i dati sarà fatta col linguaggio naturale (Natural Language Query). Le visualizzazioni e i grafici ci saranno suggeriti in base ai dati che stiamo interrogando.

Livello 2 – Deeper Insights: vengono visualizzate le prime fasi della gestione avanzata dei dati (fonti consigliate, join, suggerimenti di crowdsourcing, catalogazione intelligente) e la navigazione aumentata aiuta a scoprire le informazioni che altrimenti richiederebbero un forte sforzo umano.

Livello 3 – Data Foundation: la gestione dei dati diventa aumentata, vengono individuate automaticamente correzioni e arricchimenti. Nuove viste e nuovi set di dati vengono aggiunti.

Livello 4 – Collective Intelligence: il sistema apprende metriche e KPI che avvisano quando questi richiedono l’attenzione dell’utente. Si hanno sia KPI aziendali che KPI di sistema. Le intuizioni diventano pervasive, l’intento commerciale passa da un’idea a una realtà, si prevedono risultati, si raccomandano azioni, ma gli umani continuano ad agire.

Livello 5 – Autonomous: tutto diventa realmente guidato dai dati, con le migliori azioni successive eseguite sulla base di previsioni, approfondimenti e intenti. Il sistema è il motore del cambiamento.

A che punto siamo?

Credo che per il momento ci siamo stabilizzati tra il terzo ed il quarto stadio, la gestione dei dati inizia ad essere realmente “augmented”, sta diventando sempre più semplice integrare e gestire una grossa mole di informazioni e si muovono i primi passi verso l’individuazione automatica dei KPI.

Completare il quarto stadio e raggiungere definitivamente il quinto, “l’autonomous” totale, sarà la sfida dei prossimi anni. Il modo di concepire la Business Intelligence cambierà in maniera drastica, ma le sfide da affrontare sono sempre più belle. Siamo pronti?

Leave a Reply