Additionally, paste this code immediately after the opening tag: Skip to main content

La Data Science è uno degli emblemi della modernità: riesce ad armonizzare contributi provenienti da aree di studio spesso molto diverse. Essendo una disciplina complessa, è interessante rispondere a una domanda che può sorgere spontanea sulla Data Science: come si sviluppa e come si comunica?

Le parti di un processo di Data Science

La multidisciplinarità della Data Science non solo si riflette nell’enorme bagaglio di conoscenza che percorsi formativi differenti possono andare ad alimentare – il che sarebbe già un gran successo – ma soprattutto diviene distinguibile nelle varie parti che compongono un processo di Data Science, ciascuna più o meno inerente ad un determinato settore disciplinare. Se volessimo riassumere in modo semplice come si sviluppa un processo di Data Science in termini pratici, potremmo far riferimento ai seguenti passi:

  • Vi è inizialmente un’idea di possibile risoluzione di un problema o una domanda di ricerca che semplifichi/migliori un processo già esistente avvalendosi di dati
  • Vi è la ricerca/reperimento dei dati potenzialmente utili all’espletamento dell’analisi, contestualmente alla valutazione dei dati eventualmente non reperibili e della loro essenzialità ai fini dell’analisi
  • Qualora si possa procedere, bisogna raccogliere i nuovi dati e/o estrarre dati da processi già esistenti in modo che siano fruibili e validi per creare nuovi flussi informativi
  • I dati a disposizione vanno poi “rimaneggiati”, cioè modellati per essere più utili possibile al modello di analisi che vogliamo adottare. Questo processo di “modellamento” è spesso chiamato data wrangling o data munging
  • Svolgere l’analisi, che può essere descrittiva (quanto stiamo fatturando mediamente ogni giorno?), predittiva (quanto fattureremo tra un anno?) o, come più spesso accade, sia descrittiva sia predittiva, al fine di farsi un’idea di quale sia la situazione corrente e dei risvolti futuri più probabili
  • Comunicare i risultati dell’analisi in un modo che li renda chiari, privi di bias e immediatamente utilizzabili per le decisioni del management

Vi sono ulteriori step altrettanto essenziali per un buon processo di Data Science, per esempio il feedback in corso d’opera del management: questa è una buona pratica che non va vista assolutamente come un controllo negativo sull’operato del Data Scientist, bensì come un occhio pratico e critico su come l’analisi possa essere via via migliorata e arricchita. Questo è importantissimo alla luce dei rapidi cambiamenti della società di oggi, in cui nessun processo può considerarsi ottimamente stabile e duraturo nel tempo.

data science come si sviluppa e come si comunica 1

Comunicazione e visualizzazione delle informazioni nella Data Science

Comunicare significa condividere informazioni tra interlocutori che spesso non hanno lo stesso livello di conoscenza circa un determinato argomento oppure conoscono l’argomento da angolazioni diverse. Si pensi per esempio ai manager: non molti di loro hanno conoscenze tecniche adeguate ad una comprensione profonda dei processi di analisi, ma tutti cercano comunque di avere risposte a problemi che conoscono benissimo in ottica pratica e di business.

La comunicazione, soprattutto in un’azienda molto grande e quindi piena di figure con ruoli e attitudini diverse, deve per prima cosa superare le barriere di un linguaggio troppo tecnico per pervenire a un compromesso che renda l’informazione facilmente trasferibile e comprensibile senza rinunciare alla correttezza e veridicità di ciò che si comunica. La comunicazione deve essere intuitiva e non suscettibile di interpretazioni diverse a seconda della persona che recepisce l’informazione. Può invece essere fornita a livelli di dettaglio differenti, in modo da andare incontro ad esigenze altrettanto differenti di comprensione del dato.

La comunicazione dei risultati avviene spesso tramite dei grafici che catturino delle tendenze e degli aspetti di un fenomeno ad un dettaglio giusto per prendere decisioni. La comunicazione è spesso concepita come visualizzazione, ossia quella che viene comunemente chiamata Data Visualization o, in modo abbrevato, dataviz.

data science come si sviluppa e come si comunica

Secondo Inkwood Research, il mercato globale della visualizzazione dei dati avrà una crescita media di quasi il 9% annuo nei prossimi 8 anni, periodo in cui verranno sempre più potenziate le decisioni di business prese analiticamente grazie a forme di rappresentazione grafica. Ciò sarà dovuto soprattutto alla crescita insistente dei Big Data e dell’accesso alle informazioni da più dispositivi (smartphone, tablet, computer, ecc.). Inoltre, saranno privilegiati sempre più i report personalizzati, che andranno così a potenziare aspetti importanti per l’utente e depotenziare aspetti di cui l’utente si occupa meno. Prendiamo ad esempio una manager del settore vendite: sarà interessata magari al volume di ricavi, alle aree geografiche da lei controllate, ai prodotti più venduti.

Creare per lei una dashboard, cioè un insieme di grafici interattivi associati tra loro, può permetterle di andare ad esplorare il dato a dettagli differenti con dei semplici click che vadano magari ad ingrandire delle aree geografiche con meno vendite e/o ad evidenziare i prodotti meno venduti in ciascuna area. Uno strumento utilissimo per attuare correzioni in breve tempo sugli aspetti più critici. Ciò che per troppo tempo si è deciso in base ad informazioni lente e parziali avrà sempre meno ragione di esistere: più il mondo diverrà complesso, più la comunicazione sarà a portata di click per semplificarlo.

data science come si sviluppa e come si comunica