Avete mai provato a dare una definizione alla parola "dato"?
Se ci pensate un attimo scoprirete che forse non avete proprio chiaro in mente cosa si intende per dato e probabilmente non tutti le daremmo la stessa definizione. Questo perché tutti usiamo la parola "dato" dando per scontato il suo significato.
Per dato si intende una descrizione elementare, un pezzo, un elemento di un informazione riguardo un'entità, un fenomeno, un avvenimento o altro.
La Treccani lo definisce addirittura un "elemento certo" sui quali ci si basa per affacciare ipotesi e formulare giudizi.
Sulla parola "certo" presterei molta attenzione perché ci sono diverse variabili che possono influire sulla certezza del dato, ma ne parleremo in un altro articolo.
Quello che abbiamo imparato però è che il dato costituisce un pezzo di un'informazione che deriva da una descrizione della realtà, sia essa un soggetto, un'entità, un avvenimento o un fenomeno.
Tale descrizione può essere ottenuta attraverso misurazioni, osservazioni, risposte ad un sondaggio e così via.
È fondamentale avere almeno una conoscenza di base sui diversi tipi di dati che puoi incontrare e sui tipi di domande che puoi farti in base al dato che hai di fronte.
Al livello più alto, esistono due tipi di dati:
In generale, quando misuri qualcosa e gli dai un valore numerico, crei dati quantitativi. Quando classifichi o giudichi qualcosa, crei dati qualitativi. Fin qui tutto bene. Ma questo è solo il livello più alto di dati: esistono anche diversi tipi di dati quantitativi e qualitativi.
Esistono due tipi di dati quantitativi, denominati anche dati numerici: continui e discreti. Come regola generale, i conteggi sono discreti e le misurazioni sono continue.
Quando hai a che fare con dati quantitativi, puoi utilizzare la maggior parte dei metodi per descrivere i tuoi dati. È possibile riepilogare i dati utilizzando percentili, media, moda, mediana, deviazione standard e range.
Questi tipi di dati generalmente si possono rappresentare mediante istogrammi e boxplot:
Dati nominali
I dati nominali vengono utilizzati per etichettare le variabili senza alcun valore quantitativo. Esempi comuni includono maschi / femmine, colore dei capelli, nazionalità, nomi di persone e così via.
In parole povere: sono etichette (e il nome deriva da "nome" per aiutarti a ricordare).
Esempi:
Di che colore hai i capelli?
Notare che queste variabili non si sovrappongono. Ai fini delle statistiche, comunque, non puoi avere capelli color castano o biondo. Sono correlati solo dalla categoria principale di cui fanno parte.
Dati ordinali
La chiave con i dati ordinali è ricordare che ordinale suona come ordine - ed è l'ordine delle variabili che conta. Non tanto le differenze tra quei valori.
Le scale ordinali vengono spesso utilizzate per misurare la soddisfazione, la felicità e così via. Hai mai fatto uno di quei sondaggi, come questo?
"Con quale probabilità consiglieresti i nostri servizi ai tuoi amici?"
Non sappiamo davvero quale sia la differenza tra molto improbabile e improbabile o se è la stessa quantità di probabilità (o improbabilità) tra probabile e molto probabile. Sappiamo però dare un ordine di intensità e importanza circa il giudizio espresso.
Quando hai a che fare con dati qualitativi, raccogli informazioni attraverso:
Generalmente si possono rappresentare questo genere di dati mediante diagrammi a torta o a barre:
Una volta che si hanno i dati vanno analizzati per poter estrarre delle informazioni utili. In questi casi, si parla di Data analysis e data analytics, spesso trattate come termini intercambiabili, ma hanno significati leggermente diversi.
Detto questo esistono quattro tipi generali di analisi che possono essere svolte in generale a tutti i dati con cui stai lavorando. Queste analisi possono essere descrittive, diagnostiche, predittive e prescrittive. Ciascuna si basa sulla precedente.
Analisi descrittive
L'analisi descrittiva, come suggerisce il nome, descrive ciò che è accaduto in passato, ovvero i "dati storici". L'analisi descrittiva risponde alla domanda "Che cosa è successo?"
Esempi di analisi descrittive
Un vasto numero di analisi rientra in questa categoria. Esempi: il numero di vendite dell'anno scorso, la varianza del tasso di abbandono mese su mese, i ricavi medi per cliente, ecc. Fondamentalmente, qualsiasi istanza in cui vengono riepilogati i dati grezzi del passato può essere classificata come analisi descrittiva.
Analisi diagnostica
L'analisi diagnostica si concentra sulla causa sottostante ed è meno comune rispetto agli altri tre tipi di analisi. L'analisi diagnostica risponde alla domanda "Perché sta accadendo?"
Esempi di analisi diagnostica
Alcuni esempi di analisi diagnostica includono un responsabile marketing che esamina le prestazioni di una campagna in diverse aree geografiche e il perché in una certa zona si performa meno e in altre di più, un direttore vendite che analizza il numero di vendite per ogni prodotto e il perché alcuni prodotti vendono di più oppure un team di customer service che esamina il tempo di utilizzo di una piattaforma dei clienti che disdicono un abbonamento.
Analisi predittive
L'analisi predittiva è un'ipotesi calcolata di ciò che potrebbe accadere in futuro in base alle prestazioni passate. Sebbene non possa effettivamente prevedere il futuro, crea una previsione utilizzando algoritmi (solitamente di machine learning) che tengono conto delle prestazioni passate (analisi descrittive) e di altre possibili variabili. I modelli predittivi creano un'immagine del futuro che può quindi essere utilizzata per prendere decisioni più informate e basate sui dati. L'analisi predittiva risponde alla domanda "Cosa è probabile che accada?"
Esempi di analisi predittive
Alcuni esempi comuni di analisi predittiva sono i budget manager che prevedono le spese per l'anno successivo oppure previsioni sui ricavi che aiutano i dirigenti a capire quanto profitto potrebbe essere possibile per l'azienda gli anni successivi.
Analisi prescrittive
L'analisi prescrittiva prende ciò che è probabile che accada (analisi predittiva) e suggerisce strategie o azioni per il futuro. È un consiglio per ottenere un possibile risultato. L'analisi prescrittiva risponde alla domanda "Cosa dovremmo fare?"
Esempi di analisi prescrittive
L'ottimizzazione della gestione della catena di approvvigionamento in base alle tendenze della domanda, il suggerimento del percorso più veloce per tornare a casa in base alle condizioni di guida o la pianificazione dei turni di lavoro dei dipendenti in base agli orari di punta per un ristorante. Queste sono tutte analisi prescrittive che ti aiutano a prendere una decisione e a capire cosa dovresti fare.
Grazie a queste informazioni adesso hai un'ottima consapevolezza dei tipi di dato che puoi trovarti di fronte, di quale operazioni puoi svolgere su di essi e quali analisi effettuare in base al risultato che stai cercando.
Come hai visto dagli esempi, l'utilità dei dati si esplicita in moltissimi modi, ambiti e contesti diversi.
Nel prossimo articolo vedremo l'origine dei dati, come trovarli, come vengono prodotti, chi li produce e quale fonte selezionare per l'informazione che si sta cercando.
👈 LEZIONE PRECEDENTE: Cosa devi sapere sui Dati per definirti "Data Literate"
👉 LEZIONE SUCCESSIVA:
NON PERDERTI LE PROSSIME GUIDE!
Iscriviti per ricevere approfondimenti settimanali e le ultime novità da DataSnack
Thank you for subscribing!
Have a great day!