Modi per Rappresentare i dati e come scegliere quello giusto


Modi per Rappresentare i dati e come scegliere quello giusto

Lavorando con i dati o leggendo informazioni che contengono dei dati ti sarà capitato di trovarti di fronte a diversi metodi di rappresentazione dei dati.

Conoscere le varie tecniche usate per rappresentare i dati ti aiuterà non solo a leggerli e comprenderli meglio quando ti ci troverai di fronte ma anche a sapere quale metodo scegliere quando dovrai dargli una forma per trasmetterli in modo efficace.

Non perdiamo tempo quindi e iniziamo!

TIPI DI DATI

Essenzialmente esistono 2 tipi di dati:

  • Quantitativi: Una quantità è una misura numerica, come ad esempio: "20" per rappresentare gli anni di una persona, i cui valori possono sempre essere espressi come numeri. I valori numerici possono avere varie unità di misura come gradi per la temperatura, metri per la lunghezza e così via oppure possono essere espressi come un valore percentuale,  un valore di un indice caratterizzato da alcuni parametri.
  • Categorali: Una categoria è una descrizione non numerica oppure una variabile numerica usata con funzione di classificazione e non di misura,  ad esempio il colore, il nome, il tipo, la fascia d'età (valore potenzialmente numerico usato come categoria), o forme più complesse quali la relazione con un altro elemento es. padre, figlio ecc.. 

Se vuoi saperne di più sulle tipologie di dati e sulle varie analisi che puoi effettuare ti invito a leggere la 3° parte della guida: 

👉  Tipi di dato e analisi che puoi effettuare in base allo scopo.


METODI PER RAPPRESENTARE I DATI

Combinando tipologie di dati e scopi rappresentativi, Stephen Few ha individuato 8 tipologie di rappresentazione:

  1. Sequenza temporale o Tendenza: Se si vuole illustrare l'evoluzione dei valori di variabili quantitative (numeriche) nel tempo.
  2. Classifica: Quando si vogliono ordinare dei dati quantitativi o categoriali, in ordine crescente o decrescente.
  3. Confronto tra le parti e il totale: Quando si vuole rapportare una variabile quantitativa o un conteggio di un dato categoriale al totale dei valori (il 100%). Esempio: Si vuole vedere la percentuale di persone in Italia che sono uomini o donne rispetto al totale della popolazione italiana (il sesso è un altro esempio di variabile categorale).
  4. Deviazione: Quando si vuole confrontare la deviazione o scostamento di alcuni valori rispetto ad un valore di riferimento.
  5. Distribuzioni di Frequenza: Per mostrare il numero di volte in cui una particolare variabile si ripete in un determinato intervallo e la distribuzione con cui tale valore viene osservato. Possono essere usate varie tecniche statistiche complementari per comprendere meglio la distribuzioni  come mediana, quartili, valori anomali, ecc.
  6. Correlazione: Se si vuole confrontare la relazione tra due o più variabili quantitative per evidenziare se hanno correlazioni, ad esempio se esiste proporzionalità diretta o inversa, causa-effetto, ecc.
  7. Confronto nominale: Se si vogliono visualizzare dati categoriali che non hanno un ordine particolare
  8. Posizionamento geografico o geospaziale: Se si vuole confrontare o proiettare una variabile rispetto a coordinate spaziali.

RAPPRESENTAZIONI GRAFICHE

Classificando in base alla metodologia grafica possiamo dividere le rappresentazioni dei dati in due tipi principali ovvero le tabelle e le rappresentazioni visive:

  • Una tabella elenca i dati in righe classificandoli per colonne ed è idonea a contenere sia dati quantitativi che categoriali. Viene utilizzata principalmente per consentire di trovare valori specifici o per raggruppare vari dati relative ad un'entità. Per esempio, in una tabella ogni riga può contenere i dati di una diversa persona con intestazioni che rappresentano il nome (variabile qualitativa di classificazione), il figlio (variabile qualitativa di relazione) e l'età (variabile quantitativa).
  • Una rappresentazione visiva ritrae i valori codificati come oggetti visivi ad esempio Linee, barre, punti o forme con colori e dimensioni diverse e mette in evidenza le relazioni tra una o più variabili. I valori vengono rappresentati all'interno di un'area, che può essere proiettata in uno o più assi. Gli eventuali assi forniscono "scale" (quantitative e/o categoriche) utilizzate per etichettare e assegnare valori agli oggetti visivi. I principali tipi di rappresentazioni visive sono:
    • grafi
    • mappe
    • grafici


CONCLUSIONE

In questo articolo abbiamo visto che ci sono vari modi per rappresentare i dati e quando usare un metodo rispetto che un altro.

Nella prossima lezione analizzeremo una ad una le varie tipologie di rappresentazioni visive e andremo a capire quando utilizzare un particolare tipo di grafico (barre, torta, scatter plot, box plot a linee ecc.), grafo o mappa.

👈 LEZIONE PRECEDENTE: Fonti di dati e metodi per valutare la loro affidabilità

👉 LEZIONE SUCCESSIVA: Tutti i grafici essenziali che devi conoscere


.