Tutti i Grafici essenziali che devi conoscere


Tutti i Grafici essenziali che devi conoscere

Grafici e dati vanno spesso insieme, poiché sono un modo per condensare grandi quantità di dati in un formato semplice da comprendere.

Le visualizzazioni dei dati possono far emergere approfondimenti e ragionamenti a chi guarda i dati per la prima volta, nonché trasmettere i risultati ad altri che non vedranno i dati grezzi.

Esistono innumerevoli tipi di grafici, ciascuno con diversi casi d'uso.

La scelta del tipo di grafico dipenderà da più fattori. Quali sono i tipi di metriche, caratteristiche o altre variabili che prevedi di tracciare? Quali sono i tipi di dati a disposizione? Chi è il pubblico a cui intendi presentare? Qual è il tipo di conclusione che vuoi che il lettore tragga?

In questo articolo, forniremo una panoramica dei tipi di grafici essenziali che vedrai più frequentemente nei giornali, siti, blog o su Excel. Con questi grafici, avrai a disposizione un ampio toolkit per capire a cosa ti stai trovando di fronte quando leggi dei dati e saprai che esistono tante rappresentazioni in base al messagio che vuoi trasmettere e ai dati di cui disponi.

I 4 GRAFICI FONDAMENTALI

Nel suo libro Show Me the Numbers, Stephen Few suggerisce quattro codifiche principali per i valori numerici: barre, linee, punti e riquadri. Quindi inizieremo con quattro tipi di grafici di base, uno per ciascuno di questi mezzi di codifica del valore.

Grafico a barre
In un grafico a barre, i valori sono indicati dalla lunghezza delle barre, ciascuna delle quali corrisponde a una specifica entità misurata. I grafici a barre possono essere orientati verticalmente o orizzontalmente; i grafici a barre verticali sono talvolta chiamati grafici a colonne. I grafici a barre orizzontali sono una buona opzione quando hai molte barre da tracciare o le etichette su di esse richiedono uno spazio aggiuntivo per essere leggibili.

Grafico a linee

I grafici a linee mostrano le variazioni di valore nelle misurazioni continue, come quelle effettuate nel tempo. Il movimento della linea verso l'alto o verso il basso aiuta a far emergere rispettivamente cambiamenti positivi e negativi. Può essere usato per evidenziare dei trend, per aiutare il lettore a fare previsioni o proiezioni circa i risultati futuri. I grafici a linee multiple possono anche dare origine ad altri grafici correlati come il grafico sparkline o il grafico ridgeline (li vedremo meglio in altri articoli 😉).

Scatter plot (Grafico a dispersione)

Un grafico a dispersione visualizza i valori su due variabili numeriche utilizzando punti posizionati su due assi: uno per ciascuna variabile. I grafici a dispersione sono una rappresentazione versatile della relazione tra le variabili tracciate, indipendentemente dal fatto che tale correlazione sia forte o debole, positiva o negativa, lineare o non lineare. I grafici a dispersione sono ottimi soprattutto per identificare i punti anomali e le possibili lacune nei dati.

Box plot

Un box plot utilizza riquadri e dei "baffi" per riepilogare la distribuzione dei valori all'interno dei gruppi misurati. Le posizioni della scatola e delle estremità dei baffi mostrano le regioni in cui si trova la maggior parte dei dati. Più comunemente vediamo box plot quando abbiamo più gruppi da confrontare tra loro; altri grafici con maggiori dettagli sono preferibili quando abbiamo un solo gruppo da tracciare.

Tabelle e valori singoli

Le singole statistiche possono essere riportate così come sono anziché come un grafico.

Prima di passare ad altri tipi di grafici, vale la pena dedicare un momento ad apprezzare l'opzione di mostrare solo i numeri grezzi. In particolare, quando si dispone di un solo numero da mostrare, la semplice visualizzazione del valore è un approccio sensato alla rappresentazione dei dati. Quando i valori esatti sono di interesse in un'analisi, è possibile includerli in una tabella di accompagnamento o tramite annotazioni su una visualizzazione grafica.

Variazioni comuni

Queste rappresentazione derivano da quelle di base considerando però ulteriori aspetti come l'area, la forma e il colore che possono essere utili per aggiungere ulteriori dettagli e informazioni sui nostri grafici.

Istogramma

Se i gruppi rappresentati in un grafico a barre sono effettivamente intervalli numerici continui, possiamo unire le barre per generare un istogramma. Le lunghezze delle barre negli istogrammi corrispondono ai conteggi dei valori misurati mentre guardando la forma si può ricavare un'idea della distribuzione dei valori nei dati. Un diverso tipo di grafico come il grafico a linee tende ad essere utilizzato quando il valore verticale non è un conteggio di frequenza.

Questo istogramma mostra la distribuzione dei tempi di risposta a un sistema di ticketing, raggruppati per ore:


Stacked bar chart (Grafico a barre in pila)

Una modifica del grafico a barre standard consiste nel dividere ciascuna barra in più barre più piccole in base ai valori di una seconda variabile di raggruppamento, chiamata grafico a barre in pila. Ciò consente non solo di confrontare i valori del gruppo primario come in un normale grafico a barre, ma anche di mostrare come le varie componenti del gruppo contribuiscono al valore complessivo.

Questo grafico a barre in pila mostra i ricavi per posizione del negozio, diviso per reparto uomo o donna:

Grouped bar chart (Grafico a barre raggruppato)

Se, d'altra parte, le barre secondarie venissero posizionate una accanto all'altra in gruppi anziché tenute nelle loro pile, otterremmo il grafico a barre raggruppato. Il grafico a barre raggruppato non consente il confronto dei totali del gruppo principale, ma fa un lavoro molto migliore nel consentire il confronto dei sottogruppi.

Questo grafico a barre raggruppato mostra le nuove entrate trimestrali divise per rappresentante:

Dot plot (Grafico a punti)

Un diagramma a punti è come un grafico a barre in quanto indica i valori per diversi raggruppamenti categoriali, ma codifica i valori in base alla posizione di un punto anziché alla lunghezza di una barra. I diagrammi a punti sono utili quando è necessario confrontare tra categorie, ma la linea di base a 0 zero non è informativa o utile. Puoi anche pensare a un diagramma a punti come a un grafico a linee con la linea rimossa, in modo che possa essere utilizzato con variabili con categorie non ordinate anziché solo con variabili continue o ordinate.

Questo diagramma a punti mostra le differenze nelle prestazioni per diverse condizioni sperimentali

Grafico ad area

Un grafico ad area è un passo in più rispetto al grafico a linea, punti di valore collegati da segmenti, ma aggiunge un concetto dal grafico a barre con ombreggiatura tra la linea e una linea di base. Questo grafico viene visualizzato spesso se combinato con il concetto di impilamento per mostrare come sia cambiato il totale nel tempo e allo stesso tempo far vedere come sono cambiati i contributi dei suoi componenti.

Grafico a due assi

I grafici a doppio asse si sovrappongono a due grafici diversi con un asse orizzontale condiviso, ma scale dell'asse verticale potenzialmente diverse (una per ogni grafico). Può essere utile per mostrare un confronto diretto tra due insiemi di valori verticali, includendo anche il contesto della variabile dell'asse orizzontale. È comune utilizzare diversi tipi di grafici di base, come la combinazione di barre e linee, per ridurre la confusione delle diverse scale degli assi per ogni grafico dei componenti.

Ad esempio, in questo caso il contesto comune ai due insiemi di valori è il tempo riportato in giorni. Il grafico a linee è stato utilizzato per rappresentare le persone controllate, il grafico a barre per rappresentare le persone sanzionate, ognuna con una scala di valori diversa.

Bubble chart (Grafico a bolle)

Un altro modo per mostrare la relazione tra tre variabili è attraverso la modifica di un grafico a dispersione. Quando una terza variabile è categorale, i punti possono utilizzare forme o colori diversi per indicare l'appartenenza al gruppo. Se i punti dati sono ordinati in qualche modo, i punti possono anche essere collegati con segmenti di linea per mostrare la sequenza dei valori. Quando la terza variabile è di natura numerica, è qui che entra in gioco il grafico a bolle. Un grafico a bolle si basa sul grafico a dispersione di base facendo in modo che il valore della terza variabile determini la dimensione di ciascun punto, più grande è la bolla maggiore è il valore.

Questo grafico a bolle mostra la relazione tra tre variabili numeriche per posizione x, posizione y e dimensione in punti:

Curva di densità (Kernel density estimate)

La curva di densità è un modo alternativo per mostrare la distribuzione dei dati in alternativa all'istogramma. Piuttosto che raccogliere punti dati in contenitori di frequenza, ogni punto dati fornisce un piccolo volume di dati il ​​cui insieme raccolto diventa la curva di densità. Sebbene le curve di densità possano rappresentare alcuni valori che non esistono nel dataset, possono essere un buon modo per appianare il rumore nei dati ed ottenere una comprensione della distribuzione dei valori.

Questa curva di densità mostra nei pressi dei segmenti neri (ogni segmento rappresenta un valore) sull'asse delle x la densità dei valori sull'asse delle y, più ci sono segmenti neri ravvicinati maggiore è la densità:

Violin plot (Grafico a violino)

Un'alternativa all'approccio del box plot per confrontare le distribuzioni di valore tra i gruppi è il grafico a violino. In questo tipo di rappresentazione, ogni scatola e baffi (boxblot) viene sostituito con una curva di densità costruita attorno a una linea di base centrale. Quest può fornire un migliore confronto delle forme dei dati tra i gruppi, anche se si perde il confronto di precisi valori statistici. Una variazione frequente per i grafici a violino consiste nell'includere dei boxplot sopra per ottenere il meglio da entrambi i mondi.

Questo grafico confronta la distribuzione di una variabile numerica per tre categorie A, B e C:

Heatmap (Mappa di calore)

La mappa termica presenta una griglia di valori basata su due variabili di interesse. Le variabili degli assi possono essere numeriche o categoriali; la griglia viene creata dividendo ogni variabile in intervalli o livelli come un istogramma o un grafico a barre. Le celle della griglia vengono colorate in base al valore, spesso con colori più scuri corrispondenti a valori più alti. Una mappa termica può essere un'alternativa interessante a un grafico a dispersione quando ci sono molti punti dati da tracciare, ma la densità dei punti rende difficile vedere la vera relazione tra le variabili.

Questa mappa termica mostra le nuove entrate per trimestre e rappresentante:

Grafici specialistici

Esistono molti grafici aggiuntivi che codificano i dati in altri modi per casi d'uso particolari. Tuttavia, alcuni di questi grafici hanno casi d'uso abbastanza comuni da poter essere considerati essenziali da conoscere.

Pie chart (Grafico a torta)
Potresti essere sorpreso di vedere i grafici a torta messi qui nella sezione "speciali", considerando la frequenza con cui vengono utilizzati. Tuttavia, i grafici a torta utilizzano una codifica insolita, che rappresenta i valori come aree sezionate da una forma circolare. Poiché un grafico a torta in genere manca di contrassegni di valore attorno al suo perimetro, di solito è difficile avere una buona idea delle dimensioni esatte delle sezioni. Tuttavia, il grafico a torta e il suo cugino, il grafico a ciambella (donut plot), eccellono nel mostrare che il confronto dopo tutto è il principale aspetto della visualizzazione.

Funnel chart (Grafico a imbuto)
Un grafico a imbuto viene spesso visualizzato in contesti aziendali in cui i visitatori o gli utenti devono essere tracciati in un flusso appunto ad imbuto. Il grafico mostra quanti utenti riescono a raggiungere ciascuna fase del processo monitorato. Questo tipo di grafico rende bene l'idea visivamente del percorso che seguono gli utenti, ma può confondere i veri tassi di conversione. Un grafico a barre può spesso soddisfare lo stesso scopo di un grafico a imbuto, ma con una rappresentazione più chiara dei dati.

Questo grafico a imbuto mostra i tassi di conversione dalle impressioni ad un annuncio passando per i click e poi alle conversioni:

Bullet chart
Il bullet chart migliora il grafico con una singola barra aggiungendo dei segni utili per contestualizzare il valore di quella barra. In genere, si utilizza una linea perpendicolare che delimita il valore target, ma anche un'ombreggiatura di sfondo per fornire ulteriori benchmark delle prestazioni. I bullet charti vengono solitamente utilizzati per rappresentare più metriche e sono più compatti e semplici da interpretare rispetto ad altri tipi di grafici più fantasiosi.

Questo bullet chart mostra le visualizzazioni di pagina e i download rispetto ai valori impostati come obiettivo (ombreggiatura più scura):

Grafici basati su mappe
Esistono diverse famiglie di grafici specializzati raggruppati in base all'utilizzo, ma chiuderemo questo articolo toccandone uno: grafici basati su mappe o geospaziali. Quando i valori in un set di dati corrispondono a posizioni geografiche effettive, può essere utile tracciarli effettivamente con un qualche tipo di mappa. Un esempio comune di questo tipo di mappa è la coropletica (choropleth map) come quella sotto.

Questa tipologia di mappa rappresenta il valore attraverso l'uso del colore, ma invece di tracciare i valori in una griglia, vengono inseriti in regioni su una mappa.

DA TENERE A MENTE!

Esistono tantissime tipologie di grafici di ogni forma e per ogni tipologia di dato o messaggio che vogliamo esprimere.

Serve conoscerli tutti?

Spesso no! Per la maggior parte dei casi sono 5 i tipi di grafici da conoscere assolutamente:

  1. grafico a linea
  2. a barre
  3. a dispersione (scatter plot)
  4. i boxplot
  5. le mappe.

Con queste 5 rappresentazioni grafiche puoi dire di conoscere quel 20/80 che fa la differenza.

Nelle prossime guide analizzeremo uno ad uno tutti questi grafici per aiutarti a capire come leggerli quando ti ci troverai di fronte e quando utilizzarli. Non perdertele!

👈 LEZIONE PRECEDENTE: Tipologie di rappresentazione dei dati

👉 LEZIONE SUCCESSIVA:

.