5 Fonti Essenziali per Trovare i Dati che Ti Servono | DataSnack


5 Fonti Essenziali per Trovare i Dati che Ti Servono | DataSnack

Dove trovo i dati che mi servono per realizzare la mia tesi, ricerca, presentazione, articolo, infografica o qualsiasi progetto data driven abbia in mente?

Si sa, ormai i dati sono obbligatori in qualsiasi contenuto produciamo per arricchire di bei grafici la nostra presentazione si, ma anche e soprattutto per dare maggior valore e risalto alle nostre idee.

In questo articolo ti presenterò 5 fonti da cui puoi partire per nuotare nell'immenso mare di internet e trovare il tesoro che cerchi.

INDICE

1. Portali istituzionali

2. Aggregatori di dati

3. Motori di ricerca per dataset

4. Testate e blog data driven

5. Report annuali

PORTALI ISTITUZIONALI

I portali open data istituzionali sono generalmente le fonti più affidabili, questo perché dietro ci sono spesso decine se non centinaia di data scientist, statisti e analisti, che si occupano di raccogliere ed elaborare i dati.

Inoltre, i portali istituzionali hanno accesso a fonti di qualità che spesso sono le dirette produttrici del dato, basti pensare agli enti pubblici come comuni, uffici catastali, scuole ecc.

Altro fattore interessante è la presenza spesso, di una nota metodologica che accompagna il dataset, in cui è presente un glossario dei termini utilizzati e la spiegazione del processo con il quale sono stati raccolti ed elaborati i dati.

Infine, ultimo ma non meno importante vantaggio dei portali open data istituzionali è la possibilità di scaricare i vari dataset nel formato che più si desidera. Ad esempio, potremo aver bisogno dei dati in formato PDF oppure in .xlsx ovvero Excel o in .csv di cui parleremo in un altro articolo.

Facciamo adesso qualche esempio di portale utile che potresti consultare per trovare i dati di cui hai bisogno:

Queste sono le 2 fonti più classiche in cui puoi trovare dati italiani ed europei su vari temi: società, demografia, economia, lavoro e anche le basi territoriali per realizzare le mappe.

Altri esempi meno conosciuti sono invece:

  • Archivio Elezioni: Contenente i risultati di tutte le elezioni avvenute in Italia dal 1948
  • Portale MIUR: Qui puoi trovare dataset interessanti riguardanti il mondo dell’università, per una semplice occhiata puoi anche navigare la sezione “Esplora dati” che ti permette di visualizzare e filtrare i dati direttamente dal sito.


AGGREGATORI DI DATI

In questa categoria rientrano tutte quelle fonti che non mettono a disposizione dati propri, né necessariamente mettono a disposizione dei dati ma che fungono da raccoglitori di dataset, metadati e link altrui.

Il bello dei siti che fungono da data hub è che puoi trovare i dati suddivisi in categorie o argomento, con la possibilità di aggiungere filtri di vario tipo e citano la fonte da cui hanno preso il dato.

Ad esempio DataHub raccogli migliaia di dataset riguardo ai mercati finanziari, indicatori economici, demografici e molto altro.

Esistono anche degli aggregatori più informali, curati da una comunità di utenti che si evolve continuamente e in cui ognuno apporta il proprio valore.

Esempi in tal senso sono la subreddit r/datasets in cui partecipano oltre 122 mila utenti per condividere, trovare e discutere di dati, altro esempio è Kaggle dove puoi trovare oltre 51.000 dataset condivisi e votati dagli utenti.

In questo caso, è necessario però prestare attenzione a chi propone il dato, infatti il dataset potrebbe essere stato costruito mediante tecniche di scraping (ne parleremo!) o grazie a un lavoro manuale da più fonti.

È quindi necessario verificare che venga sempre citata la fonte da cui sono stati presi i dati e che la persona che ha condiviso il dataset abbia un profilo verificato e sia un esperto autorevole in quell’ambito.

Il lato positivo degli aggregatori è che si possono trovare dati in qualsiasi ambito, basta armarsi di un po’ di pazienza e avere un metodo di ricerca (segui l’articolo fino alla fine) e si può trovare di tutto.


MOTORI DI RICERCA PER DATASET

Sapevi che esistono dei motori di ricerca creati apposta per classificare e restituire all’utente dei dataset?

Nel 2018 Google ha lanciato Google Dataset Search, un servizio che va a completare Google Scholar, fatto apposta per studenti, ricercatori, scienziati e data journalist.

Google ha indicizzato oltre 25 milioni di dataset, che puoi cercare come faresti normalmente sul motore di ricerca e filtrarli in base alla data, al formato, all’argomento, ai diritti di utilizzo e in base al fatto che siano open e gratuiti oppure no.

Si lo so… ti ho svoltato la vita… non ringraziarmi però aspetta di vedere le altre due fonti! 😉


TESTATE E BLOG DATA DRIVEN

Con la crescita dei dati a disposizione e di organizzazioni che li rendono disponibili sono nate anche numerose testate giornalistiche e blog che fanno informazione attraverso i dati (esattamente come noi qua: DataSnack)

Alcune di esse rendono persino disponibili i dataset utilizzati sul loro sito mentre altre hanno un profilo su GitHub dove pubblicano i dati citati nel loro articolo ai fini di migliorare la trasparenza.

Insomma, anche qui puoi trovare una miniera d’oro di dati pronti da scoprire e utilizzare. Ti faccio qualche esempio:


REPORT ANNUALI

Ultima, ma di certo non per importanza fonte di dati, riguarda i report che organizzazioni pubbliche o private redigono periodicamente.

Questi report includono ricerche, sondaggi, dati raccolti da varie fonti, analisi e studi approfonditi su temi specifici. Alcuni creano persino una piattaforma di data vizualization mirata ad esplorare i dati comodamente osservando grafici dinamici e interattivi.

Siete curiosi di saperne di più vero?

Date un’occhiata allora a questi due report: Democracy Index e World Press Freedom Index.


IMPORTANTE!

Avrei potuto citare moltissime altre fonti, basta pensare alle ONG, ai centri di ricerca, ai portali delle aziende e molti molti altri ma si finirebbe per scrivere un libro infatti… lo abbiamo fatto o meglio ci stiamo lavorando e tu potrai darci qualche feedback e averlo in anteprima!

Ti basta lasciare la tua email qua sotto così che possiamo contattarti e avvisarti quando sarà pronto.

Sarà una vera e propria guida che ti accompagnerà nel mondo dei dati.

Una vera bomba insomma! Lascia la tua email e ti avviseremo quando sarà pronto!

.