INDICE |
---|
1. Portali istituzionali |
2. Aggregatori di dati |
3. Motori di ricerca per dataset |
4. Testate e blog data driven |
5. Report annuali |
Dove trovo i dati che mi servono per realizzare la mia tesi, ricerca, presentazione, articolo, infografica o qualsiasi progetto data driven abbia in mente?
Si sa, ormai i dati sono obbligatori in qualsiasi contenuto produciamo per arricchire di bei grafici la nostra presentazione si, ma anche e soprattutto per dare maggior valore e risalto alle nostre idee.
In questo articolo ti presenterò 5 fonti da cui puoi partire per nuotare nell'immenso mare di internet e trovare il tesoro che cerchi.
INDICE |
---|
1. Portali istituzionali |
2. Aggregatori di dati |
3. Motori di ricerca per dataset |
4. Testate e blog data driven |
5. Report annuali |
PORTALI ISTITUZIONALI
I portali open data istituzionali sono generalmente le fonti più affidabili, questo perché dietro ci sono spesso decine se non centinaia di data scientist, statisti e analisti, che si occupano di raccogliere ed elaborare i dati.
Inoltre, i portali istituzionali hanno accesso a fonti di qualità che spesso sono le dirette produttrici del dato, basti pensare agli enti pubblici come comuni, uffici catastali, scuole ecc.
Altro fattore interessante è la presenza spesso, di una nota metodologica che accompagna il dataset, in cui è presente un glossario dei termini utilizzati e la spiegazione del processo con il quale sono stati raccolti ed elaborati i dati.
Infine, ultimo ma non meno importante vantaggio dei portali open data istituzionali è la possibilità di scaricare i vari dataset nel formato che più si desidera. Ad esempio, potremo aver bisogno dei dati in formato PDF oppure in .xlsx ovvero Excel o in .csv di cui parleremo in un altro articolo.
Facciamo adesso qualche esempio di portale utile che potresti consultare per trovare i dati di cui hai bisogno:
Queste sono le 2 fonti più classiche in cui puoi trovare dati italiani ed europei su vari temi: società, demografia, economia, lavoro e anche le basi territoriali per realizzare le mappe.
Altri esempi meno conosciuti sono invece:
AGGREGATORI DI DATI
In questa categoria rientrano tutte quelle fonti che non mettono a disposizione dati propri, né necessariamente mettono a disposizione dei dati ma che fungono da raccoglitori di dataset, metadati e link altrui.
Il bello dei siti che fungono da data hub è che puoi trovare i dati suddivisi in categorie o argomento, con la possibilità di aggiungere filtri di vario tipo e citano la fonte da cui hanno preso il dato.
Ad esempio DataHub raccogli migliaia di dataset riguardo ai mercati finanziari, indicatori economici, demografici e molto altro.
Esistono anche degli aggregatori più informali, curati da una comunità di utenti che si evolve continuamente e in cui ognuno apporta il proprio valore.
Esempi in tal senso sono la subreddit r/datasets in cui partecipano oltre 122 mila utenti per condividere, trovare e discutere di dati, altro esempio è Kaggle dove puoi trovare oltre 51.000 dataset condivisi e votati dagli utenti.
In questo caso, è necessario però prestare attenzione a chi propone il dato, infatti il dataset potrebbe essere stato costruito mediante tecniche di scraping (ne parleremo!) o grazie a un lavoro manuale da più fonti.
È quindi necessario verificare che venga sempre citata la fonte da cui sono stati presi i dati e che la persona che ha condiviso il dataset abbia un profilo verificato e sia un esperto autorevole in quell’ambito.
Il lato positivo degli aggregatori è che si possono trovare dati in qualsiasi ambito, basta armarsi di un po’ di pazienza e avere un metodo di ricerca (segui l’articolo fino alla fine) e si può trovare di tutto.
MOTORI DI RICERCA PER DATASET
Sapevi che esistono dei motori di ricerca creati apposta per classificare e restituire all’utente dei dataset?
Nel 2018 Google ha lanciato Google Dataset Search, un servizio che va a completare Google Scholar, fatto apposta per studenti, ricercatori, scienziati e data journalist.
Google ha indicizzato oltre 25 milioni di dataset, che puoi cercare come faresti normalmente sul motore di ricerca e filtrarli in base alla data, al formato, all’argomento, ai diritti di utilizzo e in base al fatto che siano open e gratuiti oppure no.
Si lo so… ti ho svoltato la vita… non ringraziarmi però aspetta di vedere le altre due fonti! 😉
Con la crescita dei dati a disposizione e di organizzazioni che li rendono disponibili sono nate anche numerose testate giornalistiche e blog che fanno informazione attraverso i dati (esattamente come noi qua: DataSnack)
Alcune di esse rendono persino disponibili i dataset utilizzati sul loro sito mentre altre hanno un profilo su GitHub dove pubblicano i dati citati nel loro articolo ai fini di migliorare la trasparenza.
Insomma, anche qui puoi trovare una miniera d’oro di dati pronti da scoprire e utilizzare. Ti faccio qualche esempio:
Ultima, ma di certo non per importanza fonte di dati, riguarda i report che organizzazioni pubbliche o private redigono periodicamente.
Questi report includono ricerche, sondaggi, dati raccolti da varie fonti, analisi e studi approfonditi su temi specifici. Alcuni creano persino una piattaforma di data vizualization mirata ad esplorare i dati comodamente osservando grafici dinamici e interattivi.
Siete curiosi di saperne di più vero?
Date un’occhiata allora a questi due report: Democracy Index e World Press Freedom Index.
Avrei potuto citare moltissime altre fonti, basta pensare alle ONG, ai centri di ricerca, ai portali delle aziende e molti molti altri ma si finirebbe per scrivere un libro infatti… lo abbiamo fatto o meglio ci stiamo lavorando e tu potrai darci qualche feedback e averlo in anteprima!
Ti basta lasciare la tua email qua sotto così che possiamo contattarti e avvisarti quando sarà pronto.
Sarà una vera e propria guida che ti accompagnerà nel mondo dei dati.
Una vera bomba insomma! Lascia la tua email e ti avviseremo quando sarà pronto!
NON PERDERTI LE PROSSIME GUIDE!
Lascia la tua email per ricevere le nuove guide e un approfondimento settimanale con dati e grafici!
Presto riceverai notizie!
Tieni d'occhio l'email!
😉