Fonti di Dati e Metodi per Valutare la loro Affidabilità


Fonti di Dati e Metodi per Valutare la loro Affidabilità

Cerchi dati su un particolare argomento o problema? Non sai da dove iniziare e dove cercare? In questo articolo vedremo come iniziare a trovare fonti di dati pubbliche sul Web e come valutarne l'affidabilità.


Metodi di ricerca dei dati

Anche se potrebbero non essere sempre facili da trovare, molti database sul Web sono indicizzati dai motori di ricerca. Ecco alcuni trucchi che puoi utilizzare per ottimizzare le tue ricerche di dataset:

1°) - Durante la ricerca di dati, assicurati di includere sia i termini di ricerca (in inglese mi raccomando!) relativi al contenuto dei dati che stai cercando di trovare, sia alcune informazioni sul periodo, sul formato o sulla fonte in cui ti aspetteresti che si trovino. Tipo: "burn ratio by country from 2000 to 2020 in csv"

2°) - Puoi fare ancora meglio, Google e altri motori di ricerca ti permettono di cercare per tipo di file. Ad esempio, puoi cercare solo fogli di calcolo (aggiungendo alla ricerca "filetype: XLS filetype: CSV"), dati geografici ("filetype: shp") o estratti di database ("filetype: MDB, filetype: SQL, filetype: DB '), oppure puoi persino cercare i PDF ("filetype: pdf").

3°) - Puoi anche cercare per termini che fanno parte di un URL. Cercando su Google 'inurl: downloads filetype: xls' si cercherà di trovare tutti i file Excel che hanno "download" nel loro indirizzo web. Puoi anche limitare la ricerca ai soli risultati su un singolo nome di dominio, cercando, ad esempio: "Site: agency.gov".

4°) - Un altro trucco consiste nel non cercare direttamente i contenuti, ma nei luoghi in cui potrebbero essere disponibili i dati. Ad esempio, "site: agency.gov Directory Listing" potrebbe fornire alcune liste di directory contenenti dati su specifici temi generate dal sito con facile accesso ai file raw, mentre "site: agency.gov Database Download" cercherà dei dataset scaricabili messi a disposizione dal sito governativo.

Fonti di dati

Negli ultimi anni sono apparsi sul web numerosi portali di dati dedicati, data hub e altri siti di dati. 

In questo articolo ti faccio conoscere in particolare 5 fonti essenziali da cui puoi partire:

👉 5 Fonti essenziali per trovare i dati che ti servono

Altrimenti questi sono ottimi posti in cui iniziare a cercare, potresti dare un'occhiata a:

  • Portali dati ufficiali. La disponibilità del governo a rilasciare un determinato set di dati varia da paese a paese. Un numero crescente di paesi sta lanciando portali di dati (ispirati a data.gov degli Stati Uniti e data.gov.uk del Regno Unito) per promuovere il riutilizzo civico e commerciale delle informazioni governative. Un indice globale aggiornato di tali siti può essere trovato su datacatalogs.org
  • Aggregatori di datiThe Data HubUna risorsa guidata dalla comunità gestita dalla Open Knowledge Foundation che semplifica la ricerca, la condivisione e il riutilizzo di fonti di dati disponibili apertamente, soprattutto in modi automatizzati.
  • I portali di dati della Banca Mondiale e delle Nazioni Unite forniscono indicatori su tutti i paesi con dati storici risalenti anche a molti anni nel passato.
  • Stanno emergendo una serie di startup che mirano a costruire comunità intorno alla condivisione e alla rivendita dei dati. Ciò include Buzzdata, un luogo in cui condividere e collaborare su set di dati privati ​​e pubblici, e negozi di dati come Infochimps e DataMarket.
  • Dati di ricerca. Esistono numerosi aggregatori nazionali e disciplinari di dati di ricerca, come lo UK Data Archive. Mentre ci saranno molti dati gratuiti al punto di accesso, ci saranno anche molti dati che richiedono un abbonamento o che non possono essere riutilizzati o ridistribuiti senza prima chiedere il permesso.

COME VALUTARE SE UNA FONTE DI DATI È AFFIDABILE?

Per valutare una fonte puoi utilizzare un metodo che noi chiamiamo C.O.A.A.P. basato su 5 elementi di valutazione che può aiutarti nella valutazione della fonte da cui stai leggendo o prendendo dei dati.

I cinque elementi di valutazione sono:

  • Currency: quanto sono tempestive le informazioni? Descrive come stanno le cose oggi o come erano in passato?
  • Objectivity: L'informazione presenta opinioni o fatti?
  • Autority: chi è la fonte delle informazioni? Quali sono le credenziali della fonte?
  • Accuracy: su cosa si basano le informazioni? Sono dati qualitativi o quantitativi? 
  • Purpose: qual è lo scopo delle informazioni? È imparziale? È di parte?

Alcuni professionisti consigliano di assegnare un punteggio a ciascuna origine di dati su queste dimensioni. Tuttavia, semplicemente valutarli in modo sistematico può aiutare a identificare dove e perché esistono disconnessioni.


Vediamo questo metodo più in dettaglio con qualche esempio di domanda e risposta che dovresti farti al fine di valutare bene la fonte di informazione che hai di fronte:

Data e tempestività

  • Quando sono state pubblicate le informazioni?
    • Per libri e articoli, dovresti essere in grado di verificare facilmente la data di pubblicazione.
    • Per i siti web, prova a determinare la data in cui la pagina web è stata creata o aggiornata.
  • Sono necessarie informazioni aggiornate? In caso contrario, le informazioni accurate, ma storiche, potrebbero comunque essere accettabili?


Oggettività o bias

  • La fonte contiene opinioni o fatti?
  • Le informazioni presentate nella fonte sono oggettive (imparziali) o soggettive (distorte)?
  • L'informazione promuove un'agenda politica, religiosa o sociale?
  • Il contenuto pubblicitario (che di solito si trova su riviste o giornali economici) è chiaramente etichettato?

Autorità e credibilità

  • Chi è l'autore?
    • È una persona?
    • È un'organizzazione come un'agenzia governativa, un'organizzazione senza scopo di lucro o una società?
  • Quali sono le qualifiche dell'autore?
    • Qual è l'occupazione, l'esperienza o il background formativo dell'autore?
    • L'autore ha qualche competenza in materia?
    • L'autore è affiliato a un'organizzazione come un'università, un'agenzia governativa, un'organizzazione senza scopo di lucro o una società?
  • Chi è l'editore?
    • Per i libri, è una stampa universitaria o un editore commerciale? Questi tipi di editori utilizzano gli editor per garantire una pubblicazione di qualità.
    • Per giornali o riviste, puoi dire se è popolare o di natura accademica? Vedi: rivista tra pari, rivista popolare o rivista?
    • Per i siti Web, si tratta di un sito Web aziendale o di un blog personale?


Precisione e affidabilità

  • Le informazioni sono ben ricercate?
    • Ci sono riferimenti (ad es. Citazioni, note a piè di pagina o bibliografia) a fonti che forniranno prove per le affermazioni fatte?
    • Se la fonte include fatti o dati statistici, queste informazioni possono essere verificate in un'altra fonte?
    • Se i dati sono stati raccolti utilizzando ricerche originali (come sondaggi o interviste), qual è stato il metodo di raccolta dei dati? L'autore ha rivelato la validità o l'affidabilità dei dati?

Scopo e pubblico previsto

  • Qual è lo scopo della fonte? Per esempio:
    • Per fornire informazioni (ad es. Articoli di giornale)
    • Per persuadere o sostenere (ad esempio, editoriali o articoli di opinione)
    • Per intrattenere (ad esempio, un video virale)
    • Per vendere un prodotto o un servizio (ad es. Materiale pubblicitario o di marketing su un sito Web aziendale)
  • Chi è il pubblico previsto? Per esempio:
    • Studiosi e ricercatori accademici con conoscenze specialistiche
    • Il pubblico in generale (senza conoscenze specialistiche)
    • Studenti delle scuole superiori, dell'università o dell'università (ad es. Libri di testo per studenti che imparano una nuova materia).

CONCLUSIONE

Spero che questo articolo ti sia stato utile per aiutarti a trovare i dati che cerchi e per aiutarti a valutare qualsiasi fonte ogni volta che ti trovi di fronte a delle informazioni.

Ti invito a salvarti questo articolo tra i preferiti così che tu possa sempre recuperarlo quando dovrai valutare l'affidabilità di una fonte o quando dovrai trovare dei dataset utili alle tue ricerche, pogetti, tesi, presentazioni o altro! 😉

👈 LEZIONE PRECEDENTE: Tipi di dato e Metodi di analisi in base allo Scopo

👉 LEZIONE SUCCESSIVA: Modi per rappresentare i dati e come scegliere quello giusto


.