Chi controlla l'integrità dei dati?

"Dall'inizio della civilità umana al 2003 sono stati prodotti 5 esabyte di dati, la stessa quantità di dati che oggi produciamo ogni due giorni. E il passo sta accelerando": questa frase è stata pronunciata da Eric Schmidt nel 2010, a quel tempo era Executive Chairman di Google (leggi di più qui).  Ma chi controlla l'integrità dei dati? Il fatto che siano corretti? Che non ci siano errori o manipolazioni? Sono domande cruciali e su questo tema c'è una discussione sul gruppo google di Spaghetti Open Data (partecipate!): alcuni soggetti hanno regole precise per assicurare la correttezza del dato (Vincenzo Patruno ad esempio segnalava la metodologia dell'Istat). Gli errori però possono essere "materiali", per esempio nel riprodurre in digitale dati raccolti tramite strumenti non digitali (ad esempio, questionari cartacei). Può capitare quindi a tutti di sbagliare, anche perché la quantità di dati pubblicati sta aumentando a dismisura: diceva per esempio Carlo Romagnoli, ricercatore da oltre dieci anni, che tutti - Istat compreso - stanno incrementando la pubblicazione di dati / Open Data
Ho cercato di mettere in questo post alcuni degli spunti discussi su Spaghetti Open Data, ma ce ne sono tanti altri (giuridici, di processo, etc.). Il consiglio è di partecipare alla discussione, anche solo leggendola tutta. Il link per farlo è il seguente > https://groups.google.com/forum/#!topic/spaghettiopendata/EQIC4Pq5Oy0
 
Immagine tratta da http://commons.wikimedia.org/wiki/File:Broken_glass.jpg