Linkiamo i Dati

Tipo di attività: 
(SOD15) Hackathon 28/03/2015
Livello di difficoltà: 
Intermedio
Durata: 
480 minuti

--- Sommario post-hackathon ---
Pubblichiamo in seguito all'hackathon, qualche informazione su quello che abbiamo fatto.

Abbiamo deciso di lavorare a due tipi di dati, e di conseguenza, formare due sottogruppi.

  • Uno dei gruppi ha lavorato alla definizione di un'ontologia per supportre il progetto di Social Food Labelling. Un breve report, insieme a vari riferimenti a documenti prodotti è quì.
     
  • L'altro gruppo si è concentrato sulla conversione in RDF del catalogo dei database di rilevanza nazionale dell'AgID. Report e documentazione.
     

 
-----------------------------------------------------------
 
In breve la proposta di questo hackathon è di produrre o usare linked open data (https://prezi.com/9lp7g71_wuq9/linked-open-data/). Questo non è un lavoro solo per informatici smanettoni, anzi, invitiamo a partecipare anche chi ha dati da mettere a disposizione (o da usare), perché puntiamo a mettere insieme gli esperti di un certo tipo di dati con chi conosce l’informatica che serve a farci cose utili.
 
Questo tema è strettamente collegato anche alla track “Fusepool P3 Contest”, dove sarà possibile riusare dati già modellati come LOD, o eventualmente arricchirli. Questo tocca la dissemination dei concetti del mondo Linked Open Data e pertanto le due sessioni sono complementari.

 
Riguardo a noi, si tratta di scegliere una tipologia di dati e farci una (o più) di queste cose:

  • se sono dati aperti esistenti, ma non in formato linked data (ie, non RDF), stabilire come trasformarli in Linked Open Data, andando a vedere quali schemi (vocabolari, ontologie, ecc) esistono, oppure quali ci sono da creare e da adattare, e come farlo. Dati disomogenei (es, diversi nomi di colonne in diversi file, per indicare la stessa cosa) sono particolarmente interessanti.
     
  • se non ci sono dati, ma ci sono le potenzialità per recuperarli, aprirli e metterli a disposizione in modo unificato (es, un unico portale), vedere come modellarli, identificando quali entità riguardano (es, Museo, Comune, Opera), con quali proprietà descriverle (titolo, CAP, coordinate) e quali relazioni hanno tra loro (es, si trova nel comune, contiene le opere).
     
  • se ci sono già linked data (ma potenzialmente anche se non ci sono), immaginare quali applicazioni ci si potrebbe costruire sopra: ricerche, visualizzazioni (dash board, infografiche), statistiche e altre analisi (es, network analysis).

Chiaramente, tra le due cose dette sopra non c’è necessariamente una netta linea di divisione: potrebbero esserci dati parziali, da completare con del lavoro di modellazione e di estrazione di altri dati.
 
Tra i tipi di dati che potremmo prendere in considerazione per fare quanto sopra, finora abbiamo raccolto queste proposte: http://goo.gl/GfsGWp. Chiunque è liberissimo di aggiungere qualcosa alla lista, però ci piacerebbe selezionarne 2-3 almeno un 10 giorni prima.