Un'analisi di rete dei finanziamenti europei alla ricerca - 3

Tipo di attività: 
Civic Hackathon(s) 03/06/2017
Livello di difficoltà: 
Intermedio
Durata: 
400 minuti

Background
Durante SOD16 abbiamo costruito e esplorato un'analisi di rete dei fondi di ricerca europei erogati con l'ottavo programma quadro (Horizon 2020). La rete che abbiamo costruito ha svelato alcune caratteristiche macro del "pianeta Horizon 2020": una chiara struttura centro-periferia; la presenza di molte organizzazioni "intermediate", cioè che accedono ai fondi soltanto attraverso un'unico partner strategico; e soprattutto la Death Star, un nucleo molto denso composto da 78 organizzazioni iperconnesse.  Quasi tutte queste organizzazioni sono grandi centri di ricerca pubblici e università; imprese e ONG sono assenti o quasi. Un confronto con i dati del programma quadro precedente (FP7, fino al 2013) evidenzia una struttura simile anche lì (anche se i dati non sono completamente confrontabili. 
Per quanto amatoriale e fatto per divertimento, il lavoro ha avuto una piccola eco. In questa track dell'hackathon lo riprendiamo e lo rinforziamo, con l'obiettivo di produrre una piccola pubblicazione (anche solo a livello di un post ben fatto).
 
Cosa faremo
Le direzioni di lavoro possibili sono tante. Per esempio:

  • Specificare l'analisi a seconda del campo della ricerca. La rete di alleanze per la ricerca sulla medicina è simile a quella sull'informatica? O diversa? I soggetti che ricevono finanziamenti sono specializzati in uno o due campi, o sono generalisti? Gli specializzati si alleano con gli specializzati o con i generalisti?
  • (Questo è il mio preferito) Costruire una "rete delle discipline" per scoprire se ci sono campi di ricerca che "interagiscono" attraverso la formazione dei consorzi. Per esempio, potremmo scoprire se molti soggetti  partecipano sia a progetti di informatica che a progetti di medicina, mentre pochi partecipano sia a progetti di medicina che a progetti di fotonica. Questo vorrebbe dire che informatica e medicina sono connesse tra loro, mentre la fotonica è isolata. 
  • Cercare effetti causali tra centralità nella rete e probabilità di essere finanziati. Questo, però, richiede che la Commissione Europea ci porti i dati sulle proposte non finanziate, che a oggi non sono aperti. Li abbiamo chiesti, speriamo bene. 

Ne sceglieremo una o più, a seconda delle forze disponibili. Quindi, per favore, se partecipi a Open Data Fest 17 e vuoi essere parte di questo progetto, faccelo sapere prima possibile! Scrivi a me (alberto chiocciola cottica punto net) o meglio ancora posta su SOD. Se hai una tua direzione di lavoro da proporre, saremo contentissimi di ascoltarla.
Partecipa Baya Remaoun, responsabile del dataset presso l'European Data Portal. 
 
Preparazione
Usiamo prevalentementeTulip, un software molto potente per esplorare e visualizzare reti, che l'anno scorso ha incuriosito parecchi spaghettari. Quindi:

  1. Scarica e installa l'ultima versione di Tulip.
  2. Scarica la prospettiva Tulip preparata per l'hackathon. Contiene i dati di CORDIS già scaricati, sistemati con Google Refine e già riorganizzati in forma di grafo. 
  3. Lancia Tulip e carica la prospettiva. 

Ora sei pronto per l'esplorazione! Se qualcuno preferisce altri software posso provare a esportare nel formato preferito.