Archivio tag: open data

InsulaR all’open data day 2014

Sabato 22 febbraio 2014, in contemporanea in diverse città in tutto il mondo, Italia compresa, si è tenuto l’open data day, giornata dedicata a presentazioni e discussioni sul tema dei dati aperti. Come già avevamo anticipato, anche Cagliari ha avuto il suo evento, già ben raccontato su Sardinia Open Data e su apritisardegna.

L’evento ha avuto una notevole risonanza mediatica, come dimostrato dall’interessamento della RAI e delle principali testate giornalistiche italiane (vedi gli articoli su l’Unione Sarda e La Nuova Sardegna). A sorpresa, la giornata ha visto anche la partecipazione di personalità illustri, come il neoeletto presidente Francesco Pigliaru (in qualità di uditore) e di Renato Soru, che giocava in casa visto che era proprio Tiscali a ospitare l’evento. Se vi siete persi la giornata, qui potete vedere la registrazione dell’intera mattinata di interventi.

Personalmente, all’open data day ho avuto la possibilità di parlare dell’importanza delle discipline statistiche e di R nel campo dell’open data, presentando la nostra comunità InsulaR; forse niente di nuovo per chi già da tempo segue questo blog o ha già partecipato l’anno scorso alla presentazione di InsulaR all’Univrsità di Cagliari, ma è stato bello poter mostrare la rilevanza di queste tematiche all’interno di un tema caldo come quello dell’open data.

Infine, giovedì 22 ho avuto l’opportunità di partecipare, insieme a Manuela Vacca, alla puntata di ExtraLive! in onda su Radio X dove si è parlato ancora un po’ di open data e di opportunità di sviluppo legate alla diffusione dei dati. Qui potete ascoltare la registrazione della puntata.

Open data day 2014 a Cagliari: InsulaR c’è

Come anticipato, sabato 22 febbraio a Cagliari ci sarà l’open data day 2014, evento che si svolgerà in contemporanea in diverse città in tutto il mondo. La giornata sarà divisa in due parti. Nel corso della mattinata, all’Open Campus di Tiscali a Sa Illetta, tra le 9:30 e le 13:00, si susseguiranno una serie di presentazioni dove si affronterà il tema dei dati aperti sotto diversi punti di vista e sfaccettature. Nel corso del pomeriggio, invece, tra le 15:30 e le 17:00, ci si sposterà presso la Marina di Bonaria (Su Siccu) dove si svolgerà un mappping party + monithon.

Un Monithon è un’iniziativa indipendente di monitoraggio civico dei progetti finanziati dalle politiche europee e consiste nel visitare di persona un progetto che si desidera monitorare e stilare un report per capire come i fondi son stati spesi. Un mapping party, invece, è un evento durante il quale si raccolgono informazioni cartografiche tramite smartphone, gps e carta, che verranno successivamente inserite all’interno del sistema OpenStreetMap. Il 22 febbraio, l’associazione Sardinia Open Data guiderà tutti i partecipanti nel monitoraggio dei lavori realizzati per la nuova pista ciclo-pedonale che da Su Siccu conduce al Molo Ichnusa, con contemporanea mappatura del territorio e raccolta di dati geografici.

Questo il programma della mattina (Tiscali Open Campus):

  • 9:30 – L’Open Data Day e gli open data – Manuela Vacca
  • 9:50 – Dati (pubblici) aperti : un’occasione di cittadinanza? – Giorgio Mancosu
  • 10:10 – PA e Open Data: i casi pratici – Giovanni Battista Gallus
  • 10:30 – Il progetto europeo HOMER e il percorso degli open data per la Regione Sardegna – Antonio Quartu, Giaime Ginesu
  • 11:00 – Mapping degli areali delle DOP – Carlo Zucca
  • 11:50- Trasparenza, partecipazione, accountability – Salvatore Marras
  • 11:20 – Il caso internazionale: la cooperazione con gli open data – Claudia Mocci
  • 11:40 – Un esempio di smart citizen. Civic engagement & open culture – Francesca Murtas
  • 12:00 – I dati e la statistica nel mondo open source: InsulaR – Davide Massidda
  • 12:20 – Cultura, lingua sarda e mondo open (dibattito) – Amos Cardia – utenti OSM e Wikipedia, Sandro Usai

Controllate bene la scaletta degli interventi, perché se state leggendo questo blog forse ce n’è almeno uno (ma io spero di più) che potrebbe interessarvi 😉

L’Open Campus si trova all’interno della sede di Tiscali in località Sa Illetta, Km 2.300 della strada statale 195. Può essere raggiunto con i mezzi pubblici attraverso il bus dela linea ARST per Capoterra in partenza dalla stazione di piazza Matteotti alle ore 08.45 (tempo di percorrenza: 5 minuti). Se qualcuno avesse bisogno di un passaggio in automobile, può me contattare via mail (davide.massidda_AT_gmail.com) oppure via Twitter (@DavideMassidda).

Per il pomeriggio, invece, l’appuntamento è per le 15:30 a Su Siccu presso la nuova pista ciclabile. Ulteriori informazioni sul sito di Sardinia Open Data. Qui invece la pagina facebook dell’evento.

Verso l’Open Data Day 2014

Ci siamo quasi, manca solo poco più di una settimana. Sabato 22 febbraio, infatti, ci sarà l’International Open Data Day, evento che si svolgerà in contemporanea in tante città in tutto il mondo (scopri quali), Italia compresa. L’Open Data Day è una giornata d’incontro dedicata al tema dell’open data; in Italia sono previsti incontri in diverse città; come l’anno scorso, anche Cagliari avrà il suo evento.

Inkscape logo

L’incontro si svolgerà in mattinata a Sa Illetta presso l’Open Campus di Tiscali, che gentilmente metterà a diposizione i suoi spazi per ospitare talk e didattiti. Nel pomeriggio, invece, le attività si sposteranno verso Su Siccu dove l’associazione Sardinia Open Data ci guiderà in un’attività sul territorio.

A breve uscirà il calendario; intanto, per maggiori informazioni e dettagli, potete seguire gli aggiornamenti sulla pagina tumblr, sul gruppo facebook Open Data Sardegna oppure su Twitter seguendo Sardinia Open Data e utilizzando l’hashtag #ODD14.

Mi raccomando restate sintonizzati, ben sintonizzati, perché sabato 22 si parlerà anche di InsulaR!

Emergenza alluvione in Sardegna: il ruolo dei dati

È inutile che stia qui a raccontare nel dettaglio quello che è accaduto in Sardegna negli ultimi due giorni. L’alluvione ha messo in ginocchio molti paesi; tantissime località, specie quelle di campagna, si trovano in stato di isolamento e gli abitanti in estrema difficoltà. Con questo post non ho intenzione di descrivere la situazione ma vorrei lanciare un appello a quanti vorranno darci una mano. Non parlo di sostegno economico né di soccorso in loco, ma di un qualcosa che ognuno di noi può fare comodamente da casa stando seduto davanti al proprio computer.

Prima di tutto, vorrei segnalare un’importante iniziativa lanciata in brevissimo tempo da Francesca Murtas in collaborazione con l’associazione Sardinia Open Data. Si tratta di SardSOS, una raccolta di segnalazioni relative sia a situazioni di emergenza che a offerte d’aiuto, geolocalizzate in una mappa. In questo modo, sarà più facile verificare la distribuzione sul territorio delle situazioni critiche e delle risorse disponibili.

Compilando l’apposito modulo, chiunque può inviare una segnalazione. La mappa è direttamente collegata anche a twitter e raccoglie i tweet che fanno uso degli hashtag #sardSOS e #allertameteoSAR, ma è fondamentale che i tweet siano geolocalizzati (bisogna twittare segnalando la propria posizione). L’obiettivo è quello di raccogliere tutte le richieste e le offerte d’aiuto in modo da indirizzare e ottimizzare le operazioni di soccorso.

OpenStreetMap logo

Il sistema di geolocalizzazione sfrutta il servizio di mappatura del territorio OpenStreetMap. Si tratta di un servizio simile al celebre Google Maps, con la differenza che i dati geografici di cui fa uso non sono forniti da una società privata come Google bensì sono inseriti nel sistema dagli stessi utenti. I dati di OpenStreetMap sono di tutti e vengono rilasciati con licenze che ne permettono il libero utilizzo, cosa invece non permessa da Google. Questo non è un dettaglio, perché rende queste mappe utilizzabili da tutti e in qualsiasi contesto, compreso quello umanitario.

In particolari situazioni di crisi, gli operatori che si muovono sul territorio hanno bisogno di conoscere in maniera estremamente dettagliata la geografia del luogo e la localizzazione di determinate risorse. Per esempio, sapere che in una zona isolata si trova un piccolo agglomerato di case e sapere anche quali sono le strade che collegano questo piccolo villaggio agli altri centri, sapere quali strade sono bianche e quali asfaltate, conoscere la localizzazione delle caserme della forestale o delle stazioni dei vigili del fuoco: sono tutte informazioni che potrebbero fare la differenza in caso di pericolo e urgenza. Queste informazioni sono tanto preziose quando difficili da ottenere. OpenStreetMap viene incontro a questa necessità; esso infatti non è una semplice mappa, ma un vero e proprio database nel quale quasi ogni cosa può essere georeferenziata e descritta con appositi tag. OpenStreetMap, alla fin fine, è una raccolta di open data geografici, dove però i dati non sono rilasciati dall’alto ma sono forniti dagli stessi utilizzatori finali. Il front-end è fatto da immagini raster, ma il back-end è costituito da database in formato XML interrogabili anche attraverso R (vedi ad esempio qui e qui).

OSM Tasking Manager - Cyclone Cleopatra

C’è un gruppo di lavoro che si chiama Humanitarian OpenStreetMap Team (HOT), che, nel caso di emergenze umanitarie come le alluvioni, qualora il grado di mappatura del territorio nel quale è in atto la crisi sia giudicato insufficiente, apre degli appositi “task”. Vengono selezionate le aree che hanno urgente bisogno di mappatura e gli utenti di OpenStreetMap, da casa propria, sfruttando strumenti software completamente open source, possono migliorare le mappe inserendo tutte le risorse mancanti, principalmente basandosi sulla propria conoscenza del territorio e sulle immagini satellitari.

Manco a dirlo, proprio oggi è stato aperto un apposito task per la Sardegna. L’invito quindi è quello di dare una mano alla comunità tramite il task Cyclone Cleopatra – Sardinia, Italy. Per conoscere più nel dettaglio come poter iniziare a lavorare, potete contattare direttamente l’associazione Sardinia Open Data, via e-mail (sardiniaopendata@gmail.com) oppure tramite twitter o facebook. Eventualmente, potete anche mettervi in contatto con gli utenti sardi di OpenStreetMap utilizzando la mailing list regionale.

La scienza oggi: molti “data” poco “open”

Quando si parla di “open data” ci si riferisce a una pratica di condivisione dei dati che ne consenta il libero accesso, in maniera semplice, veloce e senza limitazioni. L’associazione Sardinia Open Data descrive così i dati aperti:
“Il detentore dei dati rilascia gli stessi in modo tale da poter essere rielaborati liberamente da chiunque così da poter essere riutilizzati per altri scopi, e quindi generare nuove conoscenze ed aprire nuove strade di sviluppo sociale ed economico.”

L’idea che sta alla base del fenomeno è che i dati in possesso di pubbliche amministrazioni, enti e centri di ricerca, sono stati prodotti con i soldi dei contribuenti, e a questi andrebbero resi. Ciò consentirebbe ai cittadini sia di creare dei nuovi prodotti basati sui dati, sia di controllare l’operato di chi li governa.

Parlando di open data è molto comune imbattersi in tematiche inerenti politiche amministrative, economiche, sociali e, in misura minore, sanitarie. Ma decisamente più difficile è invece sentir parlare di open data in campo scientifico. La cosa suona quantomeno strana, visto che le comunità scientifiche hanno alle spalle ormai diversi secoli di esperienza nella produzione e nell’utilizzo dei dati. È veramente cosa rara trovare, insieme a una pubblicazione scientifica, la tabella di dati sulla base dei quali è stato impostato il lavoro.

Eppure, anche sulla pagina di Wikipedia dedicata all’open data, viene ripetutamente sottolineato l’importante ruolo che la divulgazione dei dati può svolgere nel rendere più efficace il processo scientifico e nell’accelerare le scoperte scientifiche.

Ma perché un ricercatore dovrebbe pubblicare i dati dei proprio studi?

1. Per garantire la trasparenza del proprio operato

Chi conosce il concetto di open data sa bene come questo sia strettamente connesso a quello di trasparenza. E la trasparenza è anche un punto chiave della divulgazione scientifica. Ogni articolo scientifico che presenta una ricerca basata sui dati deve descrivere in maniera rigorosa e dettagliata tutto il protocollo di ricerca, dagli strumenti utilizzati ai metodi di raccolta dei dati, fino ai risultati. Non sono mancati – e purtroppo continueranno a non mancare – casi di frode scientifica, in cui ricercatori in mala fede hanno distorto o generato artificialmente i dati per ottenere dei risultati che non rispecchiano il reale comportamento del fenomeno sotto analisi.

Ma il metodo scientifico ha già in sé gli anticorpi per combattere questo genere di fenomeni: se altri ricercatori non riescono a replicare gli stessi risultati, allora questi saranno rifiutati. Quindi, se gli studi “truffaldini” possono già essere individuati dalla prassi scientifica, a cosa serve pubblicare i dati, visto che tra l’altro questi possono anche essere dolosamente contraffatti? Non basta già la pubblicazione dei protocolli di ricerca e dei risultati? Cosa ha da guadagnare la scienza nel perseguire una politica “open”?

La disponibilità dei dati di uno studio, pur non essendo sufficiente a rendere una pubblicazione scientifica trasparente al 100%, mette rapidamente altri ricercatori in grado di rielaborare gli stessi dati utilizzando tecniche statistiche diverse o raffinando le stesse analisi già proposte dal lavoro originario. Difatti, per giungere a un risultato, di norma sui dati scientifici viene realizzato uno studio statistico. E le vie che si possono seguire nell’elaborazione statistica sono molteplici e diversificate: la robustezza di una ricerca emerge se più metodologie di analisi convergono verso lo stesso risultato.

Inoltre, pur anche in assenza di frode, evidenze empiriche deboli mascherate all’interno di un articolo scientifico possono essere facilmente messe in luce da analisti esperti del settore. Ma per fare questo, ovviamente, i dati devono essere disponibili.

2. Per aumentarne la visibilità dei propri lavori

La trasparenza è solo una parte del discorso, e forse neanche la più importante. I dati non rappresentano un mero elemento probatorio da utilizzare in sede di processo contro un ricercatore fraudolento. Lo stesso ricercatore, in realtà, ha tanto da guadagnare dalla pubblicazione dei propri dati.

Una volta pubblicati, i dati di una ricerca possono essere integrati all’interno di altri studi e confrontati con dati di terze parti. Altri ricercatori potrebbero vedere usi nuovi per quei dati, incrociarli con i propri o quelli di altri ricercatori e produrre rapidamente una nuova pubblicazione scientifica.

Quando un ricercatore realizza e pubblica un nuovo studio utilizzando dati prodotti da un altro ricercatore, esso si troverebbe costretto a citare la fonte originaria dei dati e gli articoli già pubblicati che ne fanno uso. Questo ha la diretta conseguenza di far crescere il numero di citazioni – e quindi la rilevanza – delle pubblicazioni del primo ricercatore. Considerando che uno dei più importanti parametri sui quali la carriera di un ricercatore viene valutata è proprio il numero di citazioni delle proprie pubblicazioni, questo aspetto non è di poco conto.

3. Per dare un decisivo contributo agli studi meta-analitici

Una meta-analisi è uno studio condotto con lo scopo di mettere insieme il risultato di più studi realizzati con gli stessi obiettivi. Questi studi vengono quindi integrati con il fine di trarre delle conclusioni generali. Realizzare una meta-analisi è un po’ un “tirare le somme”; tipicamente, queste ricerche vengono realizzate in campo sanitario per valutare l’efficacia di determinati tipi di trattamento.

Purtroppo, il ricercatore che deve mettere insieme lo storico degli studi clinici in un dato settore si trova puntualmente davanti allo scoglio della scarsa reperibilità dei dati di molti studi. Non sempre i pochi indici riportati negli articoli sono sufficienti, e questo aspetto limita molto le meta-analisi.

Se a ogni pubblicazione scientifica fosse associata una tabella di dati, i ricercatori che si occupano di meta-analisi risparmierebbero tantissimo tempo, e il lavoro ne guadagnerebbe in precisione e raffinatezza.

In conclusione, bisogna ammettere che l’open data oggi non è una semplice moda, ma un’esigenza. E le società scientifiche, da sempre all’avanguardia su tutto ciò che concerne i numeri, non dovrebbero stare a guardare. Per comprensibili esigenze economiche, la maggior parte delle pubblicazioni scientifiche sono consultabili solo previo pagamento di una variabile somma di denaro. Un articolo scientifico quindi non è proprio “open”, ma ci piacerebbe che i dati, almeno quelli, lo fossero.