Julkisen sektorin hallussa olevasta datasta osa on julkista ja osa on sensitiivistä. Tietoaineistojen avaaminen kohdistuu luonnollisesti vain ei-sensitiivisiin aineistoihin. Avoimella datalla tarkoitetaan laillisesti ja teknisesti uudelleenkäytettävää dataa, jota voi julkishallinnon ohella tuottaa myös muut toimijat.
Data itsessään ei ole hyödyllistä, vaan sitä pitää jalostaa tekemällä palveluita. Esimerkiksi tietokanta jukisen liikenteen aikatauluista ei suurinta osaa meistä juuri kiinnostaisi, mutta Reittiopas -palvelu on yksi Suomen käytetyimmistä ja tunnetuimmista verkkopalveluista.
Reittiopasta ylläpitävä HSL kuuluu niihin harvoihin julkishallinnon organisaatioihin, joka on ymmärtänyt, että samalla, kun tuottaa kansalaisia hyödyttävän verkkopalvelun voi tarjota myös palvelun raaka-aineen eli datan muiden käytettäväksi. Reittioppaan avoimia rajapintoja hyväksikäyttäen on muun muassa tehty palveluita niin iPhone (ReittiGPS), kuin Android (Andropas) älypuhelimille. Nämä mobiilipalvelut ovat syntyneet ilman, että HSL:n olisi tarvinnut osallistua niiden kehittämiseen millään lailla.
Tieto ei ole niukkuudesta kärsivä resurssi, jaettaessa sen määrä ei vähene, eikä laatu heikkene. Tämä on hyvin ymmärretty, eikä monikaan vastusta julkisin varoin tuotetun tiedon avoimempaa jakamista. Käytännössä kuitenkin useimmat organisaatiot jalostavasta omista tietokannoistaan verkkosivuja, julkaisuja, asiakirjoja ja dokumentteja, mutta eivät julkaise itse dataa. Miksi näin on?
Nykyinen julkisuuslaki (621/1999) takaa tiedonsaantioikeuden julkisista asiakirjoista. Laki ei kuitenkaan sano mitään tietoaineistojen teknisestä tai laillisesta uudelleenkäytettävyydestä. Lisäksi maksuperustelain (150/1992) nojalla julkishallinnon tietovarannoista monissa tapauksissa veloitetaan vielä maksu. (edes julkisuuslakia ei aina noudateta). Datan julkaiseminen unohdetaan, kun organisaatiot keskittyvät täyttämään lain velvoitteet ja julkaisemaan dokumentteja.
Kehitteillä olevan Vaalilupausarkisto -palvelun tekijät pyysivät eduskunnan sivuilta löytyviä äänestysietoja, sekä kansanedustajien puheenvuoroja ja profiilitietoja koneluettavassa muodossa. Eduskunnan tietohallinnon vastaus oli:
…kyllähän [järjestelmän toimittaja X] näitä tekee toimeksiannosta, joka lienee tässä tapauksessa määriteltävissä hyvinkin tarkasti. Voitte pyytää hintatiedon [virkamies Y:ltä] . Maksajana on maksuperustelain mukaan vaalilupausarkisto eli luovutamme tiedot omakustannushintaan. Meiltä tarvitaan hyväksyminen tiedon poiminnalle tietokannoistamme.
En valinnut esimerkkiä mollatakseni eduskuntaa, sillä eduskunnassa on ainakin jo herätty valmistelemaan tietovarantojen avaamista toisin, kuin suurimmassa osassa julkishallinnon organisaatioita. Esimerkki vain on tuore ja todellinen ja kuvaa erinomaisesti asioiden nykytilaa.
Virallista tietojen avautumista odotellessa monet palveluiden kehittäjät ovat valinneet teknisesti tuskallisemman ja lain harmaalla alueella olevan lähestymistavan ja tehneet omia niin sanottuja screen scraper (ruudun raapija) -ohjelmia, jotka käyvät automaattisesti läpi verkkosivuja ja tallentavat tiedot sieltä tietokantaan. Näin esimerkiksi Kansanmuisti.fi on raapinut eduksunnan sivuja ja duunitori.fi taasen työvoimaviranomaisten sivuja.
Arkea helpottavien sovellusten ohella päätöksenteon perusteena käytettävän tiedon tulisi olla avointa demokratian toteutumisen nimissä. Esimerkiksi liikennehankkeiden perusteluina käytetään liikennesimulointeja ja verotuksen ja tulonsiirtojen perusteena kansantalouden simolointimalleja.
Simulaatiot ovat mustia laatikoita, joiden toiminta on harvojen käsissä – vain johtopäätökset ja pieni osa olettamuksista on päättäjien ja saatavilla. Mallin laskukaavoihin sisältyvät monilukuiset olettamukset tarkastelun kohteina olevista ilmiöistä ja arvaukset siitä, miten ne puolestaan vaikuttavat muihin ilmiöihin, jäävät täydelliseen pimentoon. Mallien ja laskentaan käytettyn datan tulisi olla avoimesti saatavilla, jotta pohjaolettamuksista voitaisiin keskustella.
Tällaisen avoimuuden luulisi kiinnostavan myös puolueita ja poliitikkoja. Tähän mennessä Suomessa asiaa on kuitenkin edistänyt lähinnä kansalaisaktiivit ja pieni joukko asdiaan vihkiytyneitä virkamiehiä. Poliitikoita, jotka ovat julkisesti ottaneet kantaa avoimemman tiedon puolesta on yhdenkäden sormilla laskettava määrä.
Antti Poikola
Kirjoittaja on Liikenne- ja viestintäministeriön julkaiseman ”Julkinen data – johdatus tietovarantojen avaamiseen” -oppaan (Poikola, Kola Hintikka 2010) pääkirjoittaja. Avoimen datan ohella Poikola on paneutunut pyöräilyn edistämiseen, kansalaisten ja julkishallinnon välisten yhteistyöratkaisujen kehittämiseen (fillarikanava.fi) ja avoimuuteen pohjautuvien toimintamallien jalkauttamiseen.
Miksi?
Miksi me organisaatiot jalostamme näitä verkkosivuja, dokumentteja ja muita asiakirjojamme, emmekä edes ajattele näitä tuotoksiamme julkaistavana datana?
Ihmiset ovat vain sellaisia, että toimintatapojen muuttaminen on koetaan työlääksi ja uusi asia pelottavaksi. Jos joku kysyisi, mikä datan julkaisemisessa pelottaa, harva läytäisi äkkisältään mitään vakuuttavaa syytä. Betoni tuottaa heti mielikuvan vahvasta ja paloturvallisesta materiaalista, puuta täytyy perustella. Mielikuvatasolla epäluulo elää ja voi hyvin. Datankin tuottamisen perusperiaatteet ja käytännöt on tehtävä mahdollisimman helpoiksi tuottajille, jotta asiaan saadaan vauhtia.