Pysyvien tunnisteiden hallinnan ja käytäntöjen määrittäminen

 

Pysyvillä tunnisteilla on yhä merkittävämpi ja keskeisempi asema julkaisujen, data-aineistojen ja muun tiedon hallinnassa ja jakelussa samoin kuin palvelujen ja palvelualustojen ja niihin tukeutuvien sovellusten hyödyntämisessä. Ne ovat keskeisiä komponentteja prosessien ja yhteentoimivuuden kehittämisessä, ja sellaisenaan digitalisaation olennaisia ajureita sekä julkishallinnossa että liiketoiminnassa, esimerkkeinä linkitetty avoin tieto (LOD), Internet of Things (IoT) ja avoin tiede. Yksittäiset tietojärjestelmät kuten kansallinen ontologiapalvelu Finto ovat riippuvaisia pysyvistä tunnisteista; ilman niitä palvelun hyödyntämisedellytykset semanttisessa Webissä heikentyisivät oleellisesti. Tunnistejärjestelmien toimivuus vaikuttaa oleellisesti tiedon laatuun.

 

Pysyviä tunnisteita tuotetaan ja hyödynnetään yhä enemmän julkishallinnon organisaatioissa. Suomessa sovelletaan eniten Handle-, DOI- ja URN-järjestelmiä. Toisin kuin perinteisiä tunnisteita kuten kirjojen ISBN-tunnusta, näitä  pysyviä tunnisteita voidaan käyttää Internetissä hyperlinkkeinä. Toisin kuin URL-osoitteet, tällaiset PID-tunnisteiden linkit eivät vanhene eivätkä ohjaa käyttäjää väärään dokumenttiin. Tarjoamiensa hyötyjen vuoksi nämä järjestelmät ovat murtautumassa yhä enemmän organisaatioiden sisäisestä niiden ulkoiseen käyttöön. Niistä on tulossa elintärkeitä julkista tietoa hyödyntäville ja integroiville sovelluksille ja palveluille sekä julkishallinnossa että yritystoiminnassa. Tunnisteiden käytön jatkuvasti kasvaessa tarvitaan kansallinen pysyvien yksilöivien tunnisteiden hallintamalli ja sitä tukevat yhteiset tai suositetut käytännöt osaksi kansallista informaatioinfrastruktuuria, jonka ajanmukaistamiseen valtiovarainministeriön koordinoima Yhteinen tiedon hallinta (YTI) hallituksen kärkihanke tähtää. Hallintamallin tulee tarjota eri tarpeisiin soveltuvat menetelmät ja niitä tukevat käytännöt pysyvien tunnisteiden jalkauttamiseksi.

 

Pysyvien tunnisteiden käyttöönotossa ja toimintatapojen vakiinnuttamisessa edetään laajalla rintamalla kansainvälisesti, ja Suomen on tarpeen pysyä mukana tässä kehityksessä koko kansantalouden kannalta. pysyvien tunnisteiden käytön lisäämiseen ohjaavat myös erilaiset standardointiin tähtäävät toimet, hankkeet ja suositukset, esim. EU:ssa ISA-ohjelma (mm. digitaaliset yhteismarkkinat), tutkimusdatan käsittelyyn tarvittavia eurooppalaisia palveluita ja järjestelmiä kehittävä EUDAT2020-hanke. Kansallisesti merkittäviä ovat esimerkiksi muistiorganisaatioiden Kansallisen digitaalisen kirjaston hanke sekä JHS 159 ISO OID-yksilöintitunnuksen soveltaminen (2006, 2010) ja JHS193 Paikkatietojen yksilöivät tunnisteet (2015). Standardointielimissä pyritään vahvistamaan olemassa olevien pysyvien tunnisteiden toiminnallisuutta ja muutossietoisuutta sekä niiden globaalia saatavuutta. Erilaisten pysyvien tunnisteiden järjestelmien yhteentoimivuuteen tarvitaan yhteisiä käytäntöjä, mikä osaltaan tukee em. tavoitteita. Standardoinnin edetessä joillakin osa-alueilla on myös osa-alueita, joihin liittyy eri intressitahojen poliittisia etuja ja joilla eteneminen edellyttää myös kansallisia ratkaisuja kansainvälisen yksimielisyyden viipyessä.

 

Pysyvien tunnisteiden käyttöön saattamiseen liittyy keskeisesti myös identifoitujen aineistojen metatieto, koska itse tunnisteet eivät lähtökohtaisesti ilmaise semantiikkaa tai tiedon alkuperää. Koska nämä tunnisteet ovat myös tietoa tarjoavia tunnisteita, niihin liittyy tietoturva yleisesti ja yksityisyyden suojana. Tunnistejärjestelmien hallittu toimivuus kokonaisuutena on edellytys tiedon liikkumiselle ja integroinnille. Muita käytännöllisiä haasteita ovat esim. useat eri viittaukset samaan aineistoon silloin kun esim. e-kirjasta on kopio useissa eri organisaatioiden ylläpitämissä järjestelmissä, ja näiden pysyvien tunnisteiden hallinta,  pysvien tunnisteide annotoinnin hallinta erityyppisissä tilanteissa, resoluutio- eli uudelleenohjauspalvelut ja niiden yhteentoimivuus, muutoshallinta- ja sietoisuus, eri pysyvien tunnisteiden tyypit linkitetyn datan käytössä (RDF) ja koulutustarpeet.

 

Tällä hetkellä kansallista koordinaatiota on tehty myös epävirallisessa PID-verkostossa. Tarve yhtenäistää myös elinkaarisääntöjen periaatteet (versiointi), joita ilman riittävää pysyvyyttä, yhteentoimivuutta ja joustavuutta (resilienssi) käytännöissä ei voida saavuttaa, on ilmeinen. Siksi YTI-hankkeessa ehdotetaan määritettäväksi suuntaviivat tärkeimmille kansallisille periaateratkaisuille, joiden perusteella voidaan laatia tarpeelliset JHS-suositukset tai valtioneuvoston asetukset toimeenpanoa varten. Suosituksia uusittaessa on otettava huomioon se, että ISO:n teksti- ja lähdeviitteiden standardia (ISO 690:2010) ollaan uudistamassa niin, että tunnisteille tulee entistä merkittävämpi rooli.

 

YTI-hankkeessa ja sen ohjauksessa tehtävän työn ehdotetaan käynnistyvän 02/2017 siten, että suuntaviivat ja ehdotukset jatkotoimiksi valmistuvat 06/2017, jonka jälkeen olisivat mahdolliset lausuntovaiheet jatkotehtävien käynnistämiseksi syksyllä 2017.

Työn resursoinnin osalta tarvitaan päätoiminen editori (työmääräarvio 6 htkk) sekä edustava työryhmä, esim. PID-verkosto (linkki: verkoston eDuuni-sivut).