Tiedon jäljitettävyys ja luotettavuus ovat ehdottomia edellytyksiä hyvälle hallinnolle. Siirtyminen digitaalisiin palveluihin ajankohtaistaa tiedon yksilöinnin tarpeen myös pitkällä aikavälillä ja järjestelmistä riippumattomalla tavalla. Jotta kansalainen voi luotettavasti seurata asiointinsa etenemistä ja tietojensa hallintaa, on tiedon oltava todennettavissa ja jäljitettävissä. Myös tietosisältöjen on oltava yksilöityjä ja niiden elinkaarta on hallittava suunnitelmallisesti. Tunnisteiden käyttö on tällöin välttämätöntä.

Yksittäinen tunnus identifioi aina jotakin: esimerkiksi julkaisun, asiakirjan, henkilön tai organisaation. Niitä koskevan informaation paikallistamisen ja saatavuuden takaamiseksi tarvitaan suunnitelmallisuutta ja yhteisiä pelisääntöjä – sekä pysyviä tunnisteita. Tässä selvityksessä käsittelemme tätä luotettavan yksilöinnin haastetta. Nykytilan kartoituksen ohella selvityksessä esitetään keinoja tunnistejärjestelmien ja tunnusten käytön tehostamiseksi.

Yleiskielessä käytetään vaihtelevasti termejä tunniste ja tunnus. Tässä käytetään määritelmää, jonka mukaan tunnistejärjestelmistä jaetaan tiettyjen määriteltyjen käytäntöjen mukaisesti yksittäisiä tunnuksia. Pysyvillä tunnisteilla (persistent identifier) tarkoitetaan ainutkertaisia ja pysyviä tunnuksiaisteita jotka ovat toiminnallisia Internet-verkossa. Työryhmä katsoo, että pysyvät tunnisteet ovat tietohallintolain (634/2011) mukaisia yhteentoimivuuden kuvauksia ja määrityksiä.

 

Tunniste verkkosivulla

Ihanteellisessa tilanteessa verkossa näkyvää tunnistetta klikkaamalla käyttäjä pääsee aina alkuperäisen, yksilöidyn tiedon äärelle ja myös kone osaa tulkita tämän linkityksen sekä ymmärtää minkä tyyppisestä sisällöstä on kyse.


Tarjolla on sekä organisaatioiden sisäiseen käyttöön toimivia ratkaisuja että ulkopuolisia PID-palveluita. Esimerkiksi paikkatiedollejulkaisuille ja digitaalisille resursseilletutkijoille sekä opetus- ja koulutusalalle on olemassa eritasoista ohjeistusta ja palveluita yksilöivien tunnisteiden ja niiden käytön osalta. Asiasanoille löytyy puolestaan tunnisteita Finto-palvelusta, jossa on myös hallinnonalan sanastoja. Finto tarjoaa myös tieteenalaluokistusta. Kehitteillä on myös kansallinen Nimitietopalvelu. Yhteisten tunnisteiden, kuten ORCID:in käyttö helpottaa yleensä toimintaa huomattavasti ja on siksi suositeltavaa.

Mikäli käytössä on omia järjestelmiä joissa on verkkoon näkyviä tunnisteita, on syytä huolehtia siitä, että ne ovat vähintään EU-kommission ohjeiden sekä W3C:n suositusten mukaisia. Mikäli on kyseessä on tavallinen URI sen vakaudesta on pidettävä huolta. Ulkoista palvelua valittaessa on puolestaan syytä tarkistaa, että järjestelmä on teknisesti luotettava, auktoritatiivinen, joustava metadatan esittämisen suhteen sekä yhteentoimiva omien ja kansallisten järjestelmien kanssa. Myös resolvoinnin tarvetta on syytä pohtia.

Erilaisia PID-järjestelmiä käytetään yhä useammin, sillä yksinkertaiset URI-tunnisteet eivät välttämättä ole riittävän pysyviä verkko-osoitteiden, -sivustojen tai organisaatioiden rakenteiden muuttuessa. Domainia valittaiessa kannattaakin mieluummiin valita domain-nimi, joka kuvaa kyseistä tietovarantoa mahdollisimman hyvin, eikä organisaation nimeä sisältävää domain-nimeä. URI-tunnisteet voivat kuitenkin olla pysyviä niin kauan kuin niitä hallinnoiva organisaatio omistaa oikeuden kyseiseen verkko-osoitteeseen. PID-järjestelmän tunnisteet ovat puolestaan pysyviä niin kauan kuin palvelu on olemassa, eikä esimerkiksi verkkosivun osoitteen muutos vaikuta niihin. PID-järjestelmän, kuten esim. Handlen, ylläpitäminen vaatii kuitenkin jatkuvaa teknistä ylläpitoa ja osaamista. Content negotiation -mekanismin avulla järjestelmä voi myös sopeuttaa vastauksensa riippuen kyselyn agentista siten, että esimerkiksi selaimelle vastataan html-dokumentilla ja RDF-lukijan saadessa RDF-tiedoston. Tämä mahdollistaa uusien formaattien lisäämisen järjestelmään myöhemmin.


Linkkejä:


Aikaisempia selvityksiä ym:


Checklist

Ruotsin yhteentoimivuussihteeristö on kehittänyt organisaatioita varten seuraavan tarkistuslistan, jonka avulla voi lähestyä tunnisteiden hallintaa:
  • onko organisaatiollasi datapolitikka?

  • onko organisaatiollasi tunnistepolitiikka?

  • ovatko organisaatiosi tunnisteet sisäisesti yksilöllisiä?

  • ovatko organisaatiosi tunnisteet globaalisti yksilöllisiä?

  • ovatko organisaatiosi tunnisteet sisäisesti pysyviä?

  • ovatko organisaatiosi tunnisteet globaalisti pysyviä?

  • Mikäli käytössänne on vain organisaation sisäisiä tunnisteita, ovatko ne sellaisia, että niitä voidaan käyttää suositusten mukaisesti osana ulkoista pysyvää yksilöivää tunnistetta?

  • onko käytettyjen tunnisteiden luonti ja käyttö organisaatiossa hallittua?

  • toimiiko linkkien päivitys organisaatiossanne?

  • onko tarvetta ulkoisen resolverin käytölle?

  • jos pysyvät tunnisteet ovat URI-tunnisteita, ovatko ne EU-komission suosituksen mukaisia? ["http://{domain}/{tyyppi}/{käsite}/{viite}/"]

Mikäli käytössänne on PID-järjestelmä:

  • käytetäänkö sitä vain sisäisesti vai myös ulkoisesti?

  • onko järjestelmää integroitu muihin järjestelmiin?

  • onko järjestelmälle olemassa hallintasuunnitelmaa?

  • koulutetaanko järjestelmän käyttäjiä?

  • onko järjestelmä luotettava koskien esim. tietoturvaa ja kopiointia?

  • mikäli käytätte ulkopuolisen osapuolen tarjoamia tunnisteita tai resolvointia, onko niitä ylläpitävä taho auktoratiivinen ja luotettava?

  • onko järjestelmä joustava ja tarjoaako se tietoa sen laatua heikentämättä?

  • onko järjestelmä yhteentoimiva (kansallisten ja kansainvälisten tai avointen

  • standardien mukainen)?

 
  • No labels