Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

Työnimi: Kansallinen suositus pysyvien tunnisteiden käytölle Suomessa

Muita ehdotuksia:

Taustaa dokumentin nimelle: Muissa maissa on tehty yleensä kansallista PID-strategiaa, jos työllä on selkeä mandaatti, tai kansallisia PID-suosituksia, jos yhtä selkeää mandaattia ei ole.

PID-verkoston tapaamisessa kesäkuussa 2025 nämä vaihtoehdot dokumentin nimelle ja luonteelle olivat suosituimpia. Aiemmin tiekartassa tehtäväksi annettiin valmistella kansallista PID-politiikkaa, mutta millä edellytyksin dokumenttia voidaan kutsua sellaiseksi? Napaakkaan otsikkoon olisi helpoin viitata (esim. Kansallinen PID-suositus, Kansallinen PID-strategia)

Sisällysluettelo

Table of Contents
minLevel2

Johdanto

(päivitetty 24.9.2025)

Info
titleTähän kiteytys


...

Viime vuosina PID-politiikka- ja strategiatyötä on tehty kansainvälisellä tasolla ja monissa muissa maissa erityisesti tutkimuksen tunnisteisiin liittyen. EOSC (European Open Science Cloud) on julkaissut PID Policyn vuonna 2020. "This Persistent Identifier (PID) policy is written for senior decision makers within potential EOSC service and infrastructure providers, and will be of interest to all EOSC stakeholders. It defines a set of expectations about what persistent identifiers will be used to support a functioning environment of FAIR research. Requirements of providers and the basic services they offer are also outlined." EOSCin PID Policy avaa mm. PIDien hallintaan liittyvää vastuunjakoa ja rooleja. Myös kansallisia PID-strategioita ja linjauksia on valmisteltu viime vuosina useissa maissa. Eri maiden PID-strategiatyössä on hyödynnetty muissa maissa tehtyä valmistelua, mm. Suomen kansallista PID-tiekarttaa. Vastaavasti muissa maissa tehtyä työtä ja keskusteluita muiden maiden valmistelijoiden kanssa on hyödynnetty myös tässä dokumentissa.

Pysyviin tunnisteisiin liittyviä hyötyjä ja velvoitteita

Pysyvien tunnisteiden käyttöä voi perustella sekä niiden tuomilla hyödyillä että myös viranomaisille annetuilla velvoitteilla. Hyötyjen täysmääräinen toteutuminen edellyttää kuitenkin niiden käyttöä ja hallintaa ohjaavia yleisiä linjauksia (esim. EOSC PID Policy) että myös tunnistekohtaisia sekä organisaatio-, infrastruktuuri- ja kansallisen tason linjauksia ja hyviä käytäntöjä.

...

Sekä Suomen Akatemia että EU:n tutkimusrahoittajat edellyttävät FAIR-periaatteiden huomioimista. FAIR edellyttää pysyviä tunnisteita tutkimuksen toistettavuuden varmistamiseksi, ja niiden soveltamisen pitäisi tapahtua niin automatisoidusti kuin mahdollista. Yksilöidyt vaatimukset pysyvien tunnisteiden käytölle ovat myös lisääntyneet esimerkiksi rahoitushakemuksissa, aineistonhallintasuunnitelmissa ja tutkimustuotoksia julkaisevilla alustoilla.

Itse strategian/politiikan hyödyt

  • To build trust and develop our compentencies and organisations to better support Swedish researchers and HEIs. (Ruotsi)
  • Articulate a vision with a timeline (Irlanti)
  • Identify and deliver quick wins (Irlanti)
  • Identify and specify key integrations
  • Benefits of Embracing PIDs (USA, tarkoitus sisällyttää strategiaan)
  • Kansallisen PID-politiikan tavoitteena olisi luoda käytäntöjä, joiden avulla pysyvien tunnusten luonti tapahtuu osana tiedon tuotantoprosessia eikä jälkikäteen ja pysyviä tunnisteita hyödynnetään kattavasti yli organisaatiorajojen. (PID-tiekartta)

Soveltamisalue

Tässä dokumentissa on tuotu esiin pysyvien tunnisteiden käyttöön ja hallintaan liittyviä periaatteita ja suosituksia erityisesti tutkimuksen tunnisteiden näkökulmasta sekä viimeaikaisten kehittämishankkeiden pohjalta, mutta monia periaatteita ja suosituksia voi soveltaa myös muilla alueilla. Dokumentin tausta-aineistoksi kerätään myös muihin pysyvien tunnisteiden soveltamisalueisiin liittyviä ohjeistuksia, joita voidaan täydentää myöhemmin. Dokumentissa pääpaino on resolvoituvan pysyvän tunnisteen määritelmän täyttävissä tunnisteissa, mutta monia asioita voi soveltaa myös muihin tunnisteisiin, jotka eivät täytä kaikkia näitä ehtoja. Esimerkiksi FAIRCORE4EOSC-hankkeessa kehitetty PID Meta Resolver on kehitetty resolvoimaan monia sellaisiakin tunnisteita, joilla ei ole varsinaista omaa resoluutiopalvelua eikä yhtä selvästi määriteltyä resolvoinnin kohdetta.  Näitäkin tunnisteita hyödynnetään silti esim. linkitetyssä datassa ja niitä (mm. ISBN, ISSN) käytetään myös tutkimustuotosten tunnisteina varsinaisten pysyvien tunnisteiden rinnalla. On kehitetty myös uusia hajautettuja tunnistejärjestelmiä, kuten DID (Decentralized Identifier) joita voidaan käyttää laajasti eri käyttötarkoituksiin. Tarvetta on myös dynaamisen datan tunnistamiselle, jolloin joissain tapauksissa eri versioille annetaan uudet tunnisteet, mutta itse dynaamiselle objektille tarvitaan yksi yksilöivä pysyvä tunniste.

Pysyvän tunnisteen määritelmästä

Tässä dokumentissa PID tarkoittaa pysyvää tunnistetta (persistent identifier), jotka PID-verkoston määritelmän mukaan tarkoittavat "ainutkertaisia ja pysyviä tunnisteita jotka ovat toiminnallisia Internet-verkossa", eli resolvoituvia. Tunnisteilla viitataan joko digitaalisiin objekteihin (resursseihin) tai fyysisten tai abstraktien objektien digitaalisiin kuvauksiin. Objekti voi olla esimerkiksi julkaisu, aineisto, henkilö, organisaatio, käsite sanastossa tai ontologiassa tai paikkatieto. Pysyvyydellä viitataan sekä itse tunnisteisiin että objekteihin, joihin ne viittaavat. Joidenkin tunnistejärjestelmien ohjeistuksissa määritellään, että tunnisteet on on tarkoitettu "pysyväksi tarkoitettuihin" objekteihin viittaamiseksi ja "pysyvät" tunnisteet on saatettu määritellä myös "pitkäikäisiksi" (esim. OpenAIRE). Tutkimuksen kontekstissa korostetaan pysyvien tunnisteiden määritelmässsä niiden merkitystä FAIR-periaatteiden toteuttamiseksi: "Persistent Identifier that supports and enables research that is FAIR is one that is globally unique, persistent, and resolvable". (EOSC PID Policy, 2020).

PID-lyhennettä käytetään toisessa merkityksessä viittaamaan henkilötunnisteeseen (PID = Personal Identification Data), eli määritelmän mukaisesti "joukkoon attribuutteja, jotka yksilöivät luonnollisen henkilön PID-myöntäjän kontekstissa". Tässä merkityksessä PID-tunnisteella voidaan viitata esimerkiksi Suomessa käytössä olevaan yksilöivään henkilötunnukseen ja lyhennettä käytetään esimerkiksi uudistetussa eIDAS-asetuksessa, jossa säädetään henkilöiden tunnistamisesta EU-valtioiden rajat ylittävässä asioinnissa sekä sähköisen asioinnin luottamuspalveluista. Tarkoituksena on mahdollistaa sähköinen tunnistautuminen ja muiden henkilötietojen luotettava osoittaminen koko EU-alueella. Vaikka tässä dokumentissa PIDillä tarkoitetaan pysyvää tunnistetta (persistent identifier), työssä on tarkasteltu myös sitä, miten esimerkiksi "personal identification data" -määritelmän mukaiset henkilötunnukset toteuttavat myös "persistent identifier"-määritelmän mukaisia periaatteita.

Periaatteet ja suositukset

Pysyviltä tunnisteilta vaadittavat ominaisuudet

Pysyviin tunnisteisiin ja niiden hyvään hallintaan liittyvät periaatteet on johdettu mm. EOSCin PID Policysta ja Tunnuskäytänteet julkisessa hallinnossa YTI-suosituksista. Pysyvien tunnisteiden käyttäminen vaatii myös niitä käyttäviltä organisaatioilta sitoutumista. Pysyvän tunnisteen ja elinkaarenhallinta ei pääty siihen, kun tunniste on annettu. 

#

Periaate / Suositus

1

1. Yksilöllisyys (Uniqueness)

Jokaisen PID-tunnisteen tulee olla yksiselitteinen ja yksilöidä kohteensa globaalisti. Tunnisteen myöntävän tahon on varmistettava, ettei samaa tunnistetta anneta kahdelle eri kohteelle.

2

2. Pysyvyys (Persistence)

Tunnisteen tulee säilyä muuttumattomana. Jos kohteen sijainti tai muu metadata muuttuu, tunnisteen tulee silti pysyä voimassa ja viitata oikeaan kohteeseen. Tunnisteilla viitataan kohteisiin, joiden on tarkoitus olla pysyvästi löydettävissä. Jos kohdetta ei enää ole, laskeutumissivu johon pysyvä tunniste johtaa korvataan muistosivulla. 

3

3. Resolvoitavuus (Resolvable)

PID-tunnisteen tulee olla teknisesti resolvoitavissa (esim. URL-muodossa), jolloin se ohjaa käyttäjän kohteeseen tai sen metatietoihin. Resolvoitavuus edellyttää, että tunniste on linkitetty luotettavaan palveluun.

4

4. Roolit ja vastuut

PID-ekosysteemissä tunnistetaan seuraavat roolit:

  • Palveluntarjoaja (PID Service Provider): Vastaa tunnistejärjestelmän teknisestä ylläpidosta ja infrastruktuurista.

  • Hallinnoija (PID Manager): Vastaa tunnisteiden myöntämisestä ja metatietojen ylläpidosta.

  • Omistaja (PID Owner): Tunnisteen omistaja tai tuottaja.

  • Loppukäyttäjä (PID End User): Henkilö tai organisaatio, joka hyödyntää tunnistetta tiedon haussa, viittauksissa tai muussa toiminnassa.

Joissakin tapauksissa samalla organisaatiolla saattaa olla useanalaisia rooleja.

5

5. Versiointi (Versioning)

Jos kohteesta julkaistaan uusia versioita, tulee harkita uuden PID-tunnisteen myöntämistä. Tunnisteiden ja versioiden välinen suhde tulee dokumentoida selkeästi metatiedoissa.

6

6. Yhteentoimivuus (Interoperability)

PID-järjestelmien tulee olla yhteentoimivia muiden tunnistejärjestelmien ja metatietostandardien kanssa. Tämä mahdollistaa tunnisteiden hyödyntämisen laajasti eri järjestelmissä ja palveluissa.
Yhteentoimivuuden tulee kattaa myös järjestelmä- ja alustariippumattomuus, jotta tunnisteet säilyvät käytettävissä teknologioiden ja palveluntarjoajien vaihtuessa. PID-järjestelmien tulisi tukea avoimia rajapintoja ja standardeja, jotka mahdollistavat skaalautuvuuden ja pitkäaikaisen yhteiskäytön.

7

7. Läpinäkyvyys ja avoimuus (Transparency and Openness)

PID-järjestelmien hallinnan ja teknisen toteutuksen tulee olla läpinäkyvää. Suositellaan avoimia standardeja ja rajapintoja, jotka mahdollistavat laajan käytön ja integraation.
Tunnisteisiin liittyvän metadatan tulee olla laadukasta, dokumentoitua ja mahdollisimman avoimesti saatavilla, jotta tunnisteet tukevat tiedon löydettävyyttä ja yhteentoimivuutta.

  • saatavilla (avoimuus)

  • ymmärrettävää ja dokumentoitua (läpinäkyvyys)

  • yhteentoimiva ja standardoitu(tukee myös periaatetta 6)

8

8. Luotettavuus ja saatavuus (Reliability and Availability)

PID-palveluiden tulee olla teknisesti luotettavia. Niiden tulee olla saatavilla ilman merkittäviä katkoja. Palveluiden jatkuvuus ja pitkäaikainen ylläpito on varmistettava.
Tunnisteiden toimivuus ei saa olla sidottu yksittäiseen tekniseen toteutukseen tai palveluntarjoajaan. Suositellaan arkkitehtuureja, joissa PID-toiminnot ovat erotettavissa datan hallinnasta, mikä mahdollistaa tunnisteiden säilymisen riippumatta siitä, missä ja miten itse dataa säilytetään tai jaetaan.

9

9. Hallittavuus ja vastuullisuus (Governance and Accountability)

PID-järjestelmillä tulee olla selkeä hallintomalli, joka määrittelee vastuut, roolit ja päätöksenteon. Hallinnan tulee kattaa koko tunnisteen elinkaari – luomisesta ylläpitoon, muutoksiin ja arkistointiin.
Hallintamallin tulee huomioida myös käyttöoikeudet, tietosuoja ja eettiset näkökohdat, erityisesti silloin kun tunnisteet liittyvät henkilöihin tai sensitiiviseen tietoon.
Lisäksi hallintamallin tulee olla läpinäkyvä ja dokumentoitu (ks. periaate 7: Läpinäkyvyys ja avoimuus), ja sen tulee mahdollistaa sidosryhmien osallistuminen ja vastuullinen päätöksenteko.

10

10. Käyttäjien sitouttaminen ja osaaminen (Community Engagement and Capacity Building)

PID-järjestelmien onnistunut käyttöönotto ja ylläpito edellyttävät käyttäjien sitouttamista, koulutusta ja yhteisön tukea. Organisaatioiden tulisi tarjota tukea ja ohjeistusta PID-käytäntöjen omaksumiseen ja kehittämiseen.


PIDien hallinta organisaatiotasolla

Monissa raporteissa, pysyviä tunnisteita koskevissa linjauksissa ja kansallisissa strategioissa (esim. Australian PID-strategia, EOSCin FAIR-IMPACT-hankkeessa tehdyt suositukset, Europeanan PID policy) suositellaan pysyviä tunnisteita hallinnoivia organisaatioita luomaan oma PID-politiikka tai vähintään sisällyttämään pysyvien tunnisteiden hallinta esimerkiksi datapolitiikkaan. Myös tietovaranto- tai repositoriokohtaisille PID-politiikoille voi olla tarve ja esimerkiksi tutkimusinfrastruktuureissakin täytyy huomioida mukana yhteentoimivat PID-linjaukset. Organisaatiokohtaisen PID-politiikan avulla voidaan varmistaa hyvät ja kestävät käytännöt PIDien luomiseen, hallintaan ja hyödyntämiseen. Julkisena, sidosryhmille välitettynä dokumenttina organisaatiokohtainen PID-politiikka myös lisää organisaation tunnisteiden ja esimerkiksi tietoaineistojen hallintaan kohdistuvaa luottamusta. Guidelines for PID Managers -dokumentti sisältää useita lisäsuosituksia pysyvien tunnisteiden hyvälle hallinnalle, niiden ainutkertaisuuden ja pysyvyyden varmistamiseksi ja toiminnallisuuksien hyödyntämiseksi.

...

Cruz, M., & Tatum, C. (2021). NWO Persistent Identifier Strategy (Version 2). Zenodo. https://doi.org/10.5281/zenodo.4695367

Miten varmistetaan periaatteisiin sitoutuminen ja hyötyjen saavuttaminen?

25.9.2025 Tämä liittyy myös tämän dokumentin luonteeseen: kuinka esim. dokumentin laatijoiden kotiorganisaatiot ja muut PID-verkostossa mukana olevat organisaatiot sitoutuvat tähän? Onko tämä PID-verkoston jäsenten tekemä suositus vai sitoutetaanko organisaatiot tähän?


Kansallinen ohjaus

  • Create a long term cross-stakeholder governing group tasked with strategy delivery (Irlanti)
  • Establish clear ownership of the PID agenda (Irlanti)
  • Määritellään kansallinen pysyvien tunnisteiden ohjauksesta vastaava taho (YTI-suositus)
  • Keskitetään pysyvien tunnisteiden hallinnointia nykyisiin hallinnointia suorittaviin organisaatioihin ja tiivistetään kansallista yhteistyötä. (YTI-suositus)
  • Perustetaan pysyvä kansallinen toimielin nykyisen kansallisen tietohallinnon ohjausrakenteen puitteissa, joka vastaa tunnistejärjestelmiin liittyvästä yhteistyöstä, kehittämisestä ja ohjauksesta.(YTI-suositus)
  • Should be able to be used by actors within research to be used as a basis for decision making and coordination regarding PIDs. (Ruotsi)
  • Draft an Irish PID concordat (Irlanti)
  • Kansallista PID-politiikkaa tarvitaan, sillä pysyvien tunnisteiden määrittämiseen tarvitaan selkeitä, esimerkiksi tiedonhallintalakiin ja valtionhallinnon tiedonhallintamalliin perustuvia ohjeita ja käytäntöjä. (Tiekartta)

Sitouttaminen, osallistaminen

  • All collaboration partners should be able to stand behind the resulting resource. (Ruotsi)
  • Involve senior sector leaders in the strategy delivery (Irlanti)
  • Build out a network of networks to drive PID adoption (Irlanti)
  • Strengthen the voice of research management professionals (Irlanti)
  • Empower and support community champions (Irlanti)

...

  • Recommended Strategies for Moving Beyond Legacy Systems 
  • Recommendations for Evaluating and Adopting PID Infrastructure 
  • Recommended Strategies for Supporting Core PID Infrastructure 
  • Recommended Strategy for Supporting Centralized PID Infrastructure 

Kyvykkyydet, osaamisen kehittäminen, kv yhteistyö

  • Leverage existing partnerships to shape PID developments nationally and internationally (Irlanti)
  • Recruit in expertise to extend and increase PID capabilities (Irlanti)
  • Recommended Approach to Measuring Success (USA, tarkoitus sisällyttää strategiaan)

Ohjeistukset ja tuki

  • Build a shared resource library (Irlanti)
  • Establish a central PID support service (Irlanti)
  • Investing in targeted support (Irlanti)


Käyttötapaukset

Mitä PIDitetään? Suositeltavat PIDit

Sovitaan kansallisesti miten paikataan tunnistetut puutteet PID-tarjonnassa. (PID tiekartta)

...

Info

Näistä myös omia alisivuja - tiivistetään tätä osiota ja siirretään osa sisällöistä erillisiin käyttötapausdokumentteihin


Tutkimuksen tunnisteet

Referenssi: EOSC PID Policy

  • Vaatimukset tunnisteista: EOSC PID Policy (PID-määritelmä melko tiukka), huomioidaanko muutkin tunnisteet tai tunnisteet jotka eivät täysin täytä kaikkia kriteereitä (mm. hajautetut), uudet tunnistejärjestelmät jne?
  • Soveltaminen: mitä objekteja pitäisi tunnistaa? - esimerkit käyttötapaussivulla
  • Käyttörajoitetun datan tunnisteet?
  • Tunnisteiden jakelu Suomessa: miten esim. pienet toimijat oivat saada, jos eivät käytä palvelua jonka kautta tunnisteita saavat (esim. CSC:n tai FSD:n tutkimustietovarannot, TSV:n Journal.fi, KK:n julkaisuarkistot) 


KAM-sektorin tunnisteet

Referenssit:

https://pro.europeana.eu/post/policy-for-persistent-identifiers-in-the-data-space

...

  • Kirjastoaineistoissa käytetyt tunnisteet
    • perinteiset tunnisteet (ISBN, ISSN) vs. resolvoituvat PIDit?
  • Arkistoaineistoissa käytetyt tunnisteet?
    • URN:NAN - Kansallisarkistossa tulossa käyttöön
  • Museot?
  • Paikkatietoihin liittyvät tunnisteet?
  • Aika?
  • Ontologioiden käsitteet?
  • Toimijoiden tunnisteet (ISNI)? Käytettään yli sektorirajojen

Julkishallinnon tunnisteet

Ks. Tunnuskäytänteet julkisessa hallinnossa - linjaukset ja kehitysehdotukset

...

  • mikä on pysyvä tunniste (tähän vastattu jo tässä dokumentissa)
  • mitkä pysyvät tunnisteet ovat keskeisiä 
  • tunnisteiden hallinnointi ja käyttö
  • hallinnonalojen yhteiset käytännöt
  • Mikä on tarkoituksenmukainen tapa organisoida tunnisteiden hallinta? (vastuutahot, keskitetty/hajautettu malli)
  • Tunnisteiden linkittäminen ja linkityspalvelut? (tarvitaanko uusia kansallisia resolvointipalveluita ja "PID Providereita" joillekin tunnisteille?)
  • Tunnisteiden käytön ohjaus


Muut tunnisteet?

Jätetään toistaiseksi ulkopuolelle, voidaan täydentää myöhemmin

...

(viittaukset eri tunnistestandardeihin - > vai saadaanko mitään näihin liittyvää politiikkatekstiä?)

Lyhenteet

EOSC European Open Science Cloud

Terminologia

Termien määritelmät ensisijaisesti EOSCin PID-politiikasta vai PID-tiekartasta?

...

  1. PID = Persistent Idenfier. PID-verkoston määritelmän mukaan "pysyvillä tunnisteilla (persistent identifier) tarkoitetaan ainutkertaisia ja pysyviä tunnisteita jotka ovat toiminnallisia Internet-verkossa." Tunnisteilla viitataan joko digitaalisiin objekteihin (resursseihin) tai fyysisten tai abstraktien objektien digitaalisiin kuvauksiin. Objekti voi olla esimerkiksi julkaisu, aineisto, henkilö, organisaatio, käsite sanastossa tai ontologiassa tai paikkatieto. Pysyvyydellä viitataan sekä itse tunnisteisiin että objekteihin, joihin ne viittaavat. Joidenkin tunnistejärjestelmien ohjeistuksissa määritellään, että tunnisteet on on tarkoitettu "pysyväksi tarkoitettuihin" objekteihin viittaamiseksi ja "pysyvät" tunnisteet on saatettu määritellä myös "pitkäikäisiksi" (esim. OpenAIRE). Tutkimuksen kontekstissa korostetaan pysyvien tunnisteiden määritelmässsä niiden merkitystä FAIR-periaatteiden toteuttamiseksi: "Persistent Identifier that supports and enables research that is FAIR is one that is globally unique, persistent, and resolvable". (EOSC PID Policy, 2020).
  2. PID = Personal Identification Data. Joukko attribuutteja, jotka yksilöivät luonnollisen henkilön PID-myöntäjän kontekstissa. Tällöin PID-tunnisteella voidaan viitata esimerkiksi Suomessa käytössä olevaan yksilöivään henkilötunnukseen. yhennettä käytetään esimerkiksi uudistetussa eIDAS-asetuksessa, jossa säädetään henkilöiden tunnistamisesta EU-valtioiden rajat ylittävässä asioinnissa sekä sähköisen asioinnin luottamuspalveluista. Lompakon on tarkoitus mahdollistaa sähköinen tunnistautuminen ja muiden henkilötietojen luotettava osoittaminen koko EU-alueella. 

Tunnistejärjestelmiä

Erikseen vai käyttötapauksittain periaatteiden/suositusten alle?

  • Esimerkki ryhmittelystä:
  • Tutkimuksen tuotokset (tutkimusdata, tutkimusjulkaisut
  • Tutkimuksen toimijat (tutkijat ja muut kontribuoivat henkilöt, tutkimusorganisaatiot, rahoittajat, tutkimusinfrastruktuurien toimittajat/ylläpitäjät),
  • Rahoitukset ja muut aktiviteetit,
  • Instrumentit (laitteet jne), näytteet, ohjelmistot (research software - voi olla myös tuotos?)


Suositukset jatkokehittämiselle/toimenpiteiksi?

Päivitetty tiekartta ja ehdotuksia (esim. PIDien käyttöä neuvovat tahot Suomessa ym, jo aiemmin ehdotettu kansallinen koordinaatioelin...)

Lähdeluettelo

(yhdenmukaistetaan viittaukset)

...