You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 72 Next »

TYÖDOKUMENTTI

Askelmerkkejä PID:ien käyttöönottoon 

A. Vaatimusten karttoittaminen

  • ulkoiset vaatimukset
    • käyttäjien tarpeet
    • kansalliset linjaukset
      • rahoituspäätökset? TTV?
      • Organisaatiot
    • esim EU-direktiivit 
    • alakohtaiset tms standardit ja käytännöt
  • mille tarvitaan tunnisteet ja mitä näistä ylläpidetään itse?
    • datasetti = tutkimusaineisto
      • DOI
    • tietokantakysely
      • DOI (dynaamisten tietokantojen staattisille osajoukoille)
    • tiedosto /bitstream
      • URN (PAS-palveluun siirrettävien julkaisujen tiedostot)
    • tutkimusinfrastruktuurit (data, equipment, service; https://koodistot.suomi.fi/codescheme;registryCode=research;schemeCode=ServiceTypeCode)
    • laite, sensori (ulkoinen?)
      • handle? 
      • TTV infra tunnisteet URN
    • tietokanta/tietojärjestelmä/ohjelmisto
      • TTV infra tunnisteet URN
      • palvelu?
    • projekti (ulkoinen)
      • RAID?
    • rahoituspäätös (ulkoinen)
      • TTV?
    • palvelu?
    • tutkijat
      • ORCID (ulkoinen)
      • ISNI (ulkoinen)
    • opiskelijat
      • Oppijanumero (Opetushallitus)
    • Julkaisut (ulkoinen)
      • ISBN, ISSN, ...
      • DOI
    • Organisaatiot (ulkoinen)
      • ISNI
      • RoR
      • GRID
      • (Y-tunnus)/Business-ID
      • (EU) PIC
    • Sanastot- ja ontologiat (ulkoinen?)
      • URN
      • finto URI
      • laji (tun) URI
    • Muuttujat  (ulkoinen?)
  • palvelutaso (SLA)
    • saavutettavuusvaatimus 
    • back up/peilit
    • skaalautuvuus
  • toiminnallisuus
    • resolvoituvuus

B. Ratkaisujen vertaileminen

  • tietomallit
  • kustannukset
    • palveluun liittyminen/palvelun pystyttäminen
    • Ylläpito 
    • Lyhyen ja pitemmän aikavälin kustannus
    • elinkaari/exit-mahdollisuus
  • luotettavuus
    • teknologian ylläpidettävyys ja teknisen migraation mahdollisuus
    • mahdollisen ulkopuolisen palvelun toimittajan vakaus ja uskottavuus

C. Ylläpidon vastuut 

  • resolvointi
  • tunnisteiden hallinnointi
  • aineiston kuratointi

D. Eri tunnistejärjestelmät

TunnistejärjestelmäYlläpitäjätahoAineistotHuomautuksia
ARK, Archival Resource Key



https://en.wikipedia.org/wiki/Archival_Resource_Key
Cool URI

Kansalliskirjasto

sanastot (Finto)Uusissa Finton sanastoissa käytetään URN-tunnuksia.
Cool URIMaanmittauslaitospaikkatietoTunnistekäytäntö perustuu Inspire-direktiiviin
Cool URIFinBiFsanastot (lajit)
Crossref DOITSVjournal.fi artikkelitTSV ei jaa DOI-tunnuksia muille artikkeleille
ePIC handleePIC / Eudat/ FIN-Clarintiedostotsopii esim. tiedostoille, ei metatietovaatimuksia objektin osalta
DataCite DOICSCtutkimusaineistotLiittyy tutkimusaineistolle sopivat metatiedot, minimimetatietovaatimus, https://schema.datacite.org/, suositellaan huolellista versionhallintaa sekä aineiston jatkuvaa eheyden valvontaa.
handle-
Käyttäjiä paljon, mutta niitä ei rekisteröidä keskitetysti joten emme tiedä ketkä järjestelmää Suomessa soveltavat.
ISBNKansalliskirjastomonografiat
ISNIKansalliskirjasto

tieteellisen ja taiteellisen luovan työn tekijät

(henkilöt ja organisaatiot)

Kansalliskirjasto on ISNI Registration Agency 2.5 2020 lähtien. Kansalliskirjaston Asteri-tietokannassa olevat henkilöiden tiedot lähetettiin ISNI-tietokantaan lisättäväksi toukokuussa 2020. Henkilöiden saamat tunnukset on lisätty Asteri-tietokantaan ja ne ovat vapaasti eri tahojen käytettävissä.

ISNI-tunnuksia saatiin seuraavasti:

Records read:                  137575

Records selected:            137557

Load errors:                     18

Assigned records:           124254


18 records were rejected because they contained a problem. 54 assigned person records have two NLFIN identifiers.

Noin 125.000 suomalaisella on siis nyt ISNI-tunnus. Tähän sisältyvät kaikki suomalaiset tutkijat, jotka ovat julkaisseet ainakin yhden kirjan. 

Organisaatioiden tiedot on lähetetty jo aiemmin.Tutkimusorganisaatioiden osalta mukana ovat vain ne jotka ovat toimineet julkaisijoina. Suurella osalla tutkimusorganisaatioista ei tämän vuoksi ole ISNI-tunnusta. Lisäksi ISNI-tietokannan ongelmien vuoksi tunnusta eivät ole saaneet organisaatiot, joilla on edeltäjiä ja seuraajia.

RAG-organisaationa Kansalliskirjasto voi hakea ISNI-tunnuksia suomalaisille toimijoille "on-line", heidän tai heidän kehysorganisaatioidensa pyynnöstä.

ISSNKansalliskirjastokausijulkaisutKansalliskirjastossa sijaitseva kansallinen ISSN-keskus antaa ISSN-tunnukset kotimaisille kausijulkaisuille. Lehtien kuvailutiedot tallennetaan kansainväliseen ISSN-tietokantaan.
OppijanumeroOpetushallitusopiskelijat

Perustuu OID-tunnukseen (Object Identifier) (sen aliavaruus)

ORCID

CSC, Suomen ORCID-

konsortio

aktiivitutkijat

Edesmenneet tutkijat ja henkilöt jotka eivät hae ORCID-tunnusta: ISNI käytettävissä.

ROR?tutkimusorganisaatiottiedejatutkimus.fi, huom. kansalliset koodistot
GRID
tutkimusorganisaatiothttps://www.grid.ac/
QID - Wikidata identifierhttps://www.wikidata.org/mm. tutkimusorganisaatiot
URNKansalliskirjasto

monografiat

(URN:ISBN)

digitoidut aineistot

(URN:NBN)

URN:NBN-tunnusta käytetään yhteistyöorganisaatioissa hyvin monentyyppisten aineistojen kuvailuun. NBN-nimialueen tunnistejakelun periaatteet ovat hyvin liberaalit.



rahoittajat



Jufo-IDJuFojulkaisutPitäisikö tilanne saada sellaiseksi että ISSN varmasti riittäisi

Käyttötapauksia


Hyödyt tunnisteiden käytöstä:

Olisiko ideaa niputtaa osa alla olevista hyödyistä FAIR-periaatteen alle?

  1. Datan laatu, saatavuus ja käytettävyys jatkossa
  2. Organisaatioiden julkaisutiedonkeruu
    1. ORCID: tutkijalle meriittiä (Tutkimustietovaranto)
    2. ISBN/ISSN tieteellisen  (A- ja C -tyypit) julkaisutyypin edellytys => meriittiä sekä tutkijalle että organisaatiolle
  3. Organisaatioiden julkaisuarkistot
    1. Pysyvä linkki julkaisuun (yleensä URN?), lisäksi julkaisutietueessa DOI (mikäli julkaisulla on)
  4. Altmetriikka: 
    1. DOI  tai muu pysyvä tunniste oleellista mainita aina, kun postaa someen uutisen tutkimustuotoksestaan
    2. esim.DOI:n avulla voidaan saada tietoa julkaisujen  some-huomiosta  esim. Altmetric.com -palvelussa
    3. esim. rahoitushakemuksissa tutkimusryhmän tuottamien julkaisujen saama some-huomio on osoitus tutkimuksen yhteiskunnallisesta vaikuttavuudesta
  5. Tutkimuksen toistettavuus viittausten avulla
  6. Dataan viittaaminen antaa meriittiä
    1. tekstin sisäiset viittaukset
    2. dataviittaus referenssilistassa koneluettava
    3. viittaus dataan lisää viittauksia julkaisuun (Piwowar, H.A., Day, R.S., Fridsma, D.B. Sharing detailed research data is associated with increased citation rate (2007) PLoS ONE, 2 (3), art. no. e308)
    4. viittauksista on hyötyä tutkijalle ja organisaatiolle
  7. Tiedon jäljitettävyys ja alkuperä näkyväksi
  8. Kansainväliset tietokannat 
    1. Scopus/Elsevier: ORCID helpottaa tutkijan tunnistamista (varsinkin, jos Scopus-profiili hajonnut)
    2. Data Citation Index/Clarivate: tietokanta, josta voi hakea dataviittauksia
  9. Hyöty tutkijalle
    1. nopeuttaa rahoitushakemusten laatimista
    2. nopeuttaa julkaisujen submittausta
  10. Tukee avointa tiedettä ja avointa vertaisarviointia. Plan S:n mukainen
  11. Maksuttomuus 

  


PID politiikat

Oulun Yliopisto: Oulun yliopiston suositus pysyvistä tunnisteista (PID) tutkimusaineistoille  https://www.oulu.fi/yliopisto/node/44005

CSC

Kansainväliset politiikat, organisaatioiden ym. politiikat


Mille tarvitaan tunniste/tunnisteita

Julkaisut

  • jo yleisti vakiintunut käytäntö varsinkin kv-julkaisuilla (DOI)
  • monografialle ISBN (linkki oppaaseen)
  • sarjajulkaisut ja lehdet: ISSN
  • kotimaisilla (tiede)julkaisuilla tunnistekäytäntö vielä osin vakiintumaton
  • ORCIDIn käyttökin yleistyy hyvin kustantajien (ja tutkimusrahoittajien) vaatimuksesta
  • DOI:n käyttö julkaisujen näkyvyyden (altmetriikka) edistämiseksi oleellista
  • yliopistojen CRIS-järjestelmiin kerättävät tunnisteet julkaisujen osalta

Infrat

  • https://dwidrihfe.csc.fi/ tutkimusinfrastruktuurien tietojen toimitus tutkimustietovarantoon
  • UOUlussa osalle infroja jo hankittu URN, osalle hankinnassa. Ohjausryhmä, jos vie asioita eteenpäin.
  • tunniste mahdollistaa viittaamisen

Tutkimusaineistot (datat)

  • UOulussa tutkimusaineistokataloogi-hanke ideoinnissa.
  • Mihin viitataan, jos datalla on useampi tunniste? 
  • Koneluettavat aineistonhallintasuunnitelmat: esim. DMPOnlinessa testissä RoR-tunnisteiden integrointi systeemiin. Testissä myös DOI-integraatio. DOI DMP:lle? Julkaisujen DOI:t DMP:hen?
  • Kansallisista FAIRdata-palveluista saatavat tunnisteet: QVaimesta URN. DOI vain IDA:SSA oleville aineistoille? Miksiköhän näin?? URN, jos julkaistaan vain metadataa. 

Sanastojen, tesaurusten, ontologioiden tunnisteet

  • termikohtaiset? käsitekohtaiset? käytetäänkö missään?? mitä hyötyä voisi olla?? käykö ilmi käytetty sanasto pelkän tunnisteen perusteella?? Fintossa on YSOn tunnisteet.

Käyttötarkoitus, mihin tietoa kerätään, viittaamien?

  • julkaisutietojen, datojen, infrojen, tutkijoiden, organisaatioiden yksiselitteinen yhdistäminen toisiinsa
  • infraan/tutkimusaineistoon liittyvien julkaisujen ja julkaisujen saamien viittausten mappaus tietokannoista

Rajoitukset

  • monenmoiset järjestelmät?
  • tiedon/motivaation puute?
  • osa tunnisteista - kuten ORCID - vaatii tutkijalta omaa aktiivisuutta tunnisteen luomisessa ja ylläpidossa
  • useita tunnisteita samasta asiasta/samalle asialle: esim. tutkijalla voi olla useita ORCID-tunnisteita
  • lopullisen tunnisteen saamisessa viive esim. julkaisulla (voi olla viittauksia + muuta huomiota jo ennen pysyvää tunnistetta) > tunnisteen varaamismahdollisuus tärkeä

Kustannukset

Saatavuusvaatimukset

Muut vaatimukset, esim metatiedot, näkyvyys, jäljitettävyys?

  • erilaisten tunnisteiden haettavuus/hyödynnettävyys tietokannoissa ei läheskään kattavaa

Esimerkkejä:

Tutkimusorganisaation tutkimusaineistojen säilytyspalvelu  ja sen metatietovaranto

SYKE CKAN

(Hanna)




Toiveita


Ohjeita metatietojen tekemisestä, esimerkkejä!!

CrediT taxonomy


https://casrai.org/credit/:

Conceptualization
Data curation
Formal Analysis
Funding acquisition
Investigation
Methodology
Project administration

Resources
Software
Supervision
Validation
Visualization
Writing – original draft
Writing – review & editing


DataCite:

If Contributor is used, then contributorType is mandatory.

Controlled List Values:

ContactPerson

DataCollector

DataCurator

DataManager

Distributor

Editor

HostingInstitution

Producer

ProjectLeader

ProjectManager

ProjectMember

RegistrationAgency

RegistrationAuthority

RelatedPerson

Researcher

ResearchGroup

RightsHolder

Sponsor

Supervisor 

WorkPackageLeader

Other


***


Tällä hetkellä valmiit ratkaisut eivät tarjoa kovin hyviä mahdollisuuksia PIDien käyttöön.

M.m. sensitiiviset datat aiheuttavat tarvetta omiin ratkaisuihin.

Linkitykset voi tehdä myös CRIS-järjestelmässä.

THL aineistokatalogi

Ohjelmistoista:

https://ngr.coar-repositories.org/ 

https://dataverse.org/

https://documents.egi.eu/public/RetrieveFile?docid=3419&filename=EOSC-hub%20D2.8%20v1%20Approved%20by%20EC%20Public.pdf&version=5

Tutkimusprojektin oma relaatiotietokanta


FAIR Data Objects


Mons, Barend & Neylon, Cameron & Velterop, Jan & Dumontier, Michel  & Bonino da Silva Santos, Luiz Olavo & Wilkinson, Mark.  (2017). Cloudy, increasingly FAIR; Revisiting the FAIR Data guiding principles for the European Open Science Cloud. Information Services & Use. 37. 1-8. https://doi.org/doi:10.3233/ISU-170824


TFiR https://doi.org/doi:10.2777/1524


DataCite relation types

https://schema.datacite.org/meta/kernel-4.3/doc/DataCite-MetadataKernel_v4.3.pdf

IsCitedBy

Cites

IsSupplementTo

IsSupplementedBy

IsContinuedBy

Continues

IsDescribedBy

Describes

HasMetadata

IsMetadataFor

HasVersion (DC)

IsVersionOf (DC)

IsNewVersionOf

IsPreviousVersionOf

IsPartOf (DC)

HasPart (DC)

IsReferencedBy (DC)

References (DC)

IsDocumentedBy

Documents

IsCompiledBy

Compiles

IsVariantFormOf

IsOriginalFormOf

IsIdenticalTo

IsReviewedBy

Reviews

IsDerivedFrom (DC: Source)

IsSourceOf

IsRequiredBy (DC)

Requires (DC)

IsObsoletedBy (DC: IsReplacedBy)

Obsoletes (DC: Replaces)


**

Asiat, joille on/saattaa olla tunnisteet valmiina (sisällytetään, varattava paikka tietojärjestelmässä)

  • aineiston tuottaneet henkilöt
  • liittyvät julkaisut
  • liittyvät muut aineistot
  • liittyvät infrastruktuurit ja laitteet
  • liittyvät hankkeet/projektit
  • liittyvät rahoittajat
  • liittyvät rahoituspäätökset
  • liittyvä omistaja/hallinnoija
  • liittyvät tiedostot /jakelut

Asiat, joille järjestelmä tuottaa mastertiedot sekä pysyvän tunnisteen:

  • aineistot (metatiedot, sis. tiedostojen tunnisteet/linkit)
  • aineistokokoelmat?
  • aineistoversiot
  • No labels