Toinen kokous 6.2. 2019 kello 10- 11.30 Adobe Connect.


Läsnäolijat:

Jussi-Pekka Hakkarainen / Kansalliskirjasto

Olli Peltola/Nuorten tiedeakatemia

Tuomas J. Alaterä / Tietoarkisto

Miikka Haimila / Museovirasto

Harri Kiiskinen / Institutum Romanum Finlandiae sr.

Heidi Laine / CSC

Tiina Sipola/OY

Leenakaija Lehto /HAMK

Tuula Pääkkönen /Kansalliskirjasto

O-P Kaurahalme / TY

Tero Aalto / CSC

Päivi Kanerva / TY

Nina-Mari Salminen / Luke

Kaisa Silander / THL

Jessica Parland-von Essen /CSC

.

Tulevia tapaamisia

OpenAIRE 12.3.

TUHA-tapaaminen ja työpaja 9.4.

Avoimen tieteen kevätpäivät 14.-15.5

Kansallisen PID-verkoston tapaaminen?

Tiedeinstituuttien avoin tutkimusdata -hankkeen seminaari Roomassa vkolla 24, teemana tutkimusaineistojen käyttöoikeudet kansainvälisissä tutkimushankkeissa

EOSC-hub week 2019, Praha 10-12 Huhtikuu

Research Data Alliance 13th Plenary Meeting, Philadelphia 2.-4.4.2019, side events 31.3.-1.4.2019 (ohjelma: https://www.rd-alliance.org/plenaries/rda-thirteenth-plenary-meeting-philadelphia/rda-13th-plenary-program)



Esitettyjä toiveita ja tarpeita.

Osaaminen

  • Erilaiset sisäiset ja ulkoiset tunnisteet (UUID, Cool URI, DOI, URN, INSPIRE ID jne)
  • Erilaiset aineistot (rakenne, karttuvat, dynaamiset)
  • Politiikan tekeminen: mille annetaan PID? millainen = miksi? Rinnakkaiset, versiot? Metatiedot?
  • Yhteinen käyttöpolitiikka/suositus tutkimusaineistoille

Prosessit

  • Kansallinen organisoituminen
  • Politiikan toimeenpano (järjestelmien valinta, sopimukset, koulutus)
  • Elinkaaren hallinta, metatiedot
  • Dynaamiset ja karttuvat aineistot

Järjestelmät

  • Rajapinnat ja skeemat
  • Dynaamiset ja karttuvat aineistot
  • Resolvointi
  • Kuratointi, linkittäminen


Keskustelua

Määritelmät

  • Mitä on aineisto? Miten määritellään aineisto tämän työryhmän kontekstissa?

    • Data tutkimuksen kontekstissa = tutkimusdata + siihen liittyvä metatieto

    • Tutkimustieto tarkoittaa kaikkea tutkimuksessa syntyvää metatietoa

    • Tutkimusaineisto on tutkimuksessa syntyvä aineisto tai lähdemateriaali

      ATT-hankkeen jaottelu: tutkimustuotokset vs. tutkimustieto (Jessican piirtämä kuva)

  • Mikä ero on karttuvalla ja dynaamisella datalla? Dynaaminen data on tietokanta/tutkimusaineisto, joka voi muuttua mistä kohdasta vain, karttuva data kasvaa kumulatiivisesti

  • Pyritään pysymään tutkimushallinnon sanaston mukaisissa määrityksissä, täydennetään sinne PIDien osalta kun on saavutettu selvyys, konsensus: https://sanastot.suomi.fi/concepts/3bdbcac2-e57f-49c1-b104-e37eff042834/concept/37ffc144-7fdd-4f0f-8f4a-3937ae80dbc2


Päätös: Tehdään lista aineisto-/data-määritelmistä ja lisätään siihen esimerkkejä, koska käsitteitä käytetään eri yhteyksissä ja eri organisaatioissa eri tavoin: PID-verkosto (linkkitarkentuu)



Rajaukset

  • Puhutaanko a) aineistoista, b) julkaisuista, c) linkitetystä tiedosta, vai d) em. yhdistelmästä/yhdistelmistä?

    • Kapeassakin määritelmässä riittävästi työtä, voidaan tarvittaessa myöhemmin laajentaa
    • Mikä on pienin yhteinen nimittäjä tavoitteelle tunnistaa se mikä on meille tärkeää?
    • PIDine primäärifunktio: tutkimuksen toistettavuuden (arvioimisen) ja viittattavuuden tukeminen, mahdollistaminen (tutkimuseettinen motivaatio)

    • Entä löydettävyys?

    • Toisaalta tunnisteellisyys ei yksin riitä tutkimuksen toistettavuuteen

    • Metadataan viittaaminen sinällään: järjestelmät jakavat metadataa toisilleen ja hyödyntävät sitä, tarvitseeko metadata omia tunnisteita? ATT:n metatietomallissa oli eri ID metatiedoille ja datalle, mutta oli tutkijoille hankala asia hahmottaa > Fairdata palveluissa päädytty yhteen tunnisteeseen, joka johtaa kuvailusivulle, järjestelmässä lisäksi sisäisiä tunnisteita “piilotettuna”, jokainen aineistoversio saa uuden tunnisteen, mutta metatiedot eivät

    • Jos muuttuneille metatiedoille annetaan uusi tunniste, mastermetatieto pitää olla selkeästi tunnistettavissa, löydettävissä

  • Voiko aineistoa jakaa (onko se sensitiivistä ja/tai henkilötietoja sisältävää) ei liity luotettavuuden ja viitattavuuden vaatimuksiin: objekti pitää olla tunnistettavissa, voiko siihen resolvoida suoraan, on erillinen kysymys (hankalaa muutenkin kuin sensitiivisyyden, tietoturvan, tietosuojan näkökulmasta)


Päätös: Fokusoidaan työryhmän työ tutkimusaineistojen tunnisteisiin ja niiden linkittämiseen julkaisuihin jne.



Strategiasta ja linjauksista

  • Tutkimusdatan kansallisen strategian valmistelu on lähtemässä käyntiin, mitä tunnisteisiin liittyviä asioita kannattaisi noteerata strategiassa?

    • yksi PID ei voi sopia kaikille, kaikkiin käyttötarpeisiin

    • tunnistejärjestelmien elinkaari ja migraatiotarpeet pitää ottaa kaikessa toiminnassa huomioon, pysyvyyden tavoitteesta huolimatta

    • PID-järjestelmien laatuvaatimukset vs. käyttäjien velvollisuudet

  • Referenssidokumentteja: DataCiten ohjeet, RDA:n suositus, suomalainen tiekartta



Toimenpiteet



  • Työryhmän eDuuni-wikiin kootaan perustietoa, esim referenssidokumentteja. Kootaan aluksi etusivulle.
  • PID-verkoston wikiin tehdään sanastoa
  • Organisaatioita pyydetään päivittämään tietoja omista pysyvistä tunnisteistaan PID-verkoston wikiin
  • Pyydetään ehdotuksia työpajoiksi TUHA-päivään 9.4.  ja mahdollisesti PID-verkostotapaamiseen. Kootaan eDuuni-wikiin

Taustamateriaali:

Koottuja ajatuksia pysyvistä tunnisteista organisaatioissa.
https://docs.google.com/document/d/1zT0440WBSbEuT-0NTGfvpqEYeDS7x92jQZg3Wrgl-y8/edit?usp=sharing

  • No labels