Toinen kokous 6.2. 2019 kello 10- 11.30 Adobe Connect.
Läsnäolijat:
Jussi-Pekka Hakkarainen / Kansalliskirjasto
Olli Peltola/Nuorten tiedeakatemia
Tuomas J. Alaterä / Tietoarkisto
Miikka Haimila / Museovirasto
Harri Kiiskinen / Institutum Romanum Finlandiae sr.
Heidi Laine / CSC
Tiina Sipola/OY
Leenakaija Lehto /HAMK
Tuula Pääkkönen /Kansalliskirjasto
O-P Kaurahalme / TY
Tero Aalto / CSC
Päivi Kanerva / TY
Nina-Mari Salminen / Luke
Kaisa Silander / THL
Jessica Parland-von Essen /CSC
.
Tulevia tapaamisia
OpenAIRE 12.3.
TUHA-tapaaminen ja työpaja 9.4.
Avoimen tieteen kevätpäivät 14.-15.5
Kansallisen PID-verkoston tapaaminen?
Tiedeinstituuttien avoin tutkimusdata -hankkeen seminaari Roomassa vkolla 24, teemana tutkimusaineistojen käyttöoikeudet kansainvälisissä tutkimushankkeissa
EOSC-hub week 2019, Praha 10-12 Huhtikuu
Research Data Alliance 13th Plenary Meeting, Philadelphia 2.-4.4.2019, side events 31.3.-1.4.2019 (ohjelma: https://www.rd-alliance.org/plenaries/rda-thirteenth-plenary-meeting-philadelphia/rda-13th-plenary-program)
Esitettyjä toiveita ja tarpeita.
Osaaminen
- Erilaiset sisäiset ja ulkoiset tunnisteet (UUID, Cool URI, DOI, URN, INSPIRE ID jne)
- Erilaiset aineistot (rakenne, karttuvat, dynaamiset)
- Politiikan tekeminen: mille annetaan PID? millainen = miksi? Rinnakkaiset, versiot? Metatiedot?
- Yhteinen käyttöpolitiikka/suositus tutkimusaineistoille
Prosessit
- Kansallinen organisoituminen
- Politiikan toimeenpano (järjestelmien valinta, sopimukset, koulutus)
- Elinkaaren hallinta, metatiedot
- Dynaamiset ja karttuvat aineistot
Järjestelmät
- Rajapinnat ja skeemat
- Dynaamiset ja karttuvat aineistot
- Resolvointi
- Kuratointi, linkittäminen
Keskustelua
Määritelmät
Mitä on aineisto? Miten määritellään aineisto tämän työryhmän kontekstissa?
Data tutkimuksen kontekstissa = tutkimusdata + siihen liittyvä metatieto
Tutkimustieto tarkoittaa kaikkea tutkimuksessa syntyvää metatietoa
Tutkimusaineisto on tutkimuksessa syntyvä aineisto tai lähdemateriaali
ATT-hankkeen jaottelu: tutkimustuotokset vs. tutkimustieto (Jessican piirtämä kuva)
Mikä ero on karttuvalla ja dynaamisella datalla? Dynaaminen data on tietokanta/tutkimusaineisto, joka voi muuttua mistä kohdasta vain, karttuva data kasvaa kumulatiivisesti
Pyritään pysymään tutkimushallinnon sanaston mukaisissa määrityksissä, täydennetään sinne PIDien osalta kun on saavutettu selvyys, konsensus: https://sanastot.suomi.fi/concepts/3bdbcac2-e57f-49c1-b104-e37eff042834/concept/37ffc144-7fdd-4f0f-8f4a-3937ae80dbc2
Päätös: Tehdään lista aineisto-/data-määritelmistä ja lisätään siihen esimerkkejä, koska käsitteitä käytetään eri yhteyksissä ja eri organisaatioissa eri tavoin: PID-verkosto (linkkitarkentuu)
Rajaukset
Puhutaanko a) aineistoista, b) julkaisuista, c) linkitetystä tiedosta, vai d) em. yhdistelmästä/yhdistelmistä?
- Kapeassakin määritelmässä riittävästi työtä, voidaan tarvittaessa myöhemmin laajentaa
- Mikä on pienin yhteinen nimittäjä tavoitteelle tunnistaa se mikä on meille tärkeää?
PIDine primäärifunktio: tutkimuksen toistettavuuden (arvioimisen) ja viittattavuuden tukeminen, mahdollistaminen (tutkimuseettinen motivaatio)
Entä löydettävyys?
Toisaalta tunnisteellisyys ei yksin riitä tutkimuksen toistettavuuteen
Metadataan viittaaminen sinällään: järjestelmät jakavat metadataa toisilleen ja hyödyntävät sitä, tarvitseeko metadata omia tunnisteita? ATT:n metatietomallissa oli eri ID metatiedoille ja datalle, mutta oli tutkijoille hankala asia hahmottaa > Fairdata palveluissa päädytty yhteen tunnisteeseen, joka johtaa kuvailusivulle, järjestelmässä lisäksi sisäisiä tunnisteita “piilotettuna”, jokainen aineistoversio saa uuden tunnisteen, mutta metatiedot eivät
Jos muuttuneille metatiedoille annetaan uusi tunniste, mastermetatieto pitää olla selkeästi tunnistettavissa, löydettävissä
- Voiko aineistoa jakaa (onko se sensitiivistä ja/tai henkilötietoja sisältävää) ei liity luotettavuuden ja viitattavuuden vaatimuksiin: objekti pitää olla tunnistettavissa, voiko siihen resolvoida suoraan, on erillinen kysymys (hankalaa muutenkin kuin sensitiivisyyden, tietoturvan, tietosuojan näkökulmasta)
Päätös: Fokusoidaan työryhmän työ tutkimusaineistojen tunnisteisiin ja niiden linkittämiseen julkaisuihin jne.
Strategiasta ja linjauksista
Tutkimusdatan kansallisen strategian valmistelu on lähtemässä käyntiin, mitä tunnisteisiin liittyviä asioita kannattaisi noteerata strategiassa?
yksi PID ei voi sopia kaikille, kaikkiin käyttötarpeisiin
tunnistejärjestelmien elinkaari ja migraatiotarpeet pitää ottaa kaikessa toiminnassa huomioon, pysyvyyden tavoitteesta huolimatta
PID-järjestelmien laatuvaatimukset vs. käyttäjien velvollisuudet
Referenssidokumentteja: DataCiten ohjeet, RDA:n suositus, suomalainen tiekartta
Toimenpiteet
- Työryhmän eDuuni-wikiin kootaan perustietoa, esim referenssidokumentteja. Kootaan aluksi etusivulle.
- PID-verkoston wikiin tehdään sanastoa
- Organisaatioita pyydetään päivittämään tietoja omista pysyvistä tunnisteistaan PID-verkoston wikiin
- Pyydetään ehdotuksia työpajoiksi TUHA-päivään 9.4. ja mahdollisesti PID-verkostotapaamiseen. Kootaan eDuuni-wikiin.
Taustamateriaali:
Koottuja ajatuksia pysyvistä tunnisteista organisaatioissa.
https://docs.google.com/document/d/1zT0440WBSbEuT-0NTGfvpqEYeDS7x92jQZg3Wrgl-y8/edit?usp=sharing