Toimenpide-ehdotukset ja suositukset kuvavat yleisen suunnitelman tutkimuksen datanhallinnan haasteisiin vastaamiseen sekä tavoitteiden saavuttamiseksi. Toimenpide-ehdotusten tarkoituksena on selkeyttää tutkimuksen datanhallinnan kokonaisuuteen liittyviä laajoja tehtäväkokonaisuuksia, joiden toteuttaminen auttaa viitearkkitehtuurissa esitetyn vision ja toiminnallisen tavoitetilan saavuttamista. Toimenpide-ehdotuksiin on tunnistettu kansallisessa yhteistyössä toteutettavia kokonaisuuksia, jotka edistävät tutkimuksen datanhallintaa.
Toimenpide-ehdotukset ja suositukset perustuvat nykytilan analyysiin (tutkimuksen datanhallinnan haasteet), Visioon ja tavoitetilaan 2030 (toiminnallinen tavoitetila, strategiset tavoitteet) sekä viitearkkitehtuurin laatimisen yhteydessä nousseisiin tarpeisiin.
- Nykytilan analyysi: https://wiki.eduuni.fi/x/kAooF
- Visio ja tavoitetila 2030: https://wiki.eduuni.fi/x/upCOGg
Toimenpide-ehdotusten lisäksi tutkimuksen datanhallinnan viitearkkitehtuurissa on esitetty yksityiskohtaisempia kehittämisvaatimuksia sekä kyvykkyyksiä ja palveluita, jotka osaltaan ohjaavat toimia tavoitetilaan pääsemiseksi. Kehittämisvaatimukset kuvaavat yksityiskohtaisemmin asioita, joita tulee kehittää suunnitelmallisesti ja systemaattisesti viitearkkitehtuurin ohjaamana, jotta arkkitehtuurin kuvaamaan tavoitetilaan päästään. Kyvykkyydellä tarkoitetaan joukkoa ominaisuuksia suoriutua jonkin asian tekemisestä. Viitearkkitehtuurissa on määritelty tutkimuksen datanhallinnan kannalta keskeiset palvelut.
- Kehittämisvaatimukset: https://wiki.eduuni.fi/x/kAooF
- Kyvykkyydet: https://wiki.eduuni.fi/x/rpF7HQ
- Palvelut: https://wiki.eduuni.fi/x/HZJ7HQ
5.1 Strateginen johtaminen
5.1.1 Määritellään Suomeen datastrategia, joka tukee TKI-toimintaa
Tämä viitearkkitehtuuri pohjaa useisiin erilaisiin tutkimuksen strategoita. Ei kuitenkaan ole olemassa kokoavaa linjausta, jonka pohjalta voitaisiin tunnistaa tavoitteet tai vaatimukset tutkimusdatan hallinnalle tai datan arvonmääritykselle TKI-toiminnan näkökulmasta. Tutkimusorganisaatioilla ja tutkijoilla voi nähdä olevan osin erilaiset painotukset tutkimuksen datanhallinnan tavoitteissa: tutkijoilla painottuu käytännön tutkimustyön sujuvuus ja meritoivuus, tutkimusorganisaatiolla painottuu lisäksi vaatimustenmukaisuus (compliance).
Laaditaan Suomeen kansallinen datastrategia. Tällaisen strategian tulisi kytkeytyä sekä nykyisiin digitranformaatiopyrkimyksiin (Digikompassi) että yhteisiin datan ja digitalisaation palveluihin. Datastrategian laatimisen voi käynnistää valtioneuvosto.
5.1.2 Johdetaan tutkimusdatanhallintaa vaikuttavuusperusteisesti
Suomessa on panostettu tutkimusdatanhallintaan järjestelmällisesti jo parikymmentä vuotta. Kansainvälisesti vertailtuna tutkimusdatanhallinnan kyvykkyytemme ovat erinomaisella tasolla. Nykytilassa ei voida kuitenkaan seurata, mitä osaa Suomessa syntyvästä tutkimusdatasta palvelut palvelevat ja miten palveluiden lanseeraus tai resursointi on palvellut uusia käyttäjiä tai uutta dataa. Panostukset tutkimusdatanhallintaan ja hallinnan tukeen tulee kohdentaa tarkoituksenmukaisesti siten, että ne tosiasiallisesti kasvattavat tutkijoiden kyvykkyyttä toteuttaa tutkimusdatanhallintaa. Tähän liittyy myös tarkastelu siitä, miten tutkimusdatanhallinnan palvelut tukevat erilaista tutkimusta ja erilaisia tutkijoita.
Kehitetään palveluiden saatavuuden ja hyödyntämisen tietopohjaa tutkimuksen datanhallintaan liittyvien toimien ja palveluiden vaikuttavuuden arvioimiseksi. Huomioidaan erilaisten palveluiden kustannusrakenne ja kannattavuus. Palvelujen tarjoajien kesken sovitaan uudenlaisesta kehittämisen toimintamallista, jota vaikuttavuusperusteinen strateginen kehittäminen edellyttää. Jaetaan tietoon perustuvat parhaat käytännöt ja hyödynnetään kyvykkyyksiä eri tasoilla: kansainvälinen, kansallinen, paikallinen (organisaatiokohtainen). .Johtamiseen sisältyy myös yhteentoimivuuden kokonaisuuden koordinointi ja seurannan varmistaminen.
5.1.3 Kehitetään säädöspohjaa tukemaan tutkimusdatan hallintaa ja hyödyntämistä
Nykyinen kansallinen säädöspohja ja sen tulkinta tulee arvioida kokonaisuutena tutkimuksen edistämisen näkökulmasta. Tutkimusdatanhallintaan liittyvät nykyiset lait ja säädökset tulee tarvittaessa päivittää arvioinnin perusteella (Tekijänoikeuslaki, Laki sosiaali- ja terveystietojen toissijaisesta käytöstä (toisiolaki), Laki tilastokeskuksesta ja Tilastolaki, Laki oikeudesta korkeakouluissa tehtäviin keksintöihin (korkeakoulukeksintölaki), erillislait koskien tutkimuslaitoksia, EU-datalainsäädännön kansallinen toimeenpano).
Perustetaan hallitusohjelman mukainen tutkimuslainsäädäntöneuvosto. Pyritään kansallisesti yhtenäisiin tulkintakäytäntöhin organisoimalla kansallinen yhteistyö. Tulkinnan lähtökohtana on tutkimuksen mahdollistaminen vastuullisesti.
5.1.4 Tunnistetaan datanhallintaan liittyvät uudet mahdollisuudet ja uhat
Tekoäly muuttaa parhaillaan datan tuotannon ja käytön kontekstia ja käytäntöjä. Sillä on vaikutuksia tutkimusdatan elinkaaren kaikissa vaiheissa. Tekoälystä ja kielimalleista on tullut osa tutkimusinfrastruktuuriamme.
Viitearkkitehtuurin seuraavassa päivityksessä on syytä huomioida erityisesti generatiivisen tekoälyn kehittyvä rooli tutkimusprosessissa ja hyödyntää sen mahdollisuudet tutkimusdatan hallinnan palveluissa. Tekoälyä voidaan hyödyntää vastuullisesti esimerkiksi tutkimustuotosten tunnistamisessa, linkittämisessä ja metatietojen luomisessa. Myös kvanttilaskennan mahdollisuudet tulee huomioida, sillä sen potentiaaliset sovellutukset ovat laajavaikutteisia.
Tutkimuksen ja ja tutkimusdatanhallinnan digitalisoituminen etenee ja tekniset ratkaisut kehittyvät. Samanaikaisesti globaalin turvallisuustilanteen muutokset haastavat vastuullisen kansainvälisyyden. Näiden teknisten ratkaisujen tieto- ja kyberturvallisuus on keskeinen osa digitaalisen tutkimuksen turvallisuuden kokonaisuutta sekä tutkimuksen datanhallintaa. Turvallisuus näkökulmien huomioiminen on keskeistä sähköisen ja verkottuneen toimintaympäristön turvallisuuden varmistamisessa. Datanhallinnan ympäristövaikutuksiin on syytä kiinnittää huomioita ja rakentaa datanhallinnan tavoitteet ja käytännöt kestäviksi myös ympäristönäkökulmasta.
Suositellaan viitearkkitehtuuria päivitettäväksi tarpeen mukaan pikaisestikin tekoälyä, kvanttilaskentaa ja kyberuhkia koskevin osin. Tunnistetaan taho, joka seuraa uusia uhkia ja mahdollisuuksia (mm. hybridi- ja kyberuhat, tekoälyn kehittyminen, datanhallinnan ympäristövaikutukset), jotka vaikuttavat mahdollisuuksiin hallita ja hyödyntää dataa. Tekoälyn vastuullisesta käytöstä tutkimuksessa ja tutkimuksen datanhallinnassa pystytään sanomaan enemmän TENKin annettua ohjeistuksensa tekoälyn eettisestä käytöstä tutkimuksessa.
5.1.5 Löydetään keinoja yritysyhteistyössä tapahtuvan dataperusteisen TKI-toiminnan edellytyksien vahvistamiseen
Tutkimuksen datanhallinnasta keskusteltaessa fokus on usein tutkimusorganisaatioiden toiminnassa. Merkittävä osa TKI-toiminnasta tapahtuu kuitenkin yrityksissä, sekä yritysten ja tutkimusorganisaatioiden yhteistyössä. TKI-toimintaa rahoitetaan hyvin erilaisilla instrumenteilla, joista osa rajaa tuotosten jatkohyödyntämisen mahdollisuuksia.
Tulisi pyrkiä selkeyttämään erilaisten TKI-rahoitusten rahoitusehtoja, erityisesti silloin kun niiden tuella syntyy jatkohyödynnettävää dataa, datainfraa tai kun ne kytkeytyvät yhteisiin data-avaruuksiin. Yritysten mahdollisuuksia hyödyntää tutkimusinfrastruktuureja tulisi tässä yhteydessä edelleen vahvistaa. Esimerkiksi investoinnit tutkimusinfrastruktuureihin tulisi olla mahdollisimman laajasti myös yritysyhteistyönä toteutettavan tutkimuksen käytettävissä. Samoin tutkimusorganisaatiossa käytössä olevia datanhallinnan palveluita tulisi voida hyödyntää myös muulla kuin tutkimusrahoituksella aikaansaatujen TKI-datojen hallinnassa. Tätä varten saatetaan tarvita nykyisistä poikkeavia rahoitus- ja käyttöehtoja tai täysin uudenlaisia rahoitusinstrumentteja.
5.2 Palveluekosysteemin kehittäminen
5.2.1 Varmistetaan palveluekosysteemin yhteentoimivuus kansainvälisestä paikalliseen
Tutkimuksen datanhallinnan tulee tähdätä siihen, että se tukee ja helpottaa tutkijan työtä, eli tutkimusta. Tutkimus on luonteeltaan kansainvälistä, ja sen tukena toimivien palvelujen on mahdollistettava sujuva datanhallinta ja tiedon liikkuvuus yli rajojen. Kattava datanhallinta, joka tukee ja helpottaa tutkijan työtä, on keskeinen osa toimivaa tutkimusekosysteemiä. Palveluekosysteemin tulee mukautua jatkuvasti paikallisiin, kansallisiin että kansainvälisiin kehityssuuntiin.
On seurattava tieteellisen laskennan ja datanhallinnan kansainvälistä kehitystä (mm. EOSC, eurooppalaiset data-avaruudet), jotta pystytään tunnistamaan relevantit yhteyspisteet kansalliseen ja paikalliseen toimintaan. Palveluekosysteemin rakentamisessa tulee huomioida tulevaisuuskestävyys. Tavoitteena on rakentaa kansallinen palvelukokonaisuus ja datanhallinnan toimintamallit, jotka täyttävät kansainväliset yhteentoimivuuden vaatimukset ja standardit sekä mahdollistavat paikallisten palveluiden joustavan ja jatkuvan kehittämisen osaksi laajempia ratkaisuja. Näin varmistetaan, että tutkijat voivat hyödyntää palveluja paikallisesta kansainväliseen, ja että datanhallinta on sujuvaa eri ympäristöissä.
5.2.2 Kehitetään tutkimusdatanhallinnan palveluekosysteemiä tukemaan erityyppisten tutkimusdatojen käsittelyä
Tutkimuksessa käytetään ja tuotetaan hyvin erityyppisiä datoja. Nykyinen tutkimusdatainfrastruktuuri on kuitenkin pitkälti räätälöity staattisille dataseteille. Myös eri mediatyypit (mm. taiteelliset tuotokset) tarvitsevat erilaisia aineistojen näytön, säilytyksen ja käytön palveluita.
Arvioidaan ja kehitetään palveluiden soveltuvuutta eri tutkimusalojen ja erilaisten datojen käsittelyn näkökulmasta. Varmistetaan, että erityyppisille tutkimusdatoille on soveltuvat palvelut. Hyödynnetään tutkimusalaspesifeissä infrastruktuureissa kehitetyt ratkaisut.
Selvitetään kertyvän dynaamisen datan sekä suurten datamassojen säilytykseen liittyviä käyttötapauksia. Kartoitetaan ja toteutetaan palvelut, joita tarvitaan tutkimusdataan liittyvien dynaamisten komponenttien käsittelyyn ja säilyttämiseen (ohjelmistot, mallit, työnkulut). Huomioidaan digitaaliset taiteelliset tuotokset, joita tuotetaan ja käytetään tutkimuksessa sekä varmistetaan niiden säilyttäminen ja käytettävyys. Kehitetään arkaluonteisten aineistojen tutkimuskäytön palveluita edelleen.
Suositellaan, että arkkitehtuurin seuraavassa päivityksessä tulee huomioida erityisesti tutkimuksessa kerättävien ja käytettävien eri tyyppisten datojen erityisvaatimukset.
5.2.3 Hyödynnetään aineistonhallinnan suunnittelun tietoja palveluissa
Tutkijoilta edellytetään yhä useammin aineistonhallintasuunnitelman tekoa tutkimushanketta valmisteltaessa. Suunnitelmaa ei kuitenkaan hyödynnetä täysimääräisesti tutkimuksen teon aikana ja tukena. Tutkijoille suunnattujen datanhallintapalveluiden tulee kyetä hyödyntämään aineistonhallintasuunnitelmia palveluiden resursoinnissa, kohdentamisessa ja kehittämisessä.
Hyödynnetään datanhallintasuunnitelmien sisältämiä aineistotason tietoja palveluiden suunnittelemisessa ja kohdentamisessa tutkijoille ja hankkeille. Tätä varten tulee huolehtia aineistonhallintatiedon oikea-aikaisuudesta, rakenteisuudesta ja koneluettavuudesta. Tavoitteena on, että tukipalvelut voivat käyttää aineistonhallinnan suunnittelussa syntyviä tietoja siihen, että tukipalvelut voivat toimittaa tutkijan tutkimusdatanhallintaan tarvitsemat työvälineet käyttöönsä helposti ja sujuvasti datanhallintasuunnitelmissa olevien rakenteellisten tietojen perusteella.
Varmistetaan yhteistyö toimijoiden välillä (rahoittajat, aineistoja luvittavat toimijat, tutkimusorganisaatiot, palveluiden tarjoajat), jotta datanhallintasuunnitelmista saatava tieto on eri tahojen käytettävissä. Selvitetään eri prosesseissa (eettinen arviointi, tutkimusluvat, IPR-prosessit, oikeuksien hallinta) syntyvän tiedon liittämistä osaksi datanhallinnan suunnittelun prosessia.
Suositellaan, että DMP-konsortio selvittää mahdollisuudet aineistojenhallinnan suunnittelun ja suunnittelupalveluiden kehittämiseen niin, että DMPt tuottavat tarvittavaa tietoa tutkimusdatanhallinnan palveluiden kehittämiseen ja kohdentamiseen tutkijoiden tarpeisiin.
5.3 Osaaminen ja tuki
5.3.1 Luodaan malli, jolla tutkija meritoituu datasta ja hyötyy omista tiedoistaan
Tutkimusdatanhallinta on tutkijan vastuulla ja siten tutkijan ansiota. Kehitetään datanhallintaan ja tutkijan OmaDatan hallintaan palveluita, jotka mahdollistavat tutkijaa koskevien tietojen liikkumisen järjestelmästä toiseen. OmaDatan piiriin tulee koota myös muunlaiset TKI-toiminnasta syntyneet tuotokset kuin varsinainen tutkimusdata.
Tutkijan tietojen liikkuvuus ja hyödyntäminen parantaa datanhallinnan tietopohjan laatua ja helpottaa sitä kautta mm. tutkimusdatan löydettävyyttä ja jatkokäyttöä sekä tutkimusdatasta meritoitumista. Datasta ja datanhallinnasta meritoituminen tulee olla läpinäkyvästi osa tutkijan urapolkujärjestelmiä sekä tutkimuksen vastuullista arviointia. Datanhallinta osoittaa tutkimuksen perusarvojen toteutumista, yhteiskunnallista vaikuttamista ja tutkimuksen edistämistä.
Tavoitteena on kerryttää aktiivisesti tietoja datasta ja sen hyödyntämisestä tutkijoiden ja tutkimusjärjestelmän käyttöön. Tiedejatutkimus.fi-palvelu on mahdollistanut tutkijaprofiilien kokoamisen eri lähteistä kertyistä tiedoista ja profiilien näyttämisen. Suositellaan, että Tutkimushallinnon tietovirrat ja tutkimustietovaranto ohjausryhmä ottaa roolia myös tutkimusdatasta meritoitumisen sekä tutkijan OmaData-tietopohjan suunnittelussa yhteistyössä Yhteistyöfoorumin ja tutkijalähtöisten toimijoiden kanssa. Datasta meritoitumista tulee suunnitella vastuullisen tutkimuksen ja tutkijanarvioinnin kontekstissa.
5.3.2 Huolehditaan, että Suomessa on maailman paras tutkimusdatanhallinnan osaaminen
Suomesta on toistaiseksi puuttunut kokonaan tutkimusdatan hallinnan asiantuntijoiden ammatilliseen pätevöitymiseen tähtäävä koulutus. Tutkimusdatanhallintaan liittyviä menetelmäopintoja on tarjolla vaihtelevasti.
Organisoidaan tutkimusdatan hallinnan osaamisen kehittäminen kansallisesti toiminnan koordinoimiseksi ja kattavuuden varmistamiseksi. Varmistetaan datanhallinnan osaamisen kertyminen korkeakouluopintojen kaikissa vaiheissa, erityisesti osana tutkijakoulutusta. Suositellaan, että tohtoriopintoihin sisällytetään tutkimusdatanhallinnan peruskoulutus. Huolehditaan palvelutuottajien osaamisesta ja valmiudesta tuottaa arkkitehtuurinmukaisia palveluita (esim. FAIR-periaatteiden tukeminen, semanttinen yhteentoimivuus, tunnisteiden hyödytäminen).
Suositellaan, että varmistetaan Tampereen yliopiston Datanhallinnan asiantuntijan koulutushankkeen tuotosten jatkuvuus ja mahdollistetaan tutkimusdatanhallinnan monitieteellinen peruskoulutus tutkijakoulutuksen osaksi kaikkiin korkeakoulujen tohtoriohjelmiin.
5.4 Datan arvo ja löydettävyys
5.4.1 Tunnistetaan ja maksimoidaan tutkimusdatan arvo
Tutkimusaineistot ovat merkittävää kansallinen pääomaa, joka tarjoaa yhteiskunnalle toimintamahdollisuuksia, mutta myös vastuita. Tutkimusaineistojen arvonmääritys tulee tapahtua kunkin tutkimusalan erityispiirteet huomioiden. Samanaikaisesti kansallisille arkistoinnin ja pitkäaikaissäilytyksen palveluilla tulee olla selkeät läpileikkaavat arvonmäärityksen periaatteet.
Laaditaan tarvittavat linjaukset tutkimusdatan arvon määrittämiseksi yhteiskunnassa ja tutkimusyhteisössä tutkimusorganisaatioiden yhteistyönä. Kehitetään prosesseja (pitkäaikaisesti) säilytettävien datojen tunnistamiseksi mahdollisimman aikaisessa tutkimusdatanhallinnan elinkaaren vaiheessa. Samalla huomioidaan, että datan arvo voi löytyä alkuperäisen käyttötarkoituksen ulkopuolelta. Huolellinen datanhallinta varmistaa sen, että datasta saatavaa arvoa ei hukata vaan tuetaan sen hyödyntämistä.
Tunnistetaan ja toteutetaan keinot tutkimuksessa kerätyn ja syntyneen datan mahdollisimman laajaan jatkohyödyntämiseen. Huomioidaan dataan liittyvien komponenttien (lähdekoodi, mallit, työvuot) säilytys, julkaisu ja yhdistettävyys tutkimusdataan, jotta datan jatkohyödyntäminen mahdollistuu. Selvennetään toimijoiden väliset vastuut datan säilyttämisessä ja säilyttämisen rahoittamisessa.
5.4.2 Yhdistetään sujuvasti erilaisia aineistoja tutkimuksen käyttöön
Suomessa on paljon korkealaatuisia rekisteriaineistoja, joita voi käyttää myös tutkimukseen. Rekisteriaineistojen lisäksi myös muut tietovarannot (mm. kulttuuriperintöaineistot, viranomaisaineistot) ovat keskeisiä tutkimukselle. Teknisen ja juridisen yhteentoimivuuden parantaminen eri tietovarantojen välillä tukee erilaisten ja eri lähteistä koottujen aineistojen käyttöä tutkimuksessa.
Rekisteriaineistojen ja muiden tietovarantojen tutkimuskäytön potentiaali ei kuitenkaan toteudu täysimääräisesti, kun niiden yhdisteleminen on työlästä. Tavoitteena onkin eri lähteistä olevien aineistojen entistä sujuvampi ja joustavampi käyttö ja yhdistely tutkimuksessa.
Kehitetään ja otetaan käyttöön palveluita, jossa aineiston yhdistäminen ketterästi on mahdollista. Huomioidaan tämä käyttötapaus, kun kehitetään lainsäädäntöä ja sen tulkintaa tutkimusmyönteisemmäksi. Yhteistyötä tietovirtojen kuvaamiseksi, metatietojen välittämiseksi ja aineistojen yhdistämistä tulevien uusien palveluiden kehittämiseksi tulee tehdä erityisesti julkisomisteisten tutkimuslaitosten kanssa.
5.4.3 Tuodaan arkisto- ja museoaineistot osaksi tutkimuksen datanhallinnan kokonaisuutta
Arkistot ja museot ovat merkittäviä tutkimuksen datainfrastruktuureja. Tähän mennessä muistiorganisaatioiden aineistovarantojen ja aineistopalveluiden kytkentä tutkimuksen palveluihin on kuitenkin ollut heikkoa. Arkisto- ja museoaineistojen roolia tutkimuksessa tulisi tehdä näkyväksi ja aineistovarantojen laajempaa hyödyntämistä monitieteellisessä tutkimuksessa tukea.
Muistiorganisaatioiden aineistojen käyttöpalveluista ja arkistoitujen aineistojen tietovirroista tulisi laatia kuvaus Tutkimusaineistojen avoimuuden asiantuntijaryhmän alle perustetun Arkisto- ja museoaineistojen tietovirrat -työryhmän ja Digime-arkkitehtuurityöryhmän yhteistyössä. Kokonaisuus tulisi kuvata osaksi joko Digitaalisen kulttuuriperinnön viitearkkitehtuuria (päivitystyö käynnissä 2024-2025) tai seuraavaan DAHA-arkkitehtuurin versioon.
