Opetus- ja kulttuuriministeriö (OKM) asetti 24.8.2022 tieteellisen laskennan ja datanhallinnan yhteistyöfoorumin (Yhteistyöfoorumi) kolmivuotiskaudelle 2022-2024. Yhteistyöfoorumin tärkein tehtävä toimikaudella on ohjata tieteellisen datan koko elinkaaren aikaisen hallinnan viitearkkitehtuurin laatimista (https://okm.fi/hanke?tunnus=OKM020:00/2022). 

Tämä tutkimuksen datanhallinnan viitearkkitehtuuri on laadittu Yhteistyöfoorumin alla toimineessa arkkitehtuuriryhmässä ja sen alaisissa työryhmissä vuosina 2023–2024, Viitearkkitehtuuri hyväksyttiin Yhteistyöfoorumin kokouksessa 11.12.2024. 

Tutkimuksen datanhallinnan viitearkkitehtuurin tavoitteet

Viitearkkitehtuurin tavoite on tutkimuksen digitaalisen transformaation tukeminen. Tarkoitus on edistää palvelujen kehitystä ja laatua sekä ehdottaa linjauksia ja toimenpiteitä, jotka parantavat yhteentoimivuutta. Tutkimuksen datan hallinnan kuvaaminen edistää sekä kansallisten investointien vaikuttavuutta että eurooppalaista yhteistyötä tutkimusdatan hyödyntämisessä. Viitearkkitehtuuri varmistaa yhteentoimivuuden korkeakoulujen ja tutkimuslaitosten arkkitehtuurien ja kansallisten keskeisten strategioiden kanssa. Lisäksi, koska tutkimusdatanhallinta on osa kansainvälistä tutkimusyhteistyötä, arkkitehtuurin on oltava linjassa kansainvälisten standardien ja parhaiden käytäntöjen kanssa. Kansainväliseen yhteentoimivuuteen on keskityttävä erityisesti viitearkkitehtuurin toimeenpanovaiheessa.

Tutkimusdatanhallinnan viitearkkitehtuuri on suosittava dokumentti. Se toimii työkaluna organisaatioille, jotka pyrkivät kehittämään omaa toimintaansa tutkimusdatan tehokkaassa ja kestävässä hallinnoinnissa. Viitearkkitehtuuri tarjoaa yhtenäisen lähestymistavan tutkimusdatan hallinnan suunnitteluun, toteutukseen ja ylläpitoon, huomioiden ekä tekniset että hallinnolliset näkökohdat. Sen tarkoituksena on varmistaa, että tutkimusdataa käsitellään luotettavasti, turvallisesti ja läpinäkyvästi koko tutkimusdatan elinkaaren ajan. Viitearkkitehtuuri määrittelee perusperiaatteet, kuten datan säilyttäminen, metadatan hallinta, tietosuoja, tietoturva ja käyttöoikeudet, jotka auttavat organisaatioita vastaamaan kasvaviin vaatimuksiin tutkimusdatan hallinnassa. Organisaation perustehtävistä riippuen eri organisaatiot voivat tunnistaa arkkitehtuurin avulla strategisia tavoitteita sekä soveltaa viitearkkitehtuuria oman toimintansa kehittämiseen. Esimerkiksi korkeakouluilla ja tutkimuslaitoksilla on erilaiset perustehtävät. Vaikka viitearkkitehtuuri on suunnattu tutkimusdatan hallintaan, voidaan sitä soveltaa myös esimerkiksi viranomaisdatan hallintaan tutkimuslaitoksissa ja muun kehittämistoiminnasta syntyneen datan hallintaan korkeakouluissa. 

Tutkimuksen datanhallinnan tavoitetila

Viitearkkitehtuuri ohjaa tutkimusdatanhallinnan prosessien standardointia ja optimointia, mikä helpottaa datan jakamista ja yhteistyötä eri tutkimusyhteisöjen ja toimijoiden välillä. Tämä on erityisen tärkeää monialaisten ja kansainvälisten tutkimushankkeiden kohdalla, joissa datan johdonmukainen hallinta on keskeistä tutkimuksen laadun ja luotettavuuden varmistamiseksi. Viitearkkitehtuuri tukee datan avoimuutta, löydettävyyttä, saavutettavuutta ja uudelleenkäytettävyyttä (FAIR-periaatteet).

Viitearkkitehtuurityössä korostetaan erityisesti tutkijakeskeisyyttä ja yhteentoimivuutta. Tutkijakeskeisyys korostaa tutkijoiden näkökulmaa tutkimusdatan elinkaaren kaikissa vaiheissa. Yhteentoimivuus puolestaan tehostaa prosesseja ja palveluiden kehittämistä. Tavoitteena on tutkimusdatan mahdollisimman laaja (uudelleen)käyttö. Tavoitteen saavuttaminen edellyttää yhteentoimivuuden parantamista sekä datan arvon arvioimista. Näihin tarvitaan työvälineitä, joita viitearkkitehtuuri tarjoaa. Tutkimusdatan hallinnan arkkitehtuuri edellyttää yhteensopivuutta korkeakoulujen, tutkimuslaitosten ja kansallisten sekä kansainvälisten järjestelmien välillä. Eri organisaatioiden erilaiset tietojärjestelmät ja toimintakäytännöt voivat kuitenkin vaikeuttaa yhteentoimivuutta. Ongelman ratkaisemiseksi viitearkkitehtuurissa korostetaan yhteentoimiviin prosesseihin ja käyntäntöihin pyrkimistä. 

Viitearkkitehtuurin pohjana on käytetty useita strategioita, jotka ohjaavat tutkimuksen datanhallintaa. Viitearkkitehtuurityössä todettiin, että ei ole olemassa kokoavaa dokumenttia, jonka pohjalta voitaisiin tunnistaa kansalliset tavoitteet tai vaatimukset tutkimusdatan hallinnalle. Tähän haasteeseen viitearkkitehtuuri vastaa esittämällä tutkimuksen datanhallinnan vision ja toiminnallisen tavoitetilan vuodelle 2030. Toiminnalliseen tavoitetilaan liitettiin strategisia tavoitteita, jotka ohjasivat viitearkkitehtuurin rakentumista. Strategista työtä on kuitenkin jatkettava myös viitearkkitehtuurin valmistumisen jälkeen, ja yhtenä toimenpide-ehdotuksena esitetäänkin kansallisen tutkimusdatastrategian laatimista.

Viitearkkitehtuurin toimeenpano ja ylläpito

Tämä on tutkimuksen datanhallinnan viitearkkitehtuurin ensimmäinen versio. Jatkossa viitearkkitehtuuria ylläpidetään sen hallintamallin mukaisesti.

Viitearkkitehtuurin toteuttaminen vaatii investointeja infrastruktuuriin, palveluihin ja osaamiseen. Jatkuvan rahoituksen turvaaminen sekä kustannusten jakautuminen voi olla haastavaa, varsinkin kun kysymyksessä on pitkäaikainen kehitystyö. Viitearkkitehtuurissa kuvataan tavoitetila eikä siinä oteta kantaa rahoituksen tai ohjauksen järjestämiseen. Toteutusvaiheessa näihin on kuitenkin kiinnitettävä erityistä huomiota. 

Yhtenä haasteena nähdään tutkijoiden ja tutkimusorganisaatioiden toisistaan hieman eroavat lähtökohdat datanhallinnassa. Tutkimuksen edistämisen lisäksi tutkimusorganisaatioille on keskeistä noudattaa lakeja ja sääntelyä sekä siten minimoida organisaatiotason riskejä. Tällöin voidaan päätyä tutkimuksen tekemistä rajoittaviin tulkintoihin. Tutkijat puolestaan pyrkivät varmistamaan tutkimuksen käytännön etenemisen mahdollisimman sujuvasti sekä sen, että tutkimusdata säilyy tutkijoiden omassa käytössä. 

Yksi keskeinen viitearkkitehtuurissa asetettu tavoite on, että lainsäädäntö ja sen tulkinta vahvistavat erilaisten aineistojen käyttöä tutkimuksessa ja tutkimusdatan uudelleenkäyttöä sekä aineistojen saavutettavuutta ja saatavuutta. Tutkimusdatan käytöstä ja jakamisesta annetun lainsäädännön liian tiukka tulkinta ja soveltaminen voivat rajoittaa arkkitehtuurin täysimääräistä käyttöä. Lainsäädännön olisi tuettava datan uudelleenkäyttöä ja saavutettavuutta, mutta esimerkiksi tietosuoja-asetusten tai käyttöoikeuksien tulkinta voi aiheuttaa ristiriitoja ja epävarmuutta. Tähän on voitava kansallisesti vaikuttaa tutkimusta edistävästi. Sääntelyn tulee tukea dataintensiivista tutkimusta ja datan arvonmäärittelyä.

Tutkimuksessa käytetään ja tuotetaan hyvin erityyppisiä datoja. Viitearkkitehtuuri tunnistaa palveluiden kehittämisen erilaisille tutkimusdatoille sopivaksi. Viitearkkitehtuurissa tunnistetaan tarve jatkaa työtä edelleen: Kansallisesti on sovittava, miten varmistetaan soveltuvat palvelut erityyppisille datoille (mm. arkaluonteinen data, tekijänoikeuden alainen data) ja suurille datamassoille ja miten palvelut rahoitetaan. Esimerkiksi suurten datamassojen pitkäaikaistallennus edellyttää infrastruktuuria ja resursseja, jotka on huomioitava viitearkkitehtuurin toteuttamisessa. Tarvittaessa viitearkkitehtuuria tulee päivittää näiltä osin.

Viitearkkitehtuurityön aikana tekoälyn merkitys tutkimuksessa kasvoi. Tekoäly muuttaa parhaillaan datan tuotannon ja käytön kontekstia ja käytäntöjä. Sillä on vaikutuksia tutkimusdatan elinkaaren kaikissa vaiheissa. Tekoälypolitiikkoja ja periaatteita kehitetään jatkuvasti. Tutkimukseen ja tutkimusdatanhallintaan liittyen periaatteiden ja linjausten on katettava lainsäädäntö, (tutkimus)etiikka, tietosuojan ja myös mahdollistavat näkökulmat (miten dataa kannattaa kuratoida ja valmistella tekoälyn lisäarvon maksimoimiseksi, mitä palveluja tunnisteaan, mitä tunnistetaan puuttuvan). Tekoälyyn liittyvä datan hallinnan kehitys tuo uusia vaatimuksia, kuten datan kuratointi ja valmistelu tekoälykäyttöön sekä tutkitun tiedon luotettavuuden varmistaminen tekoäluajassa. Jatkuvasti kehittyvät tarpeet voivat edellyttää nopeita päivityksiä arkkitehtuuriin, mikä vaatii resursseja ja yhteistyötä eri sidosryhmien kanssa. Viitearkkitehtuuria ehdotetaankin päivitettäväksi erityisesti tekoälyyn liittyvien artefaktien osalta melko nopeasti. 

Yllä esitettyjen haasteiden ratkaiseminen edellyttää suunnitelmallista yhteistyötä, rahoituksen varmistamista sekä kykyä mukautua uusiin teknologisiin ja lainsäädännöllisiin muutoksiin. Yhteistyöfoorumi ottaa näihin kantaa tarkemmin toimenpide-ehdotuksissa ja -suosituksissa sekä kehittämispaketeissa: https://wiki.eduuni.fi/x/E81XFQ


Laajuus ja rajaukset

Arkkitehtuurissa kuvataan periaatteellinen taso (ohjaavat strategiat, lait, kyvykkyydet ja sidosarkkitehtuurit), liiketoiminta-arkkitehtuurissa toimijat, roolit ja niiden vuorovaikutussuhteet sekä liiketoimintapalvelut ja tutkimusdatanhallinnan prosessi. Tietoarkkitehtuurissa kuvataan keskeiset käytettävät käsitteet ja ehdotetaan käsitteiden tarkempaa määrittelyä käytettyihin sanastoihin.

Kansallinen tutkimuksen datan hallinnan viitearkkitehtuuri (DAHA) muodostaa kokonaisuuden Tieteellisen laskennan viiterkkitehtuurin (TiLa) ja Avoimen tieteen ja tutkimuksen viitearkkitehtuurin (AVOTT) kanssa. Eri viitearkkitehtuurien yhteentoimivuuteen on kiinnitetty erityistä huomiota, ja DAHAan on tuotu osioita muista viitearkkitehtuureista. Viitearkkitehtuurien kokonaisuus ohjaa tutkimuksen digitaalista transformaatiota kansallisesti. Kokonaisuutta hyödynnetään myös CSC:n investointien suunnittelussa. 

Viitearkkitehtuuri mahdollistaa semanttisen yhteentoimivuuden tutkimuksen datanhallinnassa. Viitearkkitehtuurityössä on hyödynnetty keskeisiä tutkimuksen sanastoja. Lisäksi sanastoihin ehdotetaan lisättävän eräitä datanhallinnan kannalta keskeisiä käsitteitä (4 Tietoarkkitehtuuri).

Viitearkkitehtuurityössä tehtiin rajaus, jonka perusteella arkkitehtuurimenetelmällä kuvataan vain tutkimusdatan hallintaan liittyvä(t) prosessi(t) sekä tunnistetaan siihen suoraan liittyvät tiedot, prosessit ja toimijat. Viitearkkitehtuurissa ei kuvata tarkemmin tutkimusdatanhallintaan kytkeytyviä muita tiedonhallintaprosesseja tai linkittyvien tietojen hallintaa (esim. projektinhallintajärjestelmät, tutkimustietojärjestelmät, tutkimustietovaranto). Viitearkkitehtuuria sovellettaessa on tärkeä tunnistaa arkkitehtuurin liittymäpinnat mm. tiedonhallintamalleihin ja niiden mukaan tapahtuvaan tutkimustoiminnan asianhallintaan (mm. projektisuunnitelmat, sopimukset).

Viitearkkitehtuurin laatimisen aikana on projektisuunnitelmasta poikettu muun muassa seuraavissa: 

  • Arkkitehtuurimenetelmällä kuvataan vain tutkimusdatan hallintaan suoraan liittyvät kokonaisuudet sekä tunnistetaan tutkimusdatan hallintaan liittyviä tietoja, prosesseja ja toimijoita. Arkkitehtuurimenetelmällä ei kuvata tarkemmin tutkimusdatanhallintaan linkittyviä prosesseja tai linkittyvien tietojen hallintaa, kuten tutkimussuunnitelma, rahoitussuunnitelma, tietojen siirtyminen tutkimustietovarantoon.
  • Kaikkia toimijoiden vuorovaikutussuhteita ei ole kuvattu, vaan on keskitytty pääasiassa ohjaukseen ja rahoitukseen liittyviin vuorovaikutussuhteisiin.
  • Viitearkkitehtuurissa ei ole kuvattu suurten datamassojen pitkäaikaistallennuksen infrastruktuuria eikä sille vaadittavan pitkän aikavälin rahoituksen suunnitelman. Työ  liittyy kansallisen pitkäaikaissilytyksen (Fairdata PAS) palvelun kehitykseen, jolla on oma ohjausmekanisminsa. Viitearkkitehtuurissa todetaan, että kaikkien palveluiden rahoitus on suunniteltava jatkossa. Miten keskitettyjen palveluiden kustannukset katetaan: jyvitetäänkö kustannukset organisaatioille tai tutkimusryhmille vai kustannetaanko ne kansallisin varoin?

Rajauksista tarkemmin: https://wiki.eduuni.fi/x/HpF7HQ

Toteuttaminen

Viitearkkitehtuurin toteuttaminen edellyttää tiivistä yhteistyötä kansallisella ja paikallisella tasolla siten, että myös kansainväliset kehityskulut huomioidaan. Viitearkkitehtuurissa esitetään tätä varten toimenpiteitä. Toimenpiteiden näkökulma on vahvasti kansallinen.

Viitearkkitehtuurityön tueksi laaditaan toteuttamista tukevia ja viestinnällistä materiaalia. Arkkitehtuurin toteuttamisessa hyödynnettäviä päivittyviä materiaaleja kootaan arkkitehtuurin wiki-alueelle: https://wiki.eduuni.fi/x/yELjHw. Nämä eivät ole osa hyväksyttävää arkkitehtuuria. Organisaatiot ja toimijat eri rooleissa voivat hyödyntää materiaaleja vapaasti siten kuin ne hyödyttävät kutakin organisaatiota ja toimijaa. Wikiin voi myös lisätä organisaatioiden omia materiaaleja muille tutustuttavaksi (benchmarkkaus).


 

 


 

 




  • No labels