Mitä: Webinaari tutkimustietovarannon tiedon tuottajille organisaatioiden omien infrastruktuurien ja niiden palveluiden määrittelyn tueksi.
Milloin: Perjantaina 29.8.2025 klo 10 - 12
Missä: Zoom-etäkokoushuone: https://cscfi.zoom.us/j/68450800843?pwd=KPvt12aQ8H2HqQB9sJL3fhCqtwvJxM.1 (tarvittaessa meeting ID: 684 5080 0843 passcode: 055498)
Webinaarin esityskalvot: TTV-infratilaisuus-29.8.2025.pptx
Mentin kysymykset ja äänestys: infrawebinaari_29_8_2025_Mentimeter.pdf
Tallenne: https://video.csc.fi/media/t/0_chkveq4k
Kutsu
Tervetuloa tutkimustietovarannon tiedontuottajille perjantaina 29.8. klo 10 - 12 järjestettävään webinaariin organisaatioiden omien infrastruktuurien ja niiden palveluiden määrittelyn tueksi.
Tilaisuudessa esitellään uudistuneen tietomallin mukainen kuvaus infrastruktuureista sekä tavat toimittaa infrastruktuuritietoja tutkimustietovarantoon. Lisäksi keskustellaan mm. infrastruktuurien ja -palveluiden suhteesta muihin tutkimuksen palveluihin sekä palveluiden luokittelusta.
Tilaisuuteen on kutsuttu mm. tutkimustietovarannon tiedontuottajat ja Finn-ARMAn tutkimusinfrastruktuurityöryhmä.
Taustamateriaalia aiheesta:
Tutkimusinfrastruktuurit tutkimustietovarannossa
Aiempien tilaisuuksien materiaaleja:
Tutkimusinfrastruktuurien tietojen tallentaminen JUSTUS-palvelun kautta 4.6.2025
Tutkimusinfrastruktuurien tallentaminen JUSTUS-palvelun kautta 3.2.2025
Ohjelma
- Tutkimusinfrastruktuurit ja TKI-toiminta – määritelmät lyhyesti
- Tutkimusinfrastruktuurit tutkimustietovarannossa – aikataulu
- Tietojen toimittaminen tutkimustietovarantoon – tietomallin kuvaus ja tiedonsiirtoformaatti
- Tutkimusinfrastruktuurit ja -palvelut suhteessa muihin tutkimuksen palveluihin
Muistio keskustelusta
- Joonas Nikkanen esitteli lyhyesti tutkimusinfrastruktuurien ja TKI-toiminnan määritelmiä sekä käyttötapauksia infrastruktuuritiedolle.
- Joonas Nikkanen esitteli tutkimusinfrastruktuuritietojen toimittamista tutkimustietovarantoon.
- Walter Rydman esitteli esimerkkejä olemassa olevista infrastruktuuritiedoista sekä avasi tutkimusinfrastruktuurien ja palveluiden suhdetta.
- Walter Rydman esitteli tutkimusinfrastruktuurien pysyvien tunnisteiden (URN) luomista tutkimustietovarannossa.
- Walter Rydman kuvaili tutkimusinfrastruktuureja verkostoina.
- Walter Rydman kävi läpi tähän mennessä tulleita usein kysyttyjä kysymyksiä.
- Joonas Nikkanen avasi kansainvälisiä kytköksiä aiheeseen liittyen.
- Walter Rydman täydensi, että koska kv-infroja ei ole olemassa tässä mallissa, olemme ratkaisseet asian verkkolinkillä. Suuren kansainvälisen infran Suomen noodi voi lisätä erityisen linkkityypin: kansainvälisen infrastruktuurin osa. Pyritään siihen, että muualla ratkaistaisiin asia samoin.
- Kysymys: Miten malli suhtautuu organisaation sisäisiin osakokonaisuussuhteisiin?
- Organisaatio voi käsitellä omia sisäisiä verkostojaan samalla tavalla kuin useamman organisaation verkostoja. Lisäksi verkoston osa voi liittyä myös jonkin toisen organisaation infrastruktuureihin ja verkostoitua sekä oman että muiden organisaatioiden infrastruktuurien ja/tai palveluiden kanssa.
- Kysymys: Mihin osakokonaisuuden tasoon pysyvän tunnisteen (PID) täytyy viitata?
- Hyvä miettiä käyttötapauksen näkökulmasta. Mikäli koko infrastruktuurikokonaisuus kiinnostaa, on hyvä käydä läpi myös kaikkien osakokonaisuuksien viittaukset (esim. tiedon hyödyntäminen, linkitykset, vaikuttavuusanalyysit). Mutta myös toisinpäin, esimerkiksi julkaisu voidaan kytkeä kattoinfraan tai osakokonaisuuksiin niin tarvittaessa.
- Suurin osa infroista on hierarkistyyppisiä ja jos tuotos liittyy ylempään tasoon niin sitä voidaan tarkastella vaikuttavuusanalyyseillä. Verkoston kautta voidaan näyttää mukana olevat organisaatiot.
- Kommentti: Tietoja kerätään aika niukasti verrattuna joihinkin aikaisempiin EU-tason ajatuksiin verrattuna.
- Pyritään keräämään sellaista tietoa, jota pystytään ylläpitämään ja voidaan tarvittaessa laajentaa tietomallia ja tietosisältöjä. Tietojen päivitettävyys, ylläpidettävyys ja ajantasaisuus on ollut suunnittelussa ajavana tekijänä.
- Kysymys: Biokeskus Suomella on koordinaatiotoimista sekä kuusi eri isäntäorganisaatiota, joissa kussakin on lukuisia noodeja. Mikä olisi oikea tapa ja hyvä järjestys päivittää tietoja?
- Vastuuorganisaatiot toimittavat ja pitävät yllä omia tietojaan, mutta myös Biokeskus Suomen katto-organisaatiotiedon toimittamisesta on hyvä sopia.
- Alatutkimusinfrastruktuurien tietojen säilyttäjät päivittävät tiedot tutkimustietovarantoon, jatkossa automaattisesti, jotta tiedot päivittyvät ja pysyvät ajantasalla.
- Kysymys: Mitä tapahtuu, kun joku instanssi päättää muuttaa infrojensa nimiä/rakenteita eli sama tominta jatkuu eri lailla organisoituna? Esimerkiksi jos kansallisen verkoston toiminta päättyy, mutta osat jäävät vielä toimimaan eri tutkimusorganisaatioissa.
- Tietomallissa on kyky viitata (relaatiot): uusi infra korvaa vanhan, vanhaa on mahdollista katsella, mutta se käy ilmi myös ajantasaisesta infrasta.
- Kyse on ei-hierarkisista kytköksistä, kun jokin korvaa toisen. Kytköksissä on mukana aikadimensio.
- Mikäli vaihdetaan vain infrastruktuurin nimeä, sen pysyvä tunniste (PID) säilyy kuitenkin ennallaan.
- Kysymys: Onko yritysten tarpeet huomioitu?
- On pyritty siihen, että olisi palvelukuvaus tai tietosisältö, joka auttaa myös tällaisissa käyttötapauksissa.
- Tiedon olemassaolo mahdollistaa hyödyntämisen esimerkiksi organisaation omassa portaalissa/verkkosivulla, joka on suunnattu esimerkiksi yrityksille.
- Kysymys: Liittyen tiedon kuratointiin ja rakenteisuuteen sekä eri organisaatioiden tuottamien tietojen yhdistämiseen; hierarkisuus ja rakenteisuus sekä niiden ymmärtäminen on erilaista puhuttaessa ihmisistä ja tekoälystä. Onko tulevaisuudessa mahdollista toteuttaa rakenteiden kuratointia tekoälyllä syötetyn tiedon louhinnan perusteella?
- Jossain määrin saattaa olla, mutta ollaan vielä melko kaukana. Kytkökset saatetaan ihmisten puolesta tietää, mutta ne eivät välttämättä näy datoista.
- Tekoälyä voisi hyödyntää ainakin tiedon luokittelussa.
- Kysymys: Onko tietomallissa palvelua olemassa itsenäisenä kokonaisuutena?
- Esimerkkinä FINMARI ja Husön tutkimusasema, jotka kannattaa molemmat kuvata omina infrastruktuureinaan, joihin molempiin sisältyy palveluita, jotka puolestaan voidaan kytkeä tarpeen mukaan muihinkin infrastruktuureihin.
- Kysymys: Pystyykö Justus-käyttöliittymällä tietoja syöttäessä selaamaan ja käyttämään pohjana eri organisaatioiden infrastruktuuritietoja vai ollaanko Tiedejatutkimus.fi-sivuston tai rajapinnan varassa?
- Esitäyttö on tällä hetkellä suunniteltu vain tutkimustietovarannosta ja tallennettujen infrojen näkymä on organisaatiokohtainen.
- Muiden tekemiä kuvailuja ei näe kuin hakemalla rajapinnasta, ennen kuin Tiedejatutkimus.fi:n näkymä on saatavilla, mutta verkoston rakentaminen jälkikäteen on helppoa ja voidaan hoitaa säännöllisen kuratoinnin yhteydessä.
- Kysymys: Kun yksi hierarkian alaosa tarjoaa palvelua, pitääkö se kytkeä myös ylempään? Näkeekö ylempi kaikkien alempien hierarkioiden palvelut eli voisiko järjestelmä automaattisesti näyttää sisäiset linkitykset? Kaikkien kytkösten tekeminen on aika suuri työ.
- Ihan mahdollista toteuttaa noin, ei tarvitse miettiä kytköksiä muihin kuin emoinfraan.
- Tässä vaiheessa ollaan vasta kokoamassa "pellin alaista" runkoa valmiiksi.
- Kysymys: Tuleeko tutkimustietovarantoon mitään tutkimusinfroja "automaattisesti"? Esim. kansalliselle tiekartalle kuuluvat?
- Ei toistaiseksi tule, ne täytyy kuvata ja linkittää esimerkiksi Suomen Akatemian rahoituspäätökseen.
- Kysymys: Onko tulevaisuuden tavoite, että datasetit kertovat (PID viittauksilla), millä infralla ne on tuotettu ja että julkaisut voivat pysyvillä tunnisteilla viitata datasetteihin (aineistotiedot) ja/tai infrastruktuureihin?
- Kyllä, tarkoitus on, että viitataan ja ilmentämiskykyä on nyt jo suunnitteilla Fairdata-palvelukokonaisuuteen ja myös julkaisupuolelle. Pysyvillä tunnisteilla (PID) osoitetaan se, että se liittyy tiettyyn infraan tai palveluun ja siinä nämä viittaukset ilmentävät käyttöä.
- Infrojen vaikuttavuutta voidaan myöhemmin havainnoida myös julkaisuiden kautta.
- Kysymys: Mitä tapahtuu tietovarannossa nyt oleville infratiedoille?
- Nyt tutkimustietovarannossa olevat infratiedot siirretään uuteen tietomalliin. Tarvittaessa katsotaan organisaation kanssa tarkemmin, jos organisaatio on valmis kuvaamaan tiedot itse uuden tietomallin mukaisesti, silloin tiedot korvautuvat uudella tietomassalla. Jos näin ei ole niin tutkimustietovarannossa tehdään migraatiotyötä.
- Tutkimustietovarannossa on myös vanhentuneita tutkimusinfrastruktuureja, jotka täytyy käydä organisaatioiden kanssa läpi.
- Kysymys: Onko virheiden korjaus täysin manuaalista?
- Tietojen validointia tai tarkistuksia liittyen siihen onko tuotava tieto tietomallin mukaista. Mutta esimerkiksi kuvauksissa olevissa tiedoissa nojaudutaan lähteen tietoon eli organisaation omista järjestelmistä siirtotiedostona tullut tieto tai Justuksen kautta, niin korjaus täytyy tehdä lähdejärjestelmässä eli siinä mielessä manuaalista työtä.
- Samalla tavalla kuin esimerkiksi julkaisutietojen kohdalla tällä hetkellä, eli lähtöpäässä korjataan.
- Julkaisutiedonkeruun puolella on organisaatioiden sivu yhteystiedoille. Tällainen malli voisi toimia myös infrastruktuuritietojen korjauspyyntöihin organisaatiolta toiselle. → Otetaan yhteystietojen keräys työlistalle, koska se helpottaisi kuratointia ja virheiden korjausta huomattavasti.
- Kysymys: Hyödyttääkö palvelu korkeakoulua yhteiskunnan näkyvyyden, infran käytön lisäämisen ja sitä kautta rahallisen hyödyn näkökulmasta? Eli onko tämä muuta kuin metadatatietokanta?
- Käyttötapaukset ohjaavat kehitystä eli tämä ratkaisu tukisi erinäisiä kansallisia tai organisaatioiden näkökulmasta tärkeitä ominaisuuksia, esimerkiksi näkyvyys ja TKI-käytön lisääminen.
- Aiemmin tällaista infrastruktuuritietoa ei ole ollut kootusti saatavilla, mutta nyt sitä kootaan monella tasolla ja nähdään sen potentiaali.
- Esimerkiksi Unite!-yliopistoallianssi on rakentanut omaan käyttöönsä yhdeksän eri yliopiston tutkimusinfrat sisältävän tietokannan: https://agora.unite-university.eu//resources/infrastructure
- Vaikuttavuuteen päästään pureutumaan sitten kun tietosisältö on koottu.
- Palataan mahdollisiin englanninkielisiin tilaisuuksiin ja wikimateriaaliin.
- Joonas Nikkanen esitteli lyhyesti tietomallin kuvauksen ja tiedonsiirtoformaatin ensimmäisiä julkisia versioita, joista toivotaan kommentteja ja palautetta.
- Tiedonsiirtoformaatti: https://iri.suomi.fi/model/researchfi_data_infrastructures/
- Ulkoisen rajapinnan kuvaus (tulossa myös Swagger-dokumentaatio): https://iri.suomi.fi/model/researchfi_data_infra_pub_api/
Tiedonsiirrot tehdään .json-tiedostoja hyödyntäen ja .json-tiedoston skeema on mahdollista ladata tietomallityökalusta.
- Tiedonsiirtoformaatti: https://iri.suomi.fi/model/researchfi_data_infrastructures/
- Organisaatioiden on mahdollista saada tutkimustietovarantotiimiltä tukea tiedonsiirtoihin ja käyttöönottoon.
- Tukisession varaamiseksi voitte ehdottaa 2–3 teille sopivaa ajankohtaa tiedejatutkimus@csc.fi -palveluosoitteeseen.
- Walter Rydman esitteli infrastrutuuripalveluiden tietojen pakollisuuksia sekä miten palvelun kohderyhmiä ja käyttäjiä voitaisiin kuvata koodistojen avulla.
- Organisaatiot voivat ehdottaa, millainen infrastruktuurin palvelun tyypin luokittelu toimisi palvelun ohjaustietona.
- Kysymys: Voiko nykyiset infratiedot koota tältä vuodelta ilman Justuksen hankintaa maksutta?
- Infratietoja voi koota omassa organisaatiossa ja toimittaa siirtotiedostona. Siirtotiedostoihin liittyen on tukea saatavilla tutkimustietovarantotiimiltä.
- Justus on tarjolla pitkäaikaisena ratkaisuna myös organisaation omiin tarpeisiin, jos ei ole näköpiirissä muuta järjestelmää infrastruktuuritietojen kuvailuun ja ylläpitämiseen.
- Kommentti: Tutkimusinfran yleisten kuvauskenttien tapaan myös palveluiden luokittelun pakollisuus lisää helposti kuormittavuutta tietojen päivittämiseen.
- Toimitettavien tietojen pakollisuuksia on mahdollista säätää.
- Kommentti: Uusien rajapintojen luominen ja infratietojen linkittäminen esimerkiksi julkaisuihin on melko pitkä prosessi organisaatioille. Justus voisi olla nopein tie tietojen syöttämiseen organisaatioissa.
- Tuki uudelle tietomallille ja mahdollisuus vastaanottaa tietoja tutkimustietovarantoon on tavoitteena saada käyttöön vuoden alusta. Organisaatiot toimittavat tiedot omassa aikataulussaan.