You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 48 Next »

 

 

CSC – Tieteen tietotekniikan keskus Oy toteuttaa vuoden 2015 aikana VIRTA-julkaisutietopalvelun. Tämä sivusto sisältää ajankohtaista tietoa palvelun toteutuksen etenemisestä.

 

Ajankohtaista

  • CSC:n järjestämässä julkaisutiedonkeruuseminaarissa 31.8.2015 (Turku) käsitellään mm. VIRTA-julkaisutietopalvelun toteutuksen etenemistä.  Ohjelma ja ilmoittautumisohjeet.
  • VIRTA-julkaisutietopalvelun XML-skeeman versio 1.1 on julkaistu

  • Elementtien kuvaukset ja tietojen pakollisuudet ovat kommentoitavana täällä

  • OKM on julkaissut julkaisutiedonkeruun 2015 ohjeistuksen tutkijoille. Ks. tiedonkeruuohjeistukset.

  • VIRTA-seminaarissa  31.3.2014 Espoon Dipolissa mm. julkaisutietovirrat-työpaja.
  • Korkeakouluja ja muita tutkimusorganisaatioita pyydetään nimeämään ja ilmoittamaan VIRTA-julkaisutietopalvelun yhteyshenkilönsä ajankohtaisista asioista tiedottamista varten: virta-julkaisut (at) postit.csc.fi Huom. samasta organisaatiosta voi ilmoittaa usean yhteyshenkilön.
  • VIRTA-julkaisutietopalvelun kehittämiseen liittyviä kommentteja ja kysymyksiä voit lisätä tänne tai lähettää sähköpostitse: virta-julkaisut (at) postit.csc.fi

Mikä on VIRTA-julkaisutietopalvelu?

Korkeakoulujen valtakunnallinen tietovaranto VIRTA on järjestelmä, jonka kautta korkeakoulujen tuottamat tiedot ovat saatavilla yhdestä, tehokkaasta rajapintapalvelusta. Suunnitellussa VIRTA-julkaisutietopalvelussa tutkimusorganisaatiot voivat säilyttää kopiota osasta oman tutkimustietojärjestelmänsä tai julkaisurekisterinsä tietosisältöä (vrt. VIRTA-Opintotietopalvelu sisältää soveltuvin osin kopiot korkeakoulujen opintotietojärjestelmistä). Korkeakoulut ja muut tutkimusorganisaatiot vastaavat omien julkaisutietojensan oikeellisuudesta. Lisäksi organisaatioiden toimittamia tietoja rikastetaan tietovarannossa tietyiltä osin (esim. organisaatioiden välisten yhteisjulkaisujen tunnistaminen, Julkaisufoorumiluokan määrittäminen).

Tiedon tuottajan näkökulmasta tietovaranto on tekninen ratkaisu, jolla tietoja siirtyy tietojärjestelmistä toisiin – tieto avataan muiden käyttöön. Esimerkiksi viranomaiset voivat poimia tiedonkeruissa tarvittavia tietoja suoraan tietovarannosta, jolloin viranomaisraportointi yksinkertaistuu.

Julkaisutietovirtojen nyky- ja tavoitetila (klikkaa suuremmaksi):

Miksi?

Tavoitteena on toteuttaa tietovaranto, jonka jatkuvasti päivittyvänä tietosisältönä ovat kaikkien suomalaisten tutkimusorganisaatioiden julkaisut - myös mahdollisilta osin historiasta.

Tarkoituksena on, että korkeakoulujen julkaisutiedonkeruu OKM:lle toteutetaan tulevaisuudessa VIRTA-julkaisutietopalvelun kautta. Päätavoite kuitenkin on kaikista suomalaisista tutkimusorganisaatioista yhteen koottujen julkaisutietojen hyödyntäminen jatkossa erilaisten tutkijoille ja viranomaisille tarjottavien palveluiden ja muiden prosessien osana (esim. muiden viranomaisten tiedonkeruut, tietopyynnöt, tutkimusrahoittajien hakemus- ja raportointipalvelut, hankerekisterit, kansalliselle tasolle kerättyjen julkaisujen /tutkimusaineistojen/hankkeiden metatietojen linkittäminen, Julkaisufoorumi).

Lisäksi tavoitteena on, että kerättävien julkaisutietojen laatu paranee, kun tutkimusorganisaatioille tarjotaan edellytykset tietojen ajantasaiseen esittämiseen, korjaamiseen ja täydentämiseen, ohjeistusta parannetaan ja tutkimusorganisaatioiden yhteistyötä tiedonkeruussa edistetään.

Muut julkaisutiedonkeruun kehittämiskohteet

VIRTA-julkaisutietopalvelun toteutuksen lisäksi OKM:n julkaisutiedonkeruun kehittämiseen liittyy CSC:n toteuttamana seuraavia osakokonaisuuksia:

Aikataulu

Organisaatiot voivat liittyä mukaan VIRTA-julkaisutietopalveluun vaiheittain omien valmiuksiensa mukaan. Organisaatio voi päättää myös siirtotiheyden itse (esim. päivittäin, minimi kuitenkin vuosittain).

Vuonna 2015

  • Toteutetaan prosessi ja tarvittavat rajapinnat julkaisutietojen lataamiseksi automaattisesti ja ajantasaisesti tutkimusorganisaatioiden omista järjestelmistä VIRTA-julkaisutietopalveluun
  • Toteutetaan automaattinen julkaisutietojen tarkistusprosessi julkaisutiedonkeruun vaatimuksia vastaavalla tavalla.
  • Annetaan teknistä tukea tutkimusorganisaatioille vanhanmallisen OKM-julkaisutiedonkeruun CSV-tiedoston muuttamiseksi  VIRTA-julkaisutietopalvelun määritysten mukaiseksi
  • Kartoitetaan tutkijalle ja viranomaisille tarjottavat palvelut, joissa VIRTA-julkaisutietopalvelua voidaan tulevaisuudessa hyödyntää ja valmistellaan toimenpidesuunnitelma julkaisutietojen hyödyntämiseksi valittujen palveluiden kehittämisessä
  • Tuetaan tietolähteiden eli korkeakoulujen ja tutkimuslaitosten oman toiminnan saattamista tietovirran edellyttämälle tasolle
  • Toteutetaan selvitys ORCID-tutkijatunnisteen käyttöönotosta kansallisella tasolla sekä mahdollinen toteutus OKM:n jatkotoimeksiannon mukaisesti
  • Toteutetaan Julkaisufoorumin julkaisukanavatietokantaan tarvittavat sisällölliset ja tekniset muutokset, jotta se olisi mahdollisimman hyvin tutkimusorganisaatioiden hyödynnettävissä ja integroitavissa VIRTA-julkaisutietopalveluun
  • Valmistellaan valtion tutkimuslaitosten ja yliopistolliset sairaaloiden liittymistä julkaisutiedonkeruuseen muutamien pilottiorganisaatioiden kanssa
  • Luodaan VIRTA-julkaisutietopalvelun yhteyshenkilöverkosto
  • Viedään vuosien 2011-2014 julkaisutiedonkeruun tiedot tietovarantoon.
  • Käynnistetään VIRTA-tiedonsiirron testaus pilottiorganisaatioista

Vuonna 2016

  • Pilottiorganisaatioiden vuoden 2015 OKM-julkaisutiedonkeruu VIRTA-julkaisutietopalveluun.
  • VIRTA-julkaisutietopalvelun hyödyntämisen pilotointi Suomen Akatemian hankeraportoinnissa.

Vuonna 2017

  • Kaikkien organisaatioiden vuoden 2016 OKM-julkaisutiedonkeruu VIRTA-julkaisutietopalveluun.

 

Toteutuksen ja tiedonkeruiden aikataulusuunnitelma (klikkaa suuremmaksi):

Tietosisällöt

Tietosisällölle on asetettava erikseen sovittavia vaatimuksia ja tarkistuksia, jotta tietojen yhteismitallisuus ja hyödyntäminen on mahdollista VIRTA-julkaisutietopalvelun tavoitteiden saavuttamiseksi. 

 

Tietyiltä osin VIRTA-julkaisutietopalveluun voidaan kuitenkin hyväksyä myös epätäydellinen, puutteellinen ja mahdollisesti virheellinenkin tieto. Tiedot voidaan näyttää ajantasaisesti JUULI-julkaisutietoportaalissa, mutta tällöin organisaation tulee täydentää kunkin tilastovuoden tiedot OKM:n tiedonkeruun vaatimusten mukaiseksi tiedonkeruiden aikatauluihin mennessä. Esimerkiksi tiettyjä luokittelutietoja (esim. ”kansainvälinen yhteisjulkaisu” -tieto) voidaan tuoda vuosittain julkaisun viitetietojen täydennykseksi julkaisun tunnisteen perusteella. Tietovarannosta toimitetaan säännöllisesti takaisin organisaatioille tiedon laatua kuvaava raportti, jonka perusteella varantoon lähetettäviä tietoja voidaan täydentää.

Tietosisällöt ja niiden pakollisuudet on kuvattu alla (klikkaa suuremmaksi):


Elementtien tarkemmat kuvaukset löytyvät täältä. OKM:n tiedonkeruun vaatimukset on kuvattu tarkemmin täällä.

Julkaisutiedonkeruun prosessi VIRTA-julkaisutietopalvelussa. Nykymallista tiedonkeruuta ylläpidetään rinnalla vielä vuoden 2015 tietojen keruussa keväällä 2016. 

 

Tekninen toteutus

Tietovaranto vaatii toimiakseen sitä, että korkeakoulut lähettävät säännöllisesti julkaisutiedot, yhteisesti sovittua formaattia hyväksikäyttäen kansalliseen tietovarantoon. VIRTA-julkaisutietopalvelun tiedostomuoto on XML. Ks. XML-skeemat.

 

XML-tiedoston muodostaminen

Siirtotiedosto voidaan muodostaa joko siten, että aina toimitetaan koko aineisto, tai inkrementaalisesti niin, että ns. alkulatauksen jälkeen (ensimmäisellä kerralla kaikki julkaisutiedot) tuodaan julkaisutietovarantoon vain uudet tai muuttuneet tiedot. Toinen vaihtoehto on, että toimitetaan aina kaikki tiedot, esimerkiksi sovittujen vuosien ajalta, jolloin muuttuneet ja uudet tiedot pitää tarvittaessa tunnistaa VIRTA-julkaisutietopalvelun päässä.

CSC antaa tarvittaessa tukea ja ohjeita tiedonsiirtojen tekemistä ja mahdollisuuksien mukaan myös siirtotiedostojen luomista varten. Tarkoituksena on tukea myös OKM:n julkaisutiedonkeruun nykymallisen CSV-tiedoston konvertoimista XML-määritysten mukaiseen muotoon.

Tiedonsiirto

Tietojen siirtäminen julkaisutietovarantoon tapahtuisi suojatun ja varmennetun yhteyden yli. Projektissa suositellaan käytettäväksi SFTP-protokollaa. Tunnistautuminen palveluun tapahtuu SSH-avaimia hyödyntäen. Lisäksi pääsy itse palvelimelle on rajattu palomuurein ja sallittu ainoastaan nimetyistä IP-osoitteista. SFTP-palvelua voidaan tarvittaessa käyttää tietojen siirtoon kumpaankin suuntaan – myös julkaisutietojärjestelmästä korkeakouluun tai tutkimuslaitokseen päin.

VIRTA-julkaisutietopalveluun tietoja siirtävillä organisaatioilla tulee olemaan mahdollisuus tarkistaa tietosisältö itse julkaisutietopalvelussa ja seurata latausten onnistumista. Virhetilanteissa latauksessa voidaan toimittaa sähköpostihälytys tai tarvittaessa raportoida muuten.

Uuden siirtotavan rinnalla ylläpidetään myös vanhaa CSV-pohjaista tiedonsiirtoa siirtymäkauden ajan (2016).

CERIF

CERIF on tietomalli jota ylläpitää ja kehittää euroCRIS (www.eurocris.org) – voittoa tavoittelematon eurooppalainen yhteenliittymä, jonka tarkoituksena on kehittää tutkimustietojärjestelmiä ja niiden yhteensopivuutta.EuroCRIS:n kotisivuilta löytyvät tietomallin määritys sekä siihen liittyvät sisällölliset - tekniset kuvaukset, sekä tarvittavat XSD-määritykset esimerkki tiedostoineen.

VIRTA-julkaisutietojen siirrossa organisaatioiden lähdejärjestelmistä tietovarantoon CERIF on kuitenkin todettu liian työlääksi soveltaa. VIRTA-julkaisutietopalvelu tukee kuitenkin jatkossa tietojen lukemista tietovarannosta ulospäin CERIF-tietomallin mukaisessa muodossa.

 

Kuva 3. Tietojen siirto tutkimusorganisaatiosta VIRTA-julkaisutietopalveluun.

Kysy lisää

Hanna-Mari Puuska, projektipäällikkö, p. 050 3818 568

Raine Rapo, tekninen vastuuhenkilö

virta-julkaisut@postit.csc.fi

 

2015 

CSC toteuttaa tietovarannon sekä siihen tarvittavat rajapinnat ja prosessit

 

CSC vie vuosien 2011-14 julkaisut VIRTA-julkaisutietopalveluun 

 

Tiedonsiirron testaus joulukuussa

 

CSV-XML-muuntotyökalu testattavissa joulukuussa 

2016

Pilotit (Tay, OY, TY, TTY, TTL,  LAMK, HAMK + mahdollisesti vielä muita) 

Tietojen lataamisen testaus 
OKM-tiedonkeruu 2015 VIRTAan 
Automaattiseen tiedonsiirtoon siirtyminen valmiuksien mukaan 

 

CSC vie kaikki 2015 tiedonkeruun tiedot VIRTA-julkaisutietopalveluun 

 

Tietojen siirto JUULIin käynnistyy kesäkuussa

 

Muiden organisaatioiden liittyminen valmiuksien mukaan

 

SA-pilotointi kesäkuussa

2017 

Kaikkien organisaatioiden OKM-tiedonkeruu 2016 VIRTAan 

 

 

 

 

  • No labels