You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 86 Next »

CSC – Tieteen tietotekniikan keskus Oy toteuttaa vuoden 2015 aikana VIRTA-julkaisutietopalvelun. Tämä sivusto sisältää ajankohtaista tietoa palvelun toteutuksen etenemisestä.

 

Yhteyshenkilökokoukset

Seuraava VIRTA-julkaisutietopalvelun yhteyshenkilökokous pe 1.4.2016 klo 13-14.30 (ks. tarkemmin)

Ajankohtaista


VIRTA-julkaisutietopalvelulla on kaksi sähköpostilistaa

Korkeakouluja ja muita organisaatioita pyydetään nimeämään yhetyshenkilönsä ja  ilmoittamaan näiden tiedot sähköpostitse: virta-julkaisut@postit.csc.fi




 

Mikä on VIRTA-julkaisutietopalvelu?

Korkeakoulujen valtakunnallinen tietovaranto VIRTA on järjestelmä, jonka kautta korkeakoulujen tuottamat tiedot ovat saatavilla yhdestä, tehokkaasta rajapintapalvelusta. Suunnitellussa VIRTA-julkaisutietopalvelussa tutkimusorganisaatiot voivat säilyttää kopiota osasta oman tutkimustietojärjestelmänsä tai julkaisurekisterinsä tietosisältöä (vrt. VIRTA-Opintotietopalvelu sisältää soveltuvin osin kopiot korkeakoulujen opintotietojärjestelmistä). Korkeakoulut ja muut tutkimusorganisaatiot vastaavat omien julkaisutietojensa oikeellisuudesta. Lisäksi organisaatioiden toimittamia tietoja rikastetaan tietovarannossa tietyiltä osin (esim. organisaatioiden välisten yhteisjulkaisujen tunnistaminen, Julkaisufoorumi-tason määrittäminen).

Miksi?

Tavoitteena on toteuttaa tietovaranto, jonka jatkuvasti päivittyvänä tietosisältönä ovat kaikkien suomalaisten tutkimusorganisaatioiden julkaisut - myös mahdollisilta osin historiasta. Tiedon tuottajan näkökulmasta tietovaranto on tekninen ratkaisu, jolla tietoja siirtyy tietojärjestelmistä toisiin – tieto avataan muiden käyttöön.

Julkaisutietovirtojen nyky- ja tavoitetila (klikkaa suuremmaksi):

OKM:n julkaisutiedonkeruu toteutetaan tulevaisuudessa kokonaisuudessaan VIRTA-julkaisutietopalvelun kautta. Päätavoite kuitenkin on kaikista suomalaisista tutkimusorganisaatioista yhteen koottujen julkaisutietojen hyödyntäminen erilaisissa tutkijoille tarjottavissa palveluissa ja prosesseissa (esim. muiden viranomaisten tiedonkeruut, tietopyynnöt, tutkimusrahoittajien hakemus- ja raportointipalvelut, hankerekisterit, kansalliselle tasolle kerättyjen julkaisujen /tutkimusaineistojen/hankkeiden metatietojen linkittäminen, Julkaisufoorumi). Koneluettavien rajapintojen avulla tiedonsiirto automatisoituu ja  samoja tietoja ei tarvitse enää syöttää käsin useaan paikkaan.

Lisäksi tavoitteena on, että kerättävien julkaisutietojen laatu paranee, kun tutkimusorganisaatioille tarjotaan edellytykset tietojen ajantasaiseen esittämiseen, korjaamiseen ja täydentämiseen, ohjeistusta parannetaan ja tutkimusorganisaatioiden yhteistyötä tiedonkeruussa edistetään.

Muut julkaisutiedonkeruun kehittämiskohteet

VIRTA-julkaisutietopalvelun toteutuksen lisäksi OKM:n julkaisutiedonkeruun kehittämiseen liittyy CSC:n toteuttamana seuraavia osakokonaisuuksia:

Aikataulu

Organisaatiot voivat liittyä mukaan VIRTA-julkaisutietopalveluun vaiheittain omien valmiuksiensa mukaan. Organisaatio voi päättää myös siirtotiheyden itse (esim. päivittäin, minimi kuitenkin vuosittain).

Nykymallista tiedonkeruuta ylläpidetään rinnalla vielä vuoden 2015 tietojen keruussa keväällä 2016. Kaikki organisaatiot raportoivat vuoden 2016 tiedot VIRTA-julkaisutietopalvelun kautta.

 

Vuonna 2015

  • Toteutetaan prosessi ja tarvittavat rajapinnat julkaisutietojen lataamiseksi automaattisesti ja ajantasaisesti tutkimusorganisaatioiden omista järjestelmistä VIRTA-julkaisutietopalveluun
  • Toteutetaan automaattinen julkaisutietojen tarkistusprosessi julkaisutiedonkeruun vaatimuksia vastaavalla tavalla.
  • Annetaan teknistä tukea tutkimusorganisaatioille vanhanmallisen OKM-julkaisutiedonkeruun CSV-tiedoston muuttamiseksi  VIRTA-julkaisutietopalvelun määritysten mukaiseksi
  • Kartoitetaan tutkijalle ja viranomaisille tarjottavat palvelut, joissa VIRTA-julkaisutietopalvelua voidaan tulevaisuudessa hyödyntää ja valmistellaan toimenpidesuunnitelma julkaisutietojen hyödyntämiseksi valittujen palveluiden kehittämisessä
  • Tuetaan tietolähteiden eli korkeakoulujen ja tutkimuslaitosten oman toiminnan saattamista tietovirran edellyttämälle tasolle
  • Toteutetaan selvitys ORCID-tutkijatunnisteen käyttöönotosta kansallisella tasolla sekä mahdollinen toteutus OKM:n jatkotoimeksiannon mukaisesti
  • Toteutetaan Julkaisufoorumin julkaisukanavatietokantaan tarvittavat sisällölliset ja tekniset muutokset, jotta se olisi mahdollisimman hyvin tutkimusorganisaatioiden hyödynnettävissä ja integroitavissa VIRTA-julkaisutietopalveluun
  • Valmistellaan valtion tutkimuslaitosten ja yliopistolliset sairaaloiden liittymistä julkaisutiedonkeruuseen muutamien pilottiorganisaatioiden kanssa
  • Luodaan VIRTA-julkaisutietopalvelun yhteyshenkilöverkosto
  • Viedään vuosien 2011-2014 julkaisutiedonkeruun tiedot tietovarantoon.
  • Käynnistetään VIRTA-tiedonsiirron testaus pilottiorganisaatioista

Vuonna 2016

  • Julkaistaan REST- ja OAI-PMH-lukurajapinnat
  • Pilottiorganisaatioiden vuoden 2015 OKM-julkaisutiedonkeruu VIRTA-julkaisutietopalveluun.
  • VIRTA-julkaisutietopalvelun hyödyntämisen pilotointi Suomen Akatemian hankeraportoinnissa.

Vuonna 2017

  • Kaikkien organisaatioiden vuoden 2016 OKM-julkaisutiedonkeruu VIRTA-julkaisutietopalveluun.

 

Toteutuksen ja tiedonkeruiden aikataulusuunnitelma (klikkaa suuremmaksi):

Tietosisällöt

Tietosisällölle on asetettu erikseen sovittavia vaatimuksia ja tarkistuksia, jotta tietojen yhteismitallisuus ja hyödyntäminen on mahdollista VIRTA-julkaisutietopalvelun tavoitteiden saavuttamiseksi. Tietosisältömääritykset noudattavat OKM:n tiedonkeruukäsikirjoissa annettuja ohjeita. Elementtien tarkemmat kuvaukset löytyvät täältä.

Tietyiltä osin VIRTA-julkaisutietopalveluun hyväksytään kuitenkin myös epätäydellinen, puutteellinen ja mahdollisesti virheellinenkin tieto. Tiedot voidaan näyttää ajantasaisesti JUULI-julkaisutietoportaalissa, mutta tällöin organisaation tulee täydentää kunkin tilastovuoden tiedot OKM:n tiedonkeruun vaatimusten mukaiseksi tiedonkeruiden aikatauluihin mennessä. Tiettyjä luokittelutietoja (esim. ”kansainvälinen yhteisjulkaisu” -tieto) voidaan tuoda vuosittain julkaisun viitetietojen täydennykseksi julkaisun tunnisteen perusteella. Tietovarannosta toimitetaan jokaisen tiedonsiirron yhteydessä takaisin organisaatioille virheraportti, jonka perusteella varantoon lähetettäviä tietoja voidaan täydentää.

Tietosisällöt ja niiden pakollisuudet vuoden 2015 julkaisuille (klikkaa suuremmaksi):

Tietosisällöt ja niiden pakollisuudet vuoden 2016 julkaisuille (klikkaa suuremmaksi):


Tekninen toteutus

Tietovaranto vaatii toimiakseen sitä, että korkeakoulut lähettävät säännöllisesti julkaisutiedot, yhteisesti sovittua formaattia hyväksikäyttäen kansalliseen tietovarantoon. VIRTA-julkaisutietopalvelun tiedostomuoto on XML. Ks. XML-skeemat.

 

XML-tiedoston muodostaminen

Siirtotiedosto voidaan muodostaa joko siten, että aina toimitetaan koko aineisto, tai inkrementaalisesti niin, että ns. alkulatauksen jälkeen (ensimmäisellä kerralla kaikki julkaisutiedot) tuodaan julkaisutietovarantoon vain uudet tai muuttuneet tiedot. Toinen vaihtoehto on, että toimitetaan aina kaikki tiedot, esimerkiksi sovittujen vuosien ajalta, jolloin muuttuneet ja uudet tiedot pitää tarvittaessa tunnistaa VIRTA-julkaisutietopalvelussa.

CSC antaa tarvittaessa tukea ja ohjeita tiedonsiirtojen tekemistä ja mahdollisuuksien mukaan myös siirtotiedostojen luomista varten.

CSC toteuttaa organisaatioiden käyttöön lisäksi muuntotyökalun, jolla csv-muotoisen tiedoston voi muuntaa VIRTA-julkaisutietopalvelun XML-määritysten mukaiseen muotoon.

Tiedonsiirto

Tietojen siirtäminen julkaisutietovarantoon tapahtuisi suojatun ja varmennetun yhteyden yli. Projektissa suositellaan käytettäväksi SFTP-protokollaa. Tunnistautuminen palveluun tapahtuu SSH-avaimia hyödyntäen. Lisäksi pääsy itse palvelimelle on rajattu palomuurein ja sallittu ainoastaan nimetyistä IP-osoitteista. SFTP-palvelua voidaan tarvittaessa käyttää tietojen siirtoon kumpaankin suuntaan – myös julkaisutietojärjestelmästä korkeakouluun tai tutkimuslaitokseen päin.

VIRTA-julkaisutietopalveluun tietoja siirtävillä organisaatioilla tulee olemaan mahdollisuus tarkistaa tietosisältö itse julkaisutietopalvelussa ja seurata latausten onnistumista. Virhetilanteissa latauksessa voidaan toimittaa sähköpostihälytys tai tarvittaessa raportoida muuten.

Uuden siirtotavan rinnalla ylläpidetään myös vanhaa CSV-pohjaista tiedonsiirtoa siirtymäkauden ajan (2016).

Lukurajapinnat

VIRTA-julkaisutietopalvelun tietosisältö on avoimesti luettavissa mihin tahansa järjestelmään tai palveluun REST- ja OAI-PMH-rajapintojen avulla. Lukurajapinnat valmistuvat tammi-helmikuussa 2016.

CERIF

CERIF on tietomalli jota ylläpitää ja kehittää euroCRIS (www.eurocris.org) – voittoa tavoittelematon eurooppalainen yhteenliittymä, jonka tarkoituksena on kehittää tutkimustietojärjestelmiä ja niiden yhteensopivuutta.EuroCRIS:n kotisivuilta löytyvät tietomallin määritys sekä siihen liittyvät sisällölliset - tekniset kuvaukset, sekä tarvittavat XSD-määritykset esimerkki tiedostoineen.

VIRTA-julkaisutietojen siirrossa organisaatioiden lähdejärjestelmistä tietovarantoon CERIF on kuitenkin todettu liian työlääksi soveltaa. VIRTA-julkaisutietopalvelu tukee kuitenkin jatkossa tietojen lukemista tietovarannosta ulospäin CERIF-tietomallin mukaisessa muodossa.

 

Tietojen siirto tutkimusorganisaatiosta VIRTA-julkaisutietopalveluun (klikkaa suuremmaksi):

Kysy lisää

Hanna-Mari Puuska, projektipäällikkö, p. 050 3818 568

Raine Rapo, tekninen vastuuhenkilö

virta-julkaisut@postit.csc.fi

 

 

 

  • No labels