VIRTA-julkaisutietopalvelu kokoaa yhteen tutkimusjulkaisujen tiedot kaikista suomalaisista tutkimusorganisaatioista: korkeakouluista, tutkimuslaitoksista ja yliopistollisista sairaaloista. Organisaatiot saavat näin helposti yhteismitallista ja ajantasaista vertailutietoa omasta ja muiden organisaatioiden julkaisutoiminnasta.
VIRTA-julkaisutietopalveluun siirtyy vuosittain noin 60 000 julkaisun tiedot.
Tietosisältö
VIRTA-julkaisutietopalvelu sisältää tiedot suomalaisten korkeakoulujen, tutkimuslaitosten ja yliopistollisten sairaanhoitopiirien tuottamista tutkimusjulkaisuista. Se tarjoaa tutkimusorganisaatioille edellytykset tietojen ajantasaiseen esittämiseen, korjaamiseen ja täydentämiseen. Tietoja on kerätty korkeakouluilta OKM:n julkaisutiedonkeruussa vuodesta 2011 alkaen. Tutkimuslaitokset ja yliopistolliset sairaalat ovat liittyneet mukaan vaiheittain vuodesta 2014 alkaen.
Ks. lisää
Tietojen tuottaminen
VIRTA-julkaisutietopalvelussa tutkimusorganisaatiot säilyttävät kopiota osasta oman tutkimustietojärjestelmänsä tai julkaisurekisterinsä tietosisältöä (vrt. VIRTA-Opintotietopalvelu sisältää soveltuvin osin kopiot korkeakoulujen opintotietojärjestelmistä).Tiedon tuottajan näkökulmasta tietovaranto on tekninen ratkaisu, jolla tietoja siirtyy tietojärjestelmistä toisiin – tieto avataan muiden käyttöön. Tavoitteena on, että VIRTA-julkaisutietopalveluun päivittyvät julkaisutiedot ajantasaisesti kaikista suomalaisista tutkimusorganisaatioista - myös mahdollisilta osin historiasta.
Ks. lisää
Tietojen hyödyntäminen
VIRTA-julkaisutietopalvelun sisältämiä julkaisutietoja voidaan hyödyntää erilaisissa tutkijoille suunnatuissa palveluissa ja prosesseissa. Tiedot voidaan siirtää esimerkiksi tutkimusrahoittajien palveluihin, julkaisuarkistoihin, tutkimusaineistopalveluihin tai muihin tutkijoiden käyttämiin palveluihin, jolloin tutkijan ei tarvitse syöttää niitä käsin.
Korkeakoulut ja muut tutkimusorganisaatiot saavat VIRTA-julkaisutietopalvelusta ajantasaista vertailutietoa omasta ja muiden organisaatioiden julkaisutoiminnasta. VIRTA-julkaisutietopalvelun tietoja voi vapaasti selata JUULI-julkaisutietoportaalissa www.juuli.fi
Lisäksi OKM:n vuosittainen julkaisutiedonkeruu korkeakouluista ja muista tutkimusorganisaatioista toteutetaan jatkossa kokonaisuudessaan VIRTA-julkaisutietopalvelun kautta.
Toteutus ja käyttöönotto
VIRTA-julkaisutietopalvelu otettiin käyttöön vuoden 2016 alussa, ja tietojen hyödyntämistä OKM:n julkaisutiedonkeruussa pilotoitiin maaliskuussa 2016. Tietoja tuottavat korkeakoulut, tutkimuslaitokset ja yliopistolliset sairaalat voivat liittyä mukaan omien valmiuksiensa mukaan. OKM:n julkaisutiedonkeruu toteutetaan keväällä 2017 kokonaisuudessaan VIRTA-julkaisutietopalvelun kautta. VIRTA-julkaisutietopalvelun sisältämien julkaisutietojen hyödyntämistä pilotoidaan Suomen Akatemian hankeraportoinnissa syksyllä 2016.
Ajankohtaista
- Seuraava VIRTA-julkaisutietopalvelun yhteyshenkilökokous pe 9.9.2016 klo 13-14.30
- REST-rajapinnan hakuparametreja päivitetty 31.5.2016
- Julkaisutiedonkeruukäsikirjojen 2016 luonnosversiot kommentoitavana täällä
- CSV-XML-työkalun uusi versio julkaistu 29.4.2016. Uusi versio mahdollistaa myös vuoden 2016 julkaisutietojen muuntamisen XML:ksi.
- VIRTA-julkaisutietopalvelun REST-lukurajapinta on julkaistu 1.4.2016
- Julkaisutiedonkeruun pilotointi VIRTAan onnistui hyvin (ks. lisää)
- VIRTA-julkaisutietopalvelun XML-skeeman versio 1.10 on julkaistu
Tekninen toteutus
Tietovaranto vaatii toimiakseen sitä, että korkeakoulut lähettävät säännöllisesti julkaisutiedot, yhteisesti sovittua formaattia hyväksikäyttäen kansalliseen tietovarantoon. VIRTA-julkaisutietopalvelun tiedostomuoto on XML. Ks. XML-skeemat.
XML-tiedoston muodostaminen
Siirtotiedosto voidaan muodostaa joko siten, että aina toimitetaan koko aineisto, tai inkrementaalisesti niin, että ns. alkulatauksen jälkeen (ensimmäisellä kerralla kaikki julkaisutiedot) tuodaan julkaisutietovarantoon vain uudet tai muuttuneet tiedot. Toinen vaihtoehto on, että toimitetaan aina kaikki tiedot, esimerkiksi sovittujen vuosien ajalta, jolloin muuttuneet ja uudet tiedot pitää tarvittaessa tunnistaa VIRTA-julkaisutietopalvelussa.
CSC antaa tarvittaessa tukea ja ohjeita tiedonsiirtojen tekemistä ja mahdollisuuksien mukaan myös siirtotiedostojen luomista varten.
CSC toteuttaa organisaatioiden käyttöön lisäksi muuntotyökalun, jolla csv-muotoisen tiedoston voi muuntaa VIRTA-julkaisutietopalvelun XML-määritysten mukaiseen muotoon.
Tiedonsiirto
Tietojen siirtäminen julkaisutietovarantoon tapahtuisi suojatun ja varmennetun yhteyden yli. Projektissa suositellaan käytettäväksi SFTP-protokollaa. Tunnistautuminen palveluun tapahtuu SSH-avaimia hyödyntäen. Lisäksi pääsy itse palvelimelle on rajattu palomuurein ja sallittu ainoastaan nimetyistä IP-osoitteista. SFTP-palvelua voidaan tarvittaessa käyttää tietojen siirtoon kumpaankin suuntaan – myös julkaisutietojärjestelmästä korkeakouluun tai tutkimuslaitokseen päin.
VIRTA-julkaisutietopalveluun tietoja siirtävillä organisaatioilla tulee olemaan mahdollisuus tarkistaa tietosisältö itse julkaisutietopalvelussa ja seurata latausten onnistumista. Virhetilanteissa latauksessa voidaan toimittaa sähköpostihälytys tai tarvittaessa raportoida muuten.
Uuden siirtotavan rinnalla ylläpidetään myös vanhaa CSV-pohjaista tiedonsiirtoa siirtymäkauden ajan (2016).
Lukurajapinnat
VIRTA-julkaisutietopalvelun tietosisältö on avoimesti luettavissa mihin tahansa järjestelmään tai palveluun REST- ja OAI-PMH-rajapintojen avulla. Lukurajapinnat valmistuvat tammi-helmikuussa 2016.
CERIF
CERIF on tietomalli jota ylläpitää ja kehittää euroCRIS (www.eurocris.org) – voittoa tavoittelematon eurooppalainen yhteenliittymä, jonka tarkoituksena on kehittää tutkimustietojärjestelmiä ja niiden yhteensopivuutta.EuroCRIS:n kotisivuilta löytyvät tietomallin määritys sekä siihen liittyvät sisällölliset - tekniset kuvaukset, sekä tarvittavat XSD-määritykset esimerkki tiedostoineen.
VIRTA-julkaisutietojen siirrossa organisaatioiden lähdejärjestelmistä tietovarantoon CERIF on kuitenkin todettu liian työlääksi soveltaa. VIRTA-julkaisutietopalvelu tukee kuitenkin jatkossa tietojen lukemista tietovarannosta ulospäin CERIF-tietomallin mukaisessa muodossa.
Tietojen siirto tutkimusorganisaatiosta VIRTA-julkaisutietopalveluun (klikkaa suuremmaksi):
Kysy lisää
Hanna-Mari Puuska, projektipäällikkö, p. 050 3818 568
Raine Rapo, tekninen vastuuhenkilö
VIRTA-julkaisutietopalvelulla on kaksi sähköpostilistaa
- virta-julkaisut@postit.csc.fi on VIRTA-kehitystiimin osoite. Tämä osoite tulee toimimaan piakkoin myös palvelupyyntöosoitteena (ns. tikettijärjestelmä), jonne voi lähettää ilmoituksia ongelmista, kysymyksiä jne.
- virta-julkaisut-yhteyshenkilot@postit.csc.fi sähköpostilista toimii korkekoulujen VIRTA-yhteyshenkilöiden yhteisenä tiedotuskanavana.
Korkeakouluja ja muita organisaatioita pyydetään nimeämään yhteyshenkilönsä ja ilmoittamaan näiden tiedot sähköpostitse: virta-julkaisut@postit.csc.fi
Tavoitteena on kattava tietovaranto, jonka jatkuvasti päivittyvänä tietosisältönä ovat kaikkien suomalaisten tutkimusorganisaatioiden julkaisut - myös mahdollisilta osin historiasta.