Section | |||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
Tekninen toteutus
Tietovaranto vaatii toimiakseen sitä, että korkeakoulut lähettävät säännöllisesti julkaisutiedot, yhteisesti sovittua formaattia hyväksikäyttäen kansalliseen tietovarantoon. VIRTA-julkaisutietopalvelun tiedostomuoto on XML. Ks. XML-skeemat.
XML-tiedoston muodostaminen
Siirtotiedosto voidaan muodostaa joko siten, että aina toimitetaan koko aineisto, tai inkrementaalisesti niin, että ns. alkulatauksen jälkeen (ensimmäisellä kerralla kaikki julkaisutiedot) tuodaan julkaisutietovarantoon vain uudet tai muuttuneet tiedot. Toinen vaihtoehto on, että toimitetaan aina kaikki tiedot, esimerkiksi sovittujen vuosien ajalta, jolloin muuttuneet ja uudet tiedot pitää tarvittaessa tunnistaa VIRTA-julkaisutietopalvelussa.
CSC antaa tarvittaessa tukea ja ohjeita tiedonsiirtojen tekemistä ja mahdollisuuksien mukaan myös siirtotiedostojen luomista varten.
CSC toteuttaa organisaatioiden käyttöön lisäksi muuntotyökalun, jolla csv-muotoisen tiedoston voi muuntaa VIRTA-julkaisutietopalvelun XML-määritysten mukaiseen muotoon.
Tiedonsiirto
Tietojen siirtäminen julkaisutietovarantoon tapahtuisi suojatun ja varmennetun yhteyden yli. Projektissa suositellaan käytettäväksi SFTP-protokollaa. Tunnistautuminen palveluun tapahtuu SSH-avaimia hyödyntäen. Lisäksi pääsy itse palvelimelle on rajattu palomuurein ja sallittu ainoastaan nimetyistä IP-osoitteista. SFTP-palvelua voidaan tarvittaessa käyttää tietojen siirtoon kumpaankin suuntaan – myös julkaisutietojärjestelmästä korkeakouluun tai tutkimuslaitokseen päin.
VIRTA-julkaisutietopalveluun tietoja siirtävillä organisaatioilla tulee olemaan mahdollisuus tarkistaa tietosisältö itse julkaisutietopalvelussa ja seurata latausten onnistumista. Virhetilanteissa latauksessa voidaan toimittaa sähköpostihälytys tai tarvittaessa raportoida muuten.
Uuden siirtotavan rinnalla ylläpidetään myös vanhaa CSV-pohjaista tiedonsiirtoa siirtymäkauden ajan (2016).
LukurajapinnatVIRTA-julkaisutietopalvelun tietosisältö on avoimesti luettavissa mihin tahansa järjestelmään tai palveluun REST- ja OAI-PMH-rajapintojen avulla. Lukurajapinnat valmistuvat tammi-helmikuussa 2016.
CERIF
CERIF on tietomalli jota ylläpitää ja kehittää euroCRIS (www.eurocris.org) – voittoa tavoittelematon eurooppalainen yhteenliittymä, jonka tarkoituksena on kehittää tutkimustietojärjestelmiä ja niiden yhteensopivuutta.EuroCRIS:n kotisivuilta löytyvät tietomallin määritys sekä siihen liittyvät sisällölliset - tekniset kuvaukset, sekä tarvittavat XSD-määritykset esimerkki tiedostoineen.
VIRTA-julkaisutietojen siirrossa organisaatioiden lähdejärjestelmistä tietovarantoon CERIF on kuitenkin todettu liian työlääksi soveltaa. VIRTA-julkaisutietopalvelu tukee kuitenkin jatkossa tietojen lukemista tietovarannosta ulospäin CERIF-tietomallin mukaisessa muodossa.
Tietojen siirto tutkimusorganisaatiosta VIRTA-julkaisutietopalveluun (klikkaa suuremmaksi):
Kysy lisää
Hanna-Mari Puuska, projektipäällikkö, p. 050 3818 568
Raine Rapo, tekninen vastuuhenkilö
Tip |
---|
VIRTA-julkaisutietopalvelulla on kaksi sähköpostilistaa
Korkeakouluja ja muita organisaatioita pyydetään nimeämään yhteyshenkilönsä ja ilmoittamaan näiden tiedot sähköpostitse: virta-julkaisut@postit.csc.fi |
Tavoitteena on kattava tietovaranto, jonka jatkuvasti päivittyvänä tietosisältönä ovat kaikkien suomalaisten tutkimusorganisaatioiden julkaisut - myös mahdollisilta osin historiasta.