Tämä sivu on tarkoitettu etenkin teknisille asiantuntijoille, jotka vastaavat tiedonsiirrosta organisaatiossaan. Sivulle on koottu tietoa organisaatioiden tiedonsiirron aikataulusta sekä tietomalleista ja skeemoista. Lue materiaali huolella.

Tietomallit ja skeemat

Siirtoprofiili kuvaa korkeakoulujen järjestelmistä siirrettävän tiedon rakenteen:

XSD-määrittelytiedostot:


Voimassa olevat (11.10.2023 alkaen) Tutkijan tiedot xml-skeemat:

XML-mallitiedostot

19.8.2022 päivitetyt mallitiedostot

Koodistot kertovat eräiden tietotyyppien sallitut arvot:

Tietojen poistaminen tapahtuu poistotiedostoilla.

Tiedonsiirto organisaatioista 

Tiedonsiirtoyhteyden avaaminen

Yhteyden avaamiseksi tietoja tuottavan organisaation tulee lähettää seuraavat tiedot CSC:lle osoitteeseen tiedejatutkimus@csc.fi:

Tiedostomuoto

Organisaatiot lähettävät tiedostot tutkimustietovarantoon XML kuvauksen mukaisena XML-tiedostoina UTF-8 muodossa.

Siirtotiedostossa voidaan tuoda vain joko uudet ja muuttuneet tiedot tai vaihtoehtoisesti aina kaikki tiedot, jolloin ne luetaan aikaisemmin toimitettujen vanhojen tietojen päälle.

CSC antaa tarvittaessa tukea ja ohjeita tiedonsiirtojen tekemistä ja mahdollisuuksien mukaan myös siirtotiedostojen luomista varten.

Testaaminen ja tiedoston nimeäminen

Ainoastaan .xml loppuiset tiedostot ladataan automaattisesti tuotantoon.

Tiedoston nimessä olisi hyvä olla mukana tiedontuottajan nimi ja aikaleima. Muotoa tiedontuottajannimi_yyyyMMddHHmmss.xml.

Pisteitä ja välilyöntejä olisi hyvä välttää tiedoston nimessä. Ne voi korvata tarvittaessa alaviivalla. Esim. tiedontuottajannimi_20200408145433

Yhteyttä ja tiedoston sisältöä voi testata testipalvelimella dwitjutisftp.csc.fi. Testitiedostot eivät automaattisesti siirry käsiteltäväksi ja testaamisesta voi ilmoittaa osoitteeseen tiedejatutkimus@csc.fi

Tiedonsiirto

Tietojen siirtäminen tutkimustietovarantoon tapahtuu suojatun ja varmennetun yhteyden yli. Tiedonsiirto tapahtuu SFTP:llä ja tunnistautuminen SSH-avaimia hyödyntäen. Pääsy itse palvelimelle on rajattu palomuurein ja sallittu ainoastaan nimetyistä IP-osoitteista. Tiedostot lähetetään CSC:n SFTP-palvelimelle dwipjutisftp.csc.fi (tuotanto) ja dwitjutisftp.csc.fi (testi).

Käyttäjätunnus on muotoa JTP_*organisaationtunnus* ja sen alla hakemisto "tutkijan_tiedot", jossa on aktiviteetit, poistot ja tutkijat -hakemistot, jotka kaikki sisältävät omat in/ ja out/ -hakemistonsa. Siirrettävät tiedostot tulee laittaa in/ hakemistoon, toinen hakemistoista on tarkoitettu mahdolliseen tiedon lähettämiseen tietovarannosta organisaation suuntaan. Esimerkiksi organisaatio siirtäisi tutkijan tiedot /JTP_*organisaationtunnus*/tutkijan_tiedot/tutkijat/in -nimiseen kansioon.

Henkilön profiilitiedot siirretään joko ennen tai samanaikaisesti aktiviteetti ja palkinto -tietojen kanssa. Aktiviteetit ja palkinnot, joiden henkilölle ei löydetä aiemmin tai samanaikaisesti siirrettyjä profiilitietoja, eivät yhdisty henkilöön tutkimustietovarannossa. Jos organisaatio on aiemmin siirtänyt aktiviteettien ja palkintojen tietoja, joihin ei ole voitu yhdistää henkilöä, tulee organisaation siirtää henkilöiden tiedot ja tämän jälkeen tai samanaikaisesti aktiviteettien ja palkintojen tiedot uudelleen.

Tietojen korjaaminen

Tietoja voidaan korjata tuomalla ne uudelleen käyttäen samaa tiedonsiirtoyhteyttä ja XML-tiedostojen siirtoa. Tietojen korjaamisen edellytys on kuitenkin paikallisen tunnuksen käyttö, jotta korjaus voidaan viedä oikealle tiedolle. Huomioittehan siis, että paikallinen tunniste pysyy muuttumattomana näiden tietojen korjaamisen osalta XML-tiedostoissa.