Virta-Julkaisutietopalvelun XML-skeematiedostot. Määritykset on tarkoitettu julkaisutietojen siirtämiseen korkeakouluista ja tutkimuslaitoksista tietovarantoon. Julkaistut tiedostot sisältävät XSD-skeema tiedostot julkaisut.xsd ja tyypit.xsd sekä julkaisu esimerkkejä sisältävä julkaisu_esimerkit.xml. Tietojen validoinnin avuksi on julkaistu myös validoi_xml.ps1 powershell skripti.
XML-tiedostot pohjautuvat julkaisutiedonkeruun määrityksiin ja niihin liittyviin tarpeisiin. Lisätietoja tiedonkeruusta löytyy muun muassa OKM-tiedonkeruun käsikirjoista.
Tiedonsiirtomääritykset ja niihin liittyvät ohjeet ovat vielä työn alla ja skeemaan saattaa tulla vielä muutoksia.
Skeematiedostot
Versio: 1.00
Julkaisupäivämäärä: 31.03.2015
Päivityspäivämäärä: 01.04.2015
Tila: beta
XML-rakennekaavio | julkaisut-kaavio.png |
Skeematiedostot | julkaisut.xsd tyypit.xsd |
Esimerkkitiedostot | julkaisu_esimerkit.xml |
XML-Tiedostojen validointi
XML-tiedostoja voi validoida useita saatavilla olevia työkaluja hyödyntäen. Tällaisia työkaluja ovat mm. XMLlint ja XMLStarlet. Virta tiimi on julkaisut suurten XML-tiedostojen validointia helpottamaan alla olevan työkalun jolla tiedoston muodon oikeellisuuden voi tarkistaa. Skripti perustuu .NET IO.StreamReader ja XMLReader luokkiin, jolloin koko XML-tiedostoa ei tarvitse mahduttaa muistiin kerralla.
Oheinen powershell Skripti ottaa parametreina validoitavan XML-tiedoston (-xml) ja skeeman (-xsd). Anna aina koko polku tiedostoon parametrina. Ison tiedoston validointiin (>2GB) voi mennä koneesta riippuen jopa 20min tai enemmän. XSD-tiedostot viittaavat toisiinsa, eli kopioi skeematiedostot julkaisut.xsd ja tyypit.xsd samaan hakemistoon ennen validointia.
PS C:\Temp> .\validoi_xml.ps1 -xml C:\Temp\julkaisu_esimerkit.xml -xsd C:\Temp\julkaisut.xsd