VIRTA-julkaisutietopalvelun XML-skeematiedostot. Määritykset on tarkoitettu julkaisutietojen siirtämiseen korkeakouluista ja tutkimuslaitoksista tietovarantoon. Julkaistut tiedostot sisältävät XSD-skeematiedostot julkaisut.xsd ja tyypit.xsd sekä julkaisuesimerkkejä sisältävä julkaisu_esimerkit.xml. Tietojen validoinnin avuksi on julkaistu myös validoi_xml.ps1 powershell-skripti.
XML-tiedostot pohjautuvat OKM:n julkaisutiedonkeruun määrityksiin ja niihin liittyviin tarpeisiin. Lisätietoja tiedonkeruusta löytyy muun muassa OKM:n tiedonkeruukäsikirjoista.
Tiedonsiirtomääritykset ja niihin liittyvät ohjeet ovat vielä työn alla, ja skeemaan saattaa tulla vielä muutoksia.
Skeematiedostot
Versio: 1.00
Julkaisupäivämäärä: 31.03.2015
Päivityspäivämäärä: 14.04.2015
Tila: beta
XML-rakennekaavio | julkaisut-kaavio.png |
Skeematiedostot | julkaisut.xsd tyypit.xsd |
Esimerkkitiedostot | julkaisu_esimerkit.xml |
XML-tiedostojen validointi
XML-tiedostoja voi validoida useita saatavilla olevia työkaluja hyödyntäen. Tällaisia työkaluja ovat mm. XMLlint ja XMLStarlet. VIRTA-tiimi on julkaissut suurten XML-tiedostojen validointia helpottamaan alla olevan työkalun, jolla tiedoston muodon oikeellisuuden voi tarkistaa. Skripti perustuu .NET IO.StreamReader ja XMLReader -luokkiin, jolloin koko XML-tiedostoa ei tarvitse mahduttaa muistiin kerralla.
Oheinen powershell-skripti ottaa parametreina validoitavan XML-tiedoston (-xml) ja skeeman (-xsd). Anna aina koko polku tiedostoon parametrina. Ison tiedoston validointiin (>2GB) voi mennä koneesta riippuen jopa 20 min tai enemmän. XSD-tiedostot viittaavat toisiinsa, eli kopioi skeematiedostot julkaisut.xsd ja tyypit.xsd samaan hakemistoon ennen validointia.
PS C:\Temp> .\validoi_xml.ps1 -xml C:\Temp\julkaisu_esimerkit.xml -xsd C:\Temp\julkaisut.xsd