You are viewing an old version of this page. View the current version.

Compare with Current View Page History

« Previous Version 3 Next »

Yhteisjulkaisujen tarkistus toimii siten, että kun organisaatio lähettää julkaisut Virta-julkaisutietopalveluun, niin tällöin verrataan kutakin näistä julkaisuista Virrassa jo oleviin julkaisuihin. Mikäli tietyt ehdot täyttyvät, identifioidaan julkaisu yhteisjulkaisuksi. Määritellään tässä yhteydessä organisaation sillä hetkellä lähettämiä datoja SA-alueen (Staging Area) datoiksi ja Virrassa jo ennestään olevia datoja DW-alueen (Data Warehouse) -datoiksi. Yhteisjulkaisujen tunnistuksissa käytetään seuraavia ehtoja:

EhtoKentät, joiden pitää matchata SA- ja ODS -alueillaErityishuomioita
1DOI
  • Jos SA- ja ODS alueiden julkaisuissa kummassakin julkaisutyyppi on A3, mutta julkaisujen nimet ovat eri, ei julkaisua identifioida yhteisjulkaisuksi, vaikka DOIn perusteella näin olisi.
2ISSN + volyymi + numero + sivut + julkaisun nimi
  • Jos SA- ja ODS -alueiden julkaisuille on ilmoitettu DOI-tunnukset ja ne ovat eri, niin kyseessä ei ole yhteisjulkaisu, vaikka ehto 2 olisikin totta.
3julkaisutyyppi + julkaisun nimi + kustantaja
  • Koskee julkaisutyyppeja C1, D5, E2, pl. Introduction, Esipuhe, Johdanto.
  • Jos SA- ja ODS -alueiden julkaisuille on ilmoitettu DOI-tunnukset ja ne ovat eri, niin kyseessä ei ole yhteisjulkaisu, vaikka ehto 3 olisikin totta.
4emojulkaisun nimi + julkaisun nimi
  • Koskee julkaisutyyppeja A3, A4, B2, B3, D1, D2, D3, E1, pl. Introduction, Esipuhe, Johdanto.
  • Jos SA- ja ODS -alueiden julkaisuille on ilmoitettu DOI-tunnukset ja ne ovat eri, niin kyseessä ei ole yhteisjulkaisu, vaikka ehto 4 olisikin totta.
5ISBN + julkaisun nimi
  • Jos SA- ja ODS -alueiden julkaisuille on ilmoitettu DOI-tunnukset ja ne ovat eri, niin kyseessä ei ole yhteisjulkaisu, vaikka ehto 5 olisikin totta.

Yllä olevaa taulukkoa luetaan siten, että jos ehto 1 täyttyy, eli SA- ja ODS -alueiden julkaisuilla on sama DOI, niin kyseessä on yhteisjulkaisuehdokas. Jos sen sijaan ehto 1 ei täyty, niin siirrytään ehtoon 2 jne. Jos ehdon 5 jälkeen ei olla löydetty yhteisjulkaisua, ei kyseessä ole yhteisjulkaisuehdokas.

Ennen kuin kenttien matchausta tehdään, dataa puhdistetaan sekä SA- että ODS -alueilla, jotta tunnistaminen onnistuisi paremmin. Esimerkiksi DOI-tunnuksista poistetaan alusta merkkejä siihen asti kunnes merkkijono alkaa kuten "10.". Näin ollen esimerkiksi DOI-tunnus http://dx.doi.org/10.1016/j.tsf.2014.04.093 muutetaan väliaikaisesti tarkistuksia varten muotoon 10.1016/j.tsf.2014.04.093. Lisäksi julkaisun, kustantajan ja emojulkaisun nimien vertailuissa on mukana noin 130 stop wordsia, joita ei oteta huomioon. Edelleen mukana on noin 70 merkkiä, joita ei huomioida. Esimerkkijä stop wordseista ovat "me", "has" ja "few" ja merkeistä "!", "[", ja "«".

Jos mikään ehdoista 1-5 ei täyty, ei kyseessä ole yhteisjulkaisuehdokas. Jos kuitenkin jokin ehdoista 1-5 täyttyy erityishuomiot mukaanlukien, niin tarkistetaan lisäksi seuraavat ehdot:

  • SA- ja ODS -alueiden julkaisuissa organisaatiotunnuksen pitää olla eri (jos on sama organisaatio, niin kyseessä on sisäinen duplikaatti, ei yhteisjulkaisu)
  • Virrassa generoitu julkaisuntunnus (JulkaisunTunnus) pitää olla eri sekä SA- ja DW alueiden julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
  • Organisaation sisäisessä käytössä oleva julkaisuntunnus (JulkaisunOrgTunnus) pitää olla eri sekä SA- ja DW alueen julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
  • SA-alueen julkaisun tilakoodin pitää olla suurempi tai yhtäsuuri kuin 0
  • ODS-alueen julkaisun tilakoodin pitää olla suurempi kuin 0
  • Lopuksi on vielä erityisehto kokoomateoksia varten. Mikäli jokin seuraavista julkaisutyyppikombinaatioista pätee, niin kyseessä ei ole yhteisjulkaisuehdokas, vaikka ehdot 1-5 täyttyisivätkin:
    • SA-alueen julkaisun julkaisutyyppi on C2 ja DW-alueen julkaisun julkaisutyyppi on A3
    • SA-alueen julkaisun julkaisutyyppi on C2 ja DW-alueen julkaisun julkaisutyyppi on B2
    • SA-alueen julkaisun julkaisutyyppi on A3 ja DW-alueen julkaisun julkaisutyyppi on C2
    • SA-alueen julkaisun julkaisutyyppi on B2 ja DW-alueen julkaisun julkaisutyyppi on C2
  • No labels