Yhteisjulkaisujen tarkistus toimii siten, että kun organisaatio lähettää julkaisut Virta-julkaisutietopalveluun, niin tällöin verrataan kutakin näistä julkaisuista Virrassa jo oleviin julkaisuihin. Mikäli tietyt ehdot täyttyvät, identifioidaan julkaisu yhteisjulkaisuksi. Määritellään tässä yhteydessä organisaation sillä hetkellä lähettämiä datoja SA-alueen (Staging Area) datoiksi ja Virrassa jo ennestään olevia datoja ODS-alueen (Operational Data Store) -datoiksi. Yhteisjulkaisujen tunnistuksissa käytetään seuraavia ehtoja:
Ehto | Kentät, joiden pitää matchata SA- ja ODS -alueilla | Erityishuomioita |
---|---|---|
1 | DOI |
|
2 | ISSN + volyymi + numero + sivut + julkaisun nimi |
|
3 | julkaisutyyppi + julkaisun nimi + kustantaja |
|
4 | emojulkaisun nimi + julkaisun nimi |
|
5 | ISBN + julkaisun nimi |
|
Yllä olevaa taulukkoa luetaan siten, että jos ehto 1 täyttyy, eli SA- ja ODS -alueiden julkaisuilla on sama DOI, niin kyseessä on yhteisjulkaisuehdokas. Jos sen sijaan ehto 1 ei täyty, niin siirrytään ehtoon 2 jne. Jos ehdon 5 jälkeen ei olla löydetty yhteisjulkaisua, ei kyseessä ole yhteisjulkaisuehdokas.
Ennen kuin kenttien matchausta tehdään, dataa puhdistetaan sekä SA- että ODS -alueilla, jotta tunnistaminen onnistuisi paremmin. Esimerkiksi DOI-tunnuksista poistetaan alusta merkkejä siihen asti kunnes merkkijono alkaa kuten "10.". Näin ollen esimerkiksi DOI-tunnus http://dx.doi.org/10.1016/j.tsf.2014.04.093 muutetaan väliaikaisesti tarkistuksia varten muotoon 10.1016/j.tsf.2014.04.093. Lisäksi julkaisun, kustantajan ja emojulkaisun nimien vertailuissa on mukana noin 130 stop wordsia, joita ei oteta huomioon. Edelleen mukana on noin 70 merkkiä, joita ei huomioida. Esimerkkejä stop wordseista ovat "and", "has" ja "few" ja merkeistä "&", "[", ja "«".
Jos mikään ehdoista 1-5 ei täyty, ei kyseessä ole yhteisjulkaisuehdokas. Jos kuitenkin jokin ehdoista 1-5 täyttyy erityishuomiot mukaanlukien, niin tarkistetaan lisäksi seuraavat ehdot
- SA- ja ODS -alueiden julkaisuissa organisaatiotunnuksen pitää olla eri (jos on sama organisaatio, niin kyseessä on sisäinen duplikaatti, ei yhteisjulkaisu)
- Virrassa generoitu julkaisuntunnus (JulkaisunTunnus) pitää olla eri sekä SA- ja ODS alueiden julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
- Organisaation sisäisessä käytössä oleva julkaisuntunnus (JulkaisunOrgTunnus) pitää olla eri sekä SA- ja ODS alueen julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
- SA-alueen julkaisun tilakoodin pitää olla suurempi tai yhtäsuuri kuin 0
- ODS-alueen julkaisun tilakoodin pitää olla suurempi kuin 0
- Jos ODS-alueen julkaisu on jo ennestään julkaisu jonkin toisen julkaisun/julkaisujen kanssa, ts. sen Yhteisjulkaisu_ID > 0, niin asetetaan SA-alueen julkaisulle kyseinen Yhteisjulkaisu_ID. Jos sen sijaan kyseessä on uusi yhteisjulkaisu, ts. ODS-alueen julkaisulle Yhteisjulkaisu_ID = 0, niin asetetaan kummallekin, sekä SA- että ODS -alueen, julkaisulle uusi Yhteisjulkaisu_ID, joka on yhden suurempi kuin aikaisempi suurin arvo.
Lopuksi on vielä erityisehto julkaisutyyppipareille. Mikäli jokin seuraavista julkaisutyyppikombinaatioista pätee, niin kyseessä ei ole yhteisjulkaisuehdokas, vaikka ehdot 1-5 täyttyisivätkin:
SA (ODS) -alueen julkaisutyyppi ODS (SA) -alueen julkaisutyyppi B3 C2 B3 D6 B3 E3 C2 A1 C2 A2 C2 A3 C2 A4 C2 B2 C2 D1 C2 D2 C2 D3 E3 A1 E3 A2 E3 A4 E3 D1 E3 D2 E3 D3 D6 A1 D6 A2 D6 A4 D6 D1 D6 D2 D6 D3