Sisäisten duplikaattien tarkistus toimii siten, että kun organisaatio lähettää julkaisut Virta-julkaisutietopalveluun, niin tällöin verrataan kutakin näistä julkaisuista Virrassa jo oleviin julkaisuihin. Mikäli tietyt ehdot täyttyvät, identifioidaan julkaisu sisäiseksi duplikaatiksi. Määritellään tässä yhteydessä organisaation sillä hetkellä lähettämiä datoja SA-alueen (Staging Area) datoiksi ja Virrassa jo ennestään olevia datoja ODS-alueen (Operational Data Store) -datoiksi. Duplikaattien tunnistuksissa käytetään seuraavia ehtoja:
Ehto | Kentät, joiden pitää matchata olla identtiset SA- ja ODS -alueilla | Erityishuomioita |
---|---|---|
1 | DOI |
|
2 | ISSN + volyymi + numero + sivut + julkaisun nimi |
|
3 | julkaisutyyppi + julkaisun nimi + kustantaja |
|
4 | emojulkaisun nimi + julkaisun nimi |
|
5 | ISBN + julkaisun nimi |
|
...
- SA- ja ODS -alueiden julkaisuissa organisaatiotunnuksen pitää olla sama (jos on eri organisaatiot, niin ei voi olla sisäinen duplikaatti)
- Virrassa generoitu julkaisuntunnus (JulkaisunTunnus) pitää olla eri sekä SA- ja ODS alueiden julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu eikä mahdollinen duplikaatti)
- Organisaation sisäisessä käytössä oleva julkaisuntunnus (JulkaisunOrgTunnus) pitää olla eri sekä SA- ja ODS alueen julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu eikä mahdollinen duplikaatti)
- SA-alueen julkaisun tilakoodin pitää olla suurempi tai yhtäsuuri kuin 0
- ODS-alueen julkaisun tilakoodin pitää olla suurempi kuin 0
Lopuksi on vielä erityisehto julkaisutyyppipareille. Mikäli jokin seuraavista julkaisutyyppikombinaatioista pätee, niin kyseessä ei ole duplikaattiehdokas, vaikka ehdot 1-5 täyttyisivätkin:
SA (ODS) -alueen julkaisutyyppi ODS (SA) -alueen julkaisutyyppi B3 C2 B3 D6 B3 E3 C2 A1 C2 A2 C2 A3 C2 A4 C2 B2 C2 D1 C2 D2 C2 D3 E3 A1 E3 A2 E3 A4 E3 D1 E3 D2 E3 D3 D6 A1 D6 A2 D6 A4 D6 D1 D6 D2 D6 D3