Tietovarantoon toimitettuja julkaisuja käsitellään yhteisjulkaisuiden osalta seuraavan prosessin mukaisesti:
1) Julkaisuiden vertailussa jätetään huomioitta julkaisut joiden tilakoodi on 0 tai -1
2) Julkaisua verrataan muihin tietovarantoon toimitettuihin julkaisuihin ja mahdollisesti tunnistetaan yhteisjulkaisuksi (ks. alla) tai organisaation sisäiseksi duplikaatiksi (ks. Duplikaattien tunnistussäännöt)
3) Mikäli julkaisu tunnistetaan yhteisjulkaisuksi, muodostetaan uusi yhteisjulkaisutietue, jolle poimitaan määrätysti tiedot kaikkien osajulkaisuiden kesken (ks. Yhteisjulkaisujen käsittely).
- Muodostettu yhteisjulkaisu korvaa alkuperäiset esim. tiedejatutkimus.fi:ssä
- Kaikkien organisaatioiden alkuperäiset tiedot säilytetään omina tietueinaan, vaikka julkaisu olisikin tunnistettu yhteisjulkaisuksi ja siitä olisi muodostettu uusi yhteisjulkaisutietue
4) Mahdolliset ristiriitaiset tiedot näkyvät kaikille yhteisjulkaisun raportoineille organisaatioille virheraportilla sekä Extra-Vipusen "yhteisjulkaisut ristiriitaiset" -raportilla
Julkaisutietojen käsittely ennen tarkistuksia
Organisaation lähettämät uudet datat määritellään SA-alueen ("Staging Area") dataksi ja Virrassa jo ennestään olevat datat ODS-alueen (Operational Data Store) -dataksi.
Ennen kuin kenttien yhteneväisyydet tarkistetaan, dataa puhdistetaan sekä SA- että ODS -alueilla, jotta tunnistaminen onnistuisi paremmin.
- Esimerkiksi DOI-tunnuksista poistetaan alusta merkkejä siihen asti kunnes merkkijono alkaa kuten "10.". Näin ollen esimerkiksi DOI-tunnus http://dx.doi.org/10.1016/j.tsf.2014.04.093 muutetaan väliaikaisesti tarkistuksia varten muotoon 10.1016/j.tsf.2014.04.093.
- Lisäksi julkaisun, kustantajan ja emojulkaisun nimien vertailuissa on mukana noin 130 ns. "stop wordsia", joita ei oteta huomioon. Mukana on myös noin 70 merkkiä, joita ei huomioida. Esimerkkejä stop wordseista ovat "and", "has" ja "few" ja merkeistä "&", "[", ja "«", ks. Tarkistuksissa ohitettavat sanat ja merkit.
Yhteisjulkaisun tunnistussäännöt
Oheisia ehtoja tarkistetaan järjestyksessä ensimmäisestä viimeisimpään, ja ehtojen tarkistaminen päätetään, mikäli vastaavuus on löytynyt.
- Mikäli ehto 1 täyttyy, eli SA- ja ODS -alueiden julkaisuilla on sama DOI, niin kyseessä on yhteisjulkaisuehdokas.
- Jos ehto 1 ei täyty, siirrytään tarkistamaan täyttyykö ehdon 2. mukaiset vaatimukset, jne.
- Jos mikään ehdoista 1-5 ei täyty, ei kyseessä ole yhteisjulkaisuehdokas
Ehto | Kentät, joiden pitää matchata SA- ja ODS -alueilla | Erityishuomioita |
---|---|---|
1 | DOI |
|
2 | ISSN + volyymi + numero + sivut + julkaisun nimi |
|
3 | julkaisutyyppi + julkaisun nimi + kustantaja |
|
4 | emojulkaisun nimi + julkaisun nimi |
|
5 | ISBN + julkaisun nimi |
|
6 | julkaisutyyppi + julkaisun nimi + lehden nimi + julkaisuvuosi |
|
7 | julkaisutyyppi + julkaisun nimi + kustantajan nimi + julkaisuvuosi |
|
8 | julkaisutyyppi + julkaisun nimi + julkaisuvuosi + AVsovellustyyppiKoodi |
|
9 | julkaisutyyppi (ainoastaan Virran sisäisessä käytössä) + julkaisun nimi + julkaisuvuosi |
|
Jos jokin ehdoista 1-5 täyttyy (erityishuomiot mukaan lukien), tarkistetaan lisäksi seuraavat ehdot:
- SA- ja ODS -alueiden julkaisuissa organisaatiotunnuksen täytyy olla eri (jos on sama organisaatio, niin kyseessä on sisäinen duplikaatti, ei yhteisjulkaisu)
- Virrassa generoitu julkaisun tunnus (julkaisunTunnus) pitää olla eri sekä SA- ja ODS alueiden julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
- Organisaation sisäisessä käytössä oleva julkaisuntunnus (JulkaisunOrgTunnus) pitää olla eri sekä SA- ja ODS alueen julkaisuilla (jos se on sama, niin kyseessä on sama julkaisu)
- Julkaisun tilakoodi SA-alueella pitää olla suurempi tai yhtäsuuri kuin 0
- Julkaisun tilakoodi ODS-alueella pitää olla suurempi kuin 0
Lopuksi on vielä erityisehto tietyille julkaisutyyppipareille. Mikäli jokin seuraavista julkaisutyyppikombinaatioista pätee, niin kyseessä ei ole yhteisjulkaisuehdokas, vaikka ehdot 1-5 täyttyisivätkin:
SA (ODS) -alueen julkaisutyyppi | ODS (SA) -alueen julkaisutyyppi |
---|---|
B3 | C2 |
B3 | D6 |
B3 | E3 |
C2 | A1 |
C2 | A2 |
C2 | A3 |
C2 | A4 |
C2 | B2 |
C2 | D1 |
C2 | D2 |
C2 | D3 |
E3 | A1 |
E3 | A2 |
E3 | A4 |
E3 | D1 |
E3 | D2 |
E3 | D3 |
D6 | A1 |
D6 | A2 |
D6 | A4 |
D6 | D1 |
D6 | D2 |
D6 | D3 |
Yhteisjulkaisun tunnuksen asettaminen:
Jos ODS-alueen julkaisu on jo ennestään julkaisu jonkin toisen julkaisun/julkaisujen kanssa, ts. sen Yhteisjulkaisu_ID > 0, niin asetetaan SA-alueen julkaisulle kyseinen Yhteisjulkaisu_ID.
Jos kyseessä on uusi yhteisjulkaisu, ts. ODS-alueen julkaisulle Yhteisjulkaisu_ID = 0, niin asetetaan kummallekin, sekä SA- että ODS -alueen, julkaisulle uusi Yhteisjulkaisu_ID, joka on yhden suurempi kuin aikaisempi suurin arvo.
Yhteisjulkaisulle määrittettävät tiedot
Ks. Yhteisjulkaisujen käsittely