Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Yllä olevaa taulukkoa luetaan siten, että jos ehto 1 täyttyy, eli SA- ja ODS -alueiden julkaisuilla on sama DOI, niin kyseessä on duplikaattiehdokas. Jos sen sijaan ehto 1 ei täyty, niin siirrytään ehtoon 2 jne. Jos ehdon 5 jälkeen ei olla löydetty duplikaattiparia, ei kyseessä ole duplikaattiehdokas.

Ennen kuin tunnistusta kenttien matchausta yhteneväisyydestä tehdään, dataa puhdistetaan sekä SA- että ODS -alueilla, jotta tunnistaminen onnistuisi paremmin. Esimerkiksi DOI-tunnuksista poistetaan alusta merkkejä siihen asti kunnes merkkijono alkaa kuten "10.". Näin ollen esimerkiksi DOI-tunnus http://dx.doi.org/10.1016/j.tsf.2014.04.093 muutetaan väliaikaisesti tarkistuksia varten muotoon 10.1016/j.tsf.2014.04.093. Lisäksi julkaisun, kustantajan ja emojulkaisun nimien vertailuissa on mukana noin 130 stop wordsia, joita ei oteta huomioon. Edelleen mukana on noin 70 merkkiä, joita ei huomioida. Esimerkkejä stop wordseista ovat "and", "has" ja "few" ja merkeistä "&", "[", ja "«".

...