Viittaustietokannat
Viittaustietokannat sisältävät tiedon tietokannassa olevista julkaisuista sekä niiden välisistä viittauksista. Viittaustiedot kertovat, kuinka usein muissa tietokantaan kuuluvissa julkaisuissa on viitattu tarkasteltavaan julkaisuun. Viittaustietokannoista voi tarkastella yksittäisen julkaisun keräämien viittausmäärien lisäksi tyypillisesti mm. sitä, kuinka monta kertaa tiettyyn kirjoittajaan tai tietyn organisaation julkaisuihin on viitattu. Julkaisun saamien viittausten lukumäärä eri tietokannoissa vaihtelee. Viittaustietokannat keskittyvät yleensä tieteellisiin lehtiartikkeleihin, mutta ne voivat sisältää myös monografioita, konferenssijulkaisuja ja raportteja. Mikään viittaustietokanta ei kata kaikkia julkaisuja. On myös hyvä tiedostaa, että tietyt tieteenalat ovat edustettuna tietokannoissa paremmin (esim. lääke- ja luonnontieteet) kuin toiset (esim. yhteiskunta- ja humanistiset tieteet sekä taidealat). Viittausten lukumäärä tietokannoissa riippuu myös siitä, kuinka pitkältä ajalta tietokanta sisältää viittaustietoa ja kuinka usein viittaustiedot päivitetään tietokantaan. Kaikissa tietokannoissa on myös jonkin verran virheitä. Tietokantojen sisältö myös muuttuu jatkuvasti, koska ne lisäävät uusia aineistoja kokoelmaansa ja poistavat entisiä sekä päivittävät viittaustietoja vanhempien julkaisujen osalta.
Kaksi tunnetuinta monitieteistä viittaustietokantaa ovat maksulliset lisenssiperusteiset Clarivate Analyticsin Web of Science (Wos) ja Elsevierin Scopus. Sekä WoS että Scopus sisältävät kuratoitua aineistoa ja niillä on tietyt laatukriteerit tietokantansa sisällölle: lehdillä pitää mm. olla vertaisarviointiprosessi ja toimituskunta, ISSN numero ja tiettyjä kielivaatimuksia. Viittaustietoja voi tarkastella myös avoimesti saatavilla olevista Dimensions ja Google Scholar (GS) palveluista. Sekä Dimensions että GS indeksoivat automaattisin menetelmin aineistoja kokoelmiinsa ilman erillistä validointiprosessia. Dimensions -tietokannan perussisältö ja toiminnot ovat tarjolla avoimesti ja maksuttomasti. Maksaville tilaajille on lisäksi tarjolla sisällöltään laajempi ja monipuolisempia analyysitoimintoja sisältävä versio. GS on maksuton hakukone, ei siis varsinainen viittaustietokanta. GS on erikoistunut tieteellisen tiedon etsimiseen, mutta viittausdata sisältää myös paljon ei tieteellisiä viittauksia, joten viittausmäärät eroavat suuresti WoS ja Scopus kantojen lukemista. Kaikki neljä edellä mainittua tietokantaa on esitelty tarkemmin omissa luvuissaan.
Viittaustietokantojen vertailua
Koska viittaustietokantojen aineistojen indeksointimenetelmät ja kokoelmapoliittiset linjaukset ovat keskenään hyvin erilaisia, eroavat myös tietokantojen sisällöt merkittävästi toisistaan. WoS ja Scopus noudattavat valikoivaa kokoelmapolitiikkaa ja käyttävät eri alojen asiantuntijoista koostuvaa toimituskuntaa sisältönsä valintaan ja indeksointiin. Dimensions nojaa laajasti koneoppimiseen ja automatisoiduilla algoritmeilla tapahtuvaan tiedonkäsittelyyn, asiantuntijoiden manuaalisesti suorittaman kuratoinnin sijaan. Dimensions indeksoi pääsääntöisesti kaikki tieteelliset julkaisut ja datasetit, joilla on DOI-tunniste. Google Scholarin automatisoidut menetelmät puolestaan kahlaavat verkkoa ja indeksoivat kaikki julkaisut, joilla on näennäisesti akateeminen rakenne.
Tieteenalojen julkaisukäytännöt kuten julkaisutyyppi ja julkaisukieli vaikuttavat kattavuuteen. Perinteiset viittaustietokannat kuten WoS ja Scopus sisältävät pääsääntöisesti tieteellisiä lehtiä. Erityisesti tieteenalat, joille on tyypillistä julkaista kirjoissa, ovat huonosti edustettuina kyseisissä tietokannoissa. Myös konferenssijulkaisujen osalta on puutteita. Huonointa kattavuus on tyypillisesti yhteiskuntatieteiden ja humanististen tieteiden osalta. Myös tietokantojen keskittyminen pääasiassa englanninkieliseen kirjallisuuteen aiheuttaa omat rajoitteensa kattavuuteen. Vaikka tietokantoihin hyväksytään myös muun kuin englanninkielisiä julkaisuja, yhtenä valintakriteerinä on kuitenkin julkaisukanavissa julkaistavien artikkeleiden englanninkieliset tiivistelmät ja otsikot. Automaattisiin indeksointimenetelmiin perustuvat modernimmat tietokannat Dimensions ja GS, yltävät merkittävästi parempaan kattavuuteen useimmilla tieteenaloilla. Dimensions on huomattavan paljon kattavampi kuin WoS tai Scopus erityisesti toimitettujen kirjojen, niiden sisältämien kappaleiden, sekä monografioiden osalta.
Tietokantojen eroista ja siitä, miten hyvin ne kattavat eri tieteenalojen aineistoja, on tehty lukuisia tutkimuksia. Useat tutkimukset osoittavat WoS Core Collection tietokannan kattavuuden monien tieteenalojen osalta heikommaksi kuin kilpailevissa tietokannoissa (mm. Mongeon, P. & Paul-Hus, A. 2016, Martín-Martín, A. et al. 2021, Singh, V.K. et al. 2021, Visser, M. et al. 2021). Tässä oppaassa esitellyistä tietokannoista kattavuudeltaan parhaimmaksi lähes kaikkien tieteenalojen osalta nousee useissa tutkimuksissa GS (mm. Harzing, A.-W. 2019, Martín-Martín, A. et al. 2021). Tuoreita tutkimuksia viitetietokantojen aineiston kattavuudesta on listattu tämän luvun loppuun. Lisäksi liitetiedostona on Jyväskylän yliopiston julkaisutuotannon perusteella tehty tietokantavertailu.
Tietokantaa valittaessa, aineiston kattavuus ei ole kuitenkaan ainoa kriteeri. Myös tietokannan hakutoiminnoilla ja indeksoidun aineiston laadulla on merkitystä. Vaikka GS yltää kilpailijoitaan parempaan kattavuuteen, on sen hakutoiminnoissa paljon rajoitteita, kuten rajoitettu Boolen operaattoreiden käyttö sekä hyvin rajalliset suodatusominaisuudet hakutulokselle. Perinteiset, pitkään markkinoilla olleet Web of Science ja Scopus ovat kattavuudeltaan kilpailijoita heikompia, aineiston indeksointi tietokantaan on hitaampaa ja ne ovat maksullisia. Toisaalta molempien hakutoiminnot ovat monipuoliset ja niiden indeksoima aineisto on validoitua. Viittaustietokantojen vertailua helpottamaan on taulukkoon 1. kerätty tiedot Web of Science, Scopus, Dimensioins ja Google Scholar tietokantojen keskeisistä ominaisuuksista ja sisällöistä. Vastuullisen julkaisumetriikan nimissä, analyysissä käytettävä viittaustietokanta tulisi valita käyttötarpeen lisäksi, analysoinnin kohteena olevan tieteenalan tarpeet huomioiden. Mikäli mahdollista, on suositeltavaa käyttää julkaisuperusteisissa analyyseissä useampaa kuin yhtä viittaustietokantaa.
Ominaisuus | Web of Science | Scopus | Dimensions | Google Scholar |
---|---|---|---|---|
Saatavuus | Maksullinen | Maksullinen | Perussisältö ja -toiminnot avoimesti saatavilla, edistyneempi käyttö ja kattavammat sisällöt ovat maksulliset. | Avoimesti saatavilla |
Julkaisukanavien lkm. | ~22 000 | ~24 000 | ~45 500 | Ei julkinen |
Muu sisältö | Julkaisut: konferenssijulkaisuja, monografioita. Pienissä määrin myös muita julkaisutyyppejä. Sisältää lisäksi tietoa rahoittajista | Julkaisut: konferenssijulkaisuja, monografioita, kirjan/kokoomateoksen osia, ammattilehtiä ja patentteja. Pienissä määrin myös muita julkaisutyyppejä. Sisältää lisäksi tietoa rahoittajista | Julkaisut: kirjan/kokoomateoksen osia, konferenssijulkaisuja, preprinttejä, monografioita, patentteja ja yhteiskunnallisia julkaisuja Sisältää lisäksi tietoa dataseteistä, tutkimuksen rahoituksesta ja kliinisistä kokeista. Tieteelliset julkaisut ja tiedot dataseteistä sisältyvät ilmaisversioon. Muu sisältö maksullista. | Konferenssijulkaisuja, monografioita, preprinttejä, opinnäytteitä, ppt-esityksiä, www-sivuja |
Keskeisimmät alat | Luonnontieteet, lääketiede, tekniikka, yhteiskuntatieteet, taiteet ja humanistiset tieteet | Luonnontieteet, tekniikka, terveystieteet, yhteiskuntatieteet, taiteet ja humanistiset tieteet | Pyrkii kattamaan tasapuolisesti eri tieteenalat. Parhainta kattavuus on aloilla: luonnontieteet, lääketiede, tekniikka ja yhteiskuntatieteet | Ei julkinen |
Ajallinen kattavuus | Vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities), aineiston saatavuus riippuu organisaation hankkimista lisensseistä | Kattavuus vaihtelee, osa lehdistä 1780-luvulle asti, viitteissä lähdetiedot 1970 lähtien | Vanhimmat julkaisut 1600-luvulta Ei erillistä linjausta indeksoitavan aineiston iästä, indeksoi pääsääntöisesti kaikki julkaisut, joilla on DOI-tunniste. | Ei julkinen |
Kielellinen kattavuus ja indeksoitavan aineiston kielivaatimukset | Sisältää pääsääntöisesti englanninkielistä aineistoa. Pienessä määrin myös muunkielistä aineistoa. Indeksoitavaksi hyväksyttävien julkaisukanavien artikkeleiden otsikko ja tiivistelmä tulee olla englanninkielinen. | Sisältää pääsääntöisesti englanninkielistä aineistoa. Pienessä määrin myös muunkielistä aineistoa. Indeksoitavaksi hyväksyttävien julkaisukanavien artikkeleiden otsikko ja tiivistelmä tulee olla englanninkielinen. | Sisältää pääsääntöisesti englanninkielistä aineistoa. Myös muunkielistä aineistoa jos sillä on DOI -tunniste. Julkaisu-, patentti ja apurahatietoja myös muilla kielillä. Ei erillisiä kielellisiä vaatimuksia indeksoitavalle aineistolle. Apuraha- ja patenttitiedoissa käytetään tiivistelmien ja otsikoiden automaattista konekäännöstä. | Ei julkinen mutta sisältää englanninkielisen aineiston lisäksi myös muunkielistä aineistoa. |
Kokoelmapolitiikka | Julkinen | Julkinen | Ei erillistä kokoelmapolitiikkaa. Indeksoi pääsääntöisesti kaikki julkaisut, joilla on DOI-tunniste. | Ei julkinen, sopimus useimpien merkittävien kustantajien kanssa |
Viittausanalyysi | Citation Report -työkalu | Citation Overview -työkalu | Analytical Views hakutuloksen yleisnäkymä sekä erilliset näkymät tieteenaloille, tutkijoille ja julkaisukanaville | Hakutulosten yhteydessä Cited by -linkki, josta saa näkyviin julkaisuun viittaavat julkaisut sekä näkee viittausten määrän per julkaisu. |
Viittaustietojen ajallinen kattavuus | Vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities) | Vuodesta 1970 | Vaihtelee eri julkaisukanavien mukaan. | Ei julkinen |
Indikaattoreita | Viittausten määrä, keskimääräinen viittausmäärä per julkaisu, keskimääräinen viittausmäärä per julkaisuvuosi, viittausmäärät vuosittain, h-indeksi, tietueen käyttötilasto (kuinka monta kertaa yksittäinen tietue on joko ladattu viiteidenhallintajärjestelmään tai avattu julkaisun kokoteksti) | Viittausten määrä, viittausmäärät vuosittain, h-indeksi, tietueen katsontakerrat, PlumX käyttötilastoja kuvaavia indikaattoreita, tieteenalanormalisoitu viittausvaikuttavuus ja julkaisukanavanormalisoitu viittausvaikuttavuus (onko oikeat suomennokset mittareista Field-Weighted Citation Impact ja Source normalized impact per paper (SNIP)) | Viittausten määrä, viittausten määrä viimeiseltä kahdelta vuodelta, keskimääräinen viittausmäärä per julkaisu, keskimääräinen viittausmäärä per julkaisuvuosi, altmetrikkapisteet (Altmetric Attention Score), tieteenalanormalisoitu viittaussuhde (Relative Citation Ratio), Field Citation Ratio → KUINKA KÄÄNNETÄÄN, VAI TARVIIKO KÄÄNTÄÄ KOSKA ON ASIAN ERISNIMI? | Viittausten määrä per julkaisu Google Scholar profiilissa lisäksi tutkijakohtainen viittausmäärä, H-indeksi ja i10 -indeksi kaikilta vuosilta sekä vuodesta 2017 alkean. |
Dataa hyödyntäviä yliopisto-rankingeja | Academic Ranking of World Universities (ARWU) eli Shanghai Ranking University Ranking by Academic Performance (URAP) U.S. News & World Report's Best Global Universities Rankings U-Multirank National Taiwan University (NTU) Ranking CWTS Leiden Ranking CWUR (Center for World University Ranking, United Arab Emirates) Round University Ranking (RUR) Suomen Akatemian Tieteen tila -raportit | Times Higher Education World University Ranking Times Higher Education Impact Ranking QS Ranking Suomen Akatemian Tieteen tila -raportit | Ei tiedossa rankingeja, jotka hyödyntävät Dimensions dataa | Ei tiedossa rankingeja, jotka hyödyntävät Google Scholar dataa |
Tutkijaprofiili | ResearcherID/Publons | Scopus Author Identifier | Dimensions researcher profile | Google Scholar Profile |
Dataa hyödyntäviä työkaluja | InCites, Journal Citation Reports, Eigenfactor, ScienceWatch, Publish or Perish | SciVal, SCImago Journal and Country Rank, CWTS Journal Indicators, Publish or Perish | Dimensions Analytics, JYUcite | Publish or Perish |
Puuttuuko taulukosta jotakin olennaista? |
Taulukossa 1. on yhteenveto neljän keskeisimmän monitieteellisen viittaustietokannan ominaisuuksista.
Lähteet:
Harzing, A.-W. (2019). Two new kids on the block: How do Crossref and Dimensions compare with Google Scholar, Microsoft Academic, Scopus and the Web of Science? Scientometrics, 120(1), 341–349. DOI: https://doi.org/10.1007/s11192-019-03114-y
Martín-Martín, A. & Thelwall, M. & Orduna-Malea, E. & López-Cózar, E.D. 2021 Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics 126: S. 871–906. doi: https://doi.org/10.1007/s11192-020-03690-4
Mongeon, P. & Paul-Hus, A. (2016). The journal coverage of Web of Science and Scopus: a comparative analysis. Scientometrics 106, pp. 213–228. https://doi.org/10.1007/s11192-015-1765-5
Singh, V.K., Singh, P., Karmakar, M. et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics 126, 5113–5142 (2021). https://doi.org/10.1007/s11192-021-03948-5
Visser, M. & van Eck, N.J. & Waltman, L. 2021. Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies 2(1): S. 20–41. doi: https://doi.org/10.1162/qss_a_00112
Viimeaikaisia viitetietokantojen kattavuutta ja ominaisuuksia käsitteleviä tutkimuksia:
Baas, J., Schotten, M., Plume, A., Côté, G., & Karimi, R. (2020). Scopus as a curated, high-quality bibliometric data source for academic research in quantitative science studies. Quantitative Science Studies, 1(1), 377–386. DOI: https://doi.org/10.1162/qss_a_00019
Birkle, C., Pendlebury, D. A., Schnell, J., & Adams, J. (2020). Web of Science as a data source for research on scientific and scholarly activity. Quantitative Science Studies, 1(1), 363–376. DOI: https://doi.org/10.1162/qss_a_00018
Harzing, A.-W. (2019). Two new kids on the block: How do Crossref and Dimensions compare with Google Scholar, Microsoft Academic, Scopus and the Web of Science? Scientometrics, 120(1), 341–349. DOI: https://doi.org/10.1007/s11192-019-03114-y
Herzog, C., Hook, D., & Konkiel, S. (2020). Dimensions: Bringing down barriers between scientometricians and data. Quantitative Science Studies, 1(1), 387–395. DOI: https://doi.org/10.1162/qss_a_00020
Huang, C.-K., Neylon, C., Brookes-Kenworthy, C., Hosking, R., Montgomery, L., ... Ozaygen, A. (2020). Comparison of bibliographic data sources: Implications for the robustness of university rankings. Quantitative Science Studies, 1(2), 445–478. DOI: https://doi.org/10.1162/qss_a_00031
Martín-Martín, A., Orduna-Malea, E., & López-Cózar, E. D. (2018). Coverage of highly-cited documents in Google Scholar, Web of Science, and Scopus: A multidisciplinary comparison. Scientometrics, 116(3), 2175–2188. DOI: https://doi.org/10.1007/s11192-018-2820-9
Martín-Martín, A., Orduna-Malea, E., Thelwall, M., & López-Cózar, E. D. (2018). Google Scholar, Web of Science, and Scopus: A systematic comparison of citations in 252 subject categories. Journal of Informetrics, 12(4), 1160–1177. DOI: https://doi.org/10.1016/j.joi.2018.09.002
Martín-Martín, A., Thelwall, M., Orduna-Malea, E., & López-Cózar, E. D. (2020). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: A multidisciplinary comparison of coverage via citations. arXiv:2004.14329. DOI: https://doi.org/10.1007/s11192-020-03690-4
Martín-Martín, A. & Thelwall, M. & Orduna-Malea, E. & López-Cózar, E.D. 2021 Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics 126: S. 871–906. doi: https://doi.org/10.1007/s11192-020-03690-4
Mongeon, P. & Paul-Hus, A. (2016). The journal coverage of Web of Science and Scopus: a comparative analysis. Scientometrics 106, pp. 213–228. https://doi.org/10.1007/s11192-015-1765-5
Singh, V.K., Singh, P., Karmakar, M. et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics 126, 5113–5142 (2021). https://doi.org/10.1007/s11192-021-03948-5
Visser, M. & van Eck, N.J. & Waltman, L. 2021. Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies 2(1): S. 20–41. doi: https://doi.org/10.1162/qss_a_00112
Waltman, L., & Larivière, V. (2020). Special issue on bibliographic data sources. Quantitative Science Studies, 1(1), 360–362. DOI: https://doi.org/10.1162/qss_e_00026
Jyväskylän yliopiston julkaisutuotannon perusteella tehty tietokantavertailu
Comparing citation database coverage: University of Jyväskylä research publications in Dimensions, Scopus, Web of Science and PubMed. Kyseessä on vielä julkaisematon tuotos. Comparing citatation database coverage _draft.pdf