Sisältösuunnitelma
Johdannossa:
- Vertailutaulukko luvussa esitettävistä tietokannoista
- Linkit tuoreisiin tietokantavertailuihin + Jyväskylän datan perusteella tehty vertailu liitteenä
Viittaustietokannat
Viittaustietokannat sisältävät tiedon tietokannassa olevista julkaisuista sekä niiden välisistä viittauksista. Viittaustiedot kertovat, kuinka usein muissa tietokantaan kuuluvissa julkaisuissa on viitattu tarkasteltavaan julkaisuun. Viittaustietokannoista voi tarkastella yksittäisen julkaisun keräämien viittausmäärien lisäksi tyypillisesti mm. sitä, kuinka monta kertaa tiettyyn kirjoittajaan tai tietyn organisaation julkaisuihin on viitattu. Julkaisun saamien viittausten lukumäärä eri tietokannoissa vaihtelee. Viittaustietokannat keskittyvät yleensä tieteellisiin lehtiartikkeleihin, mutta ne voivat sisältää myös monografioita, konferenssijulkaisuja ja raportteja. Mikään viittaustietokanta ei kata kaikkia julkaisuja. On myös hyvä tiedostaa, että tietyt tieteenalat ovat edustettuna tietokannoissa paremmin (esim. lääke- ja luonnontieteet) kuin toiset (esim. yhteiskunta- ja humanistiset tieteet sekä taidealat). Viittausten lukumäärä tietokannoissa riippuu myös siitä, kuinka pitkältä ajalta tietokanta sisältää viittaustietoa ja kuinka usein viittaustiedot päivitetään tietokantaan. Kaikissa tietokannoissa on myös jonkin verran virheitä. Tietokantojen sisältö myös muuttuu jatkuvasti, koska ne lisäävät uusia aineistoja kokoelmaansa ja poistavat entisiä sekä päivittävät viittaustietoja vanhempien julkaisujen osalta.
Kaksi tunnetuinta monitieteistä viittaustietokantaa ovat maksulliset lisenssiperusteiset Clarivate Analyticsin Web of Science (Wos) ja Elsevierin Scopus. Sekä WoS että Scopus sisältävät kuratoitua aineistoa ja niillä on tietyt laatukriteerit tietokantansa sisällölle: lehdillä pitää mm. olla vertaisarviointiprosessi ja toimituskunta, ISSN numero ja tiettyjä kielivaatimuksia. Viittaustietoja voi tarkastella myös avoimesti saatavilla olevista Dimensions ja Google Scholar (GS) palveluista. Sekä Dimensions että Google Scholar indeksoivat auttomaattisin menetelmin aineistoja kokoelmiinsa ilman erillistä validointiprosessia. Dimensions tietokannan perussisältö ja -toiminnot ovat tarjolla avoimesti ja maksuttomasti. Maksaville tilaajille on lisäksi tarjolla sisällöltään laajempi ja monipuolisempia analyysitoimintoja sisältävä versio. Google Scholar (GS) on maksuton hakukone, ei siis varsinainen viittaustietokanta. GS on erikoistunut tieteellisen tiedon etsimiseen, mutta viittausdata sisältää myös paljon ei tieteellisiä viittauksia, joten viittausmäärät eroavat suuresti WoS ja Scopus kantojen lukemista. Kaikki neljä edellä mainittua tietokantaa on esitelty tarkemmin omissa luvuissaan.
Viittaustietokantojen vertailua
Koska viittaustietokantojen aineistojen indeksointimenetelmät ja kokoelmapoliittiset linjaukset ovat keskenään hyvin erilaisia, eroavat myös tietokantojen sisällöt merkittävästi toisistaan. WoS ja Scopus noudattavat valikoivaa kokoelmapolitiikkaa ja käyttävät eri alojen asiantuntijoista koostuvaa toimituskuntaa sisältönsä valintaan ja indeksointiin. Dimensions nojaa laajasti koneoppimiseen ja automatisoiduilla algoritmeilla tapahtuvaan tiedonkäsittelyyn, asiantuntijoiden manuaalisesti suorittaman kuratoinnin sijaan. Dimensions indeksoi pääsääntöisesti kaikki tieteelliset julkaisut ja datasetit, joilla on DOI-tunniste. Google Scholarin automatisoidut menetelmät puolestaan kahlaavat verkkoa ja indeksoivat kaikki julkaisut, joilla on näennäisesti akateeminen rakenne.
Tieteenalojen julkaisukäytännöt kuten julkaisutyyppi ja julkaisukieli vaikuttavat kattavuuteen. Perinteiset viittaustietokannat kuten WoS ja Scopus sisältävät pääsääntöisesti tieteellisiä lehtiä. Erityisesti tieteenalat, joille on tyypillistä julkaista kirjoissa, ovat huonosti edustettuina kyseisissä tietokannoissa. Myös konferenssijulkaisujen osalta on puutteita. Huonointa kattavuus on tyypillisesti yhteiskuntatieteiden ja humanististen tieteiden osalta. Myös tietokantojen keskittyminen pääasiassa englanninkieliseen kirjallisuuteen aiheuttaa omat rajoitteensa kattavuuteen. Vaikka tietokantoihin hyväksytään myös muun kuin englanninkielisiä julkaisuja, yhtenä valintakriteerinä on kuitenkin julkaisukanavissa julkaistavien artikkeleiden englanninkieliset tiivistelmät ja otsikot. Automaattisiin indeksointimenetelmiin perustuvat modernimmat tietokannat Dimensions ja Google Scholar, yltävät merkittävästi parempaan kattavuuteen useimmilla tieteenaloilla. Dimensions on huomattavan paljon kattavampi kuin Scopus tai Web of Science erityisesti toimitettujen kirjojen, niiden sisältämien kappaleiden, sekä monografioiden osalta.
Tietokantojen eroista ja siitä, miten hyvin ne kattavat eri tieteenalojen aineistoja, on tehty lukuisia tutkimuksia. Useat tutkimukset osoittavat Web of Science Core Collection tietokannan kattavuuden monien tieteenalojen osalta heikommaksi kuin kilpailevissa tietokannoissa (mm. Mongeon, P. & Paul-Hus, A. 2016, Martín-Martín, A. et al. 2021, Singh, V.K. et al. 2021, Visser, M. et al. 2021). Tässä oppaassa esitellyistä tietokannoista kattavuudeltaan parhaimmaksi lähes kaikkien tieteenalojen osalta nousee useissa tutkimuksissa Google Scholar (mm. Harzing, A.-W. 2019, Martín-Martín, A. et al. 2021). Tuoreita tutkimuksia viitetietokantojen aineiston kattavuudesta on listattu tämän luvun loppuun. Lisäksi liitetiedostona on Jyväskylän yliopiston julkaisutuotannon perusteella tehty tietokantavertailu.
Tietokantaa valittaessa, aineiston kattavuus ei ole kuitenkaan ainoa kriteeri. Myös tietokannan hakutoiminnoilla ja indeksoidun aineiston laadulla on merkitystä. Vaikka Google Scholar yltää kilpailijoitaan parempaan kattavuuteen, on sen hakutoiminnoissa paljon rajoitteita, kuten rajoitettu Boolen operaattoreiden käyttö sekä hyvin rajalliset suodatusominaisuudet hakutulokselle. Perinteiset, pitkään markkinoilla olleet Web of Science ja Scopus ovat kattavuudeltaan kilpailijoita heikompia, aineiston indeksointi tietokantaan on hitaampaa ja ne ovat maksullisia. Toisaalta molempien hakutoiminnot ovat monipuoliset ja niiden indeksoima aineisto on validoitua. Viittaustietokantojen vertailua helpottamaan on Taulukkoon 1. kerätty tiedot Web of Science, Scopus, Dimensioins ja Google Scholar tietokantojen keskeisistä ominaisuuksista ja sisällöistä.
Ominaisuus | Web of Science | Scopus | Dimensions | Google Scholar |
---|---|---|---|---|
Saatavuus | maksullinen | maksullinen | perussisältö ja -toiminnot avoimesti saatavilla. Edistyneempi käyttö ja kattavammat sisällöt ovat maksulliset. | avoimesti saatavilla |
Lehtien lkm. | ~22 000 | ~24 000 | ~99 000 | ei julkinen |
Muu sisältö | julkaisut: konferenssijulkaisuja, monografioita. Pienissä määrin myös muita julkaisutyyppejä. sisältää lisäksi tietoa rahoittajista | julkaisut: konferenssijulkaisuja, monografioita, kirjan/kokoomateoksen osia, ammattilehtiä ja patentteja. Pienissä määrin myös muita julkaisutyyppejä. sisältää lisäksi tietoa rahoittajista | julkaisut: kirjan/kokoomateoksen osia, konferenssijulkaisuja, preprinttejä, monografioita, patentteja ja yhteiskunnallisia julkaisuja sisältää lisäksi tietoa dataseteistä, tutkimuksen rahoituksesta ja kliinisistä kokeista. tieteelliset julkaisut ja tiedot dataseteistä sisältyvät ilmaisversioon. Muu sisältö maksullista. | konferenssijulkaisuja, monografioita, preprinttejä, opinnäytteitä, ppt-esityksiä, www-sivuja |
Keskeisimmät alat | luonnontieteet, lääketiede, tekniikka, yhteiskuntatieteet, taiteet ja humanistiset tieteet | luonnontieteet, tekniikka, terveystieteet, yhteiskuntatieteet, taiteet ja humanistiset tieteet | pyrkii kattamaan tasapuolisesti eri tieteenalat. Parhainta kattavuus on aloilla: luonnontieteet, lääketiede, tekniikka ja yhteiskuntatieteet | ei julkinen |
Ajallinen kattavuus | vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities), aineiston saatavuus riippuu organisaation hankkimista lisensseistä | kattavuus vaihtelee, osa lehdistä 1780-luvulle asti, viitteissä lähdetiedot 1970 lähtien | ei julkinen | |
Päivitys | Core Collection päivittäin, muut tietokannat harvemmin | päivittäin | ei julkinen | |
Kokoelmapolitiikka | julkinen | julkinen | ei julkinen, sopimus useimpien merkittävien kustantajien kanssa | |
Viittausanalyysi | Citation Report -työkalu | Citation Overview -työkalu | hakutulosten yhteydessä Cited by -linkki, josta näkee viittausten määrän per julkaisu ja viittaavia julkaisuja voi tarkastella | |
Viittaustietokantojen ajallinen kattavuus | vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities) | vuodesta 1970 | ei julkinen | |
Indikaattoreita | ||||
Dataa hyödyntäviä rankingeja | Academic Ranking of World Universities (ARWU) eli Shanghai Ranking University Ranking by Academic Performance (URAP) U.S. News & World Report's Best Global Universities Rankings U-Multirank National Taiwan University (NTU) Ranking CWTS Leiden Ranking CWUR (Center for World University Ranking, United Arab Emirates) Round University Ranking (RUR) Suomen Akatemian Tieteen tila -raportit | Times Higher Education World University Ranking Times Higher Education Impact Ranking QS Ranking Suomen Akatemian Tieteen tila -raportit | ||
Tutkijaprofiili | ResearcherID/Publons | Scopus Author Identifier | Google Scholar Profile | |
Taulukossa 1. on yhteenveto neljän keskeisimmän monitieteellisen viittaustietokannan ominaisuuksista.
Lähteet:
Harzing, A.-W. (2019). Two new kids on the block: How do Crossref and Dimensions compare with Google Scholar, Microsoft Academic, Scopus and the Web of Science? Scientometrics, 120(1), 341–349. DOI: https://doi.org/10.1007/s11192-019-03114-y
Martín-Martín, A. & Thelwall, M. & Orduna-Malea, E. & López-Cózar, E.D. 2021 Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics 126: S. 871–906. doi: https://doi.org/10.1007/s11192-020-03690-4
Mongeon, P. & Paul-Hus, A. (2016). The journal coverage of Web of Science and Scopus: a comparative analysis. Scientometrics 106, pp. 213–228. https://doi.org/10.1007/s11192-015-1765-5
Singh, V.K., Singh, P., Karmakar, M. et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics 126, 5113–5142 (2021). https://doi.org/10.1007/s11192-021-03948-5
Visser, M. & van Eck, N.J. & Waltman, L. 2021. Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies 2(1): S. 20–41. doi: https://doi.org/10.1162/qss_a_00112
Viimeaikaisia viitetietokantojen kattavuutta ja ominaisuuksia käsitteleviä tutkimuksia:
Baas, J., Schotten, M., Plume, A., Côté, G., & Karimi, R. (2020). Scopus as a curated, high-quality bibliometric data source for academic research in quantitative science studies. Quantitative Science Studies, 1(1), 377–386. DOI: https://doi.org/10.1162/qss_a_00019
Birkle, C., Pendlebury, D. A., Schnell, J., & Adams, J. (2020). Web of Science as a data source for research on scientific and scholarly activity. Quantitative Science Studies, 1(1), 363–376. DOI: https://doi.org/10.1162/qss_a_00018
Harzing, A.-W. (2019). Two new kids on the block: How do Crossref and Dimensions compare with Google Scholar, Microsoft Academic, Scopus and the Web of Science? Scientometrics, 120(1), 341–349. DOI: https://doi.org/10.1007/s11192-019-03114-y
Herzog, C., Hook, D., & Konkiel, S. (2020). Dimensions: Bringing down barriers between scientometricians and data. Quantitative Science Studies, 1(1), 387–395. DOI: https://doi.org/10.1162/qss_a_00020
Huang, C.-K., Neylon, C., Brookes-Kenworthy, C., Hosking, R., Montgomery, L., ... Ozaygen, A. (2020). Comparison of bibliographic data sources: Implications for the robustness of university rankings. Quantitative Science Studies, 1(2), 445–478. DOI: https://doi.org/10.1162/qss_a_00031
Martín-Martín, A., Orduna-Malea, E., & López-Cózar, E. D. (2018). Coverage of highly-cited documents in Google Scholar, Web of Science, and Scopus: A multidisciplinary comparison. Scientometrics, 116(3), 2175–2188. DOI: https://doi.org/10.1007/s11192-018-2820-9
Martín-Martín, A., Orduna-Malea, E., Thelwall, M., & López-Cózar, E. D. (2018). Google Scholar, Web of Science, and Scopus: A systematic comparison of citations in 252 subject categories. Journal of Informetrics, 12(4), 1160–1177. DOI: https://doi.org/10.1016/j.joi.2018.09.002
Martín-Martín, A., Thelwall, M., Orduna-Malea, E., & López-Cózar, E. D. (2020). Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: A multidisciplinary comparison of coverage via citations. arXiv:2004.14329. DOI: https://doi.org/10.1007/s11192-020-03690-4
Martín-Martín, A. & Thelwall, M. & Orduna-Malea, E. & López-Cózar, E.D. 2021 Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics 126: S. 871–906. doi: https://doi.org/10.1007/s11192-020-03690-4
Mongeon, P. & Paul-Hus, A. (2016). The journal coverage of Web of Science and Scopus: a comparative analysis. Scientometrics 106, pp. 213–228. https://doi.org/10.1007/s11192-015-1765-5
Singh, V.K., Singh, P., Karmakar, M. et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics 126, 5113–5142 (2021). https://doi.org/10.1007/s11192-021-03948-5
Visser, M. & van Eck, N.J. & Waltman, L. 2021. Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies 2(1): S. 20–41. doi: https://doi.org/10.1162/qss_a_00112
Waltman, L., & Larivière, V. (2020). Special issue on bibliographic data sources. Quantitative Science Studies, 1(1), 360–362. DOI: https://doi.org/10.1162/qss_e_00026