Sisältösuunnitelma
Johdannossa:
- Vertailutaulukko luvussa esitettävistä tietokannoista
- Linkit tuoreisiin tietokantavertailuihin + Jyväskylän datan perusteella tehty vertailu liitteenä
Viittaustietokannat
Viittaustietokannat sisältävät tiedon tietokannassa olevista julkaisuista sekä niiden välisistä viittauksista. Viittaustiedot kertovat, kuinka usein muissa tietokantaan kuuluvissa julkaisuissa on viitattu tarkasteltavaan julkaisuun. Viittaustietokannoista voi tarkastella yksittäisen julkaisun keräämien viittausmäärien lisäksi tyypillisesti mm. sitä, kuinka monta kertaa tiettyyn kirjoittajaan tai tietyn organisaation julkaisuihin on viitattu. Julkaisun saamien viittausten lukumäärä eri tietokannoissa vaihtelee. Viittaustietokannat keskittyvät yleensä tieteellisiin lehtiartikkeleihin, mutta ne voivat sisältää myös monografioita, konferenssijulkaisuja ja raportteja. Mikään viittaustietokanta ei kata kaikkia julkaisuja. On myös hyvä tiedostaa, että tietyt tieteenalat ovat edustettuna tietokannoissa paremmin (esim. lääke- ja luonnontieteet) kuin toiset (esim. yhteiskunta- ja humanistiset tieteet sekä taidealat). Viittausten lukumäärä tietokannoissa riippuu myös siitä, kuinka pitkältä ajalta tietokanta sisältää viittaustietoa ja kuinka usein viittaustiedot päivitetään tietokantaan. Kaikissa tietokannoissa on myös jonkin verran virheitä. Tietokantojen sisältö myös muuttuu jatkuvasti, koska ne lisäävät uusia aineistoja kokoelmaansa ja poistavat entisiä sekä päivittävät viittaustietoja vanhempien julkaisujen osalta.
Kaksi tunnetuinta monitieteistä viittaustietokantaa ovat maksulliset lisenssiperusteiset Clarivate Analyticsin Web of Science (Wos) ja Elsevierin Scopus. Sekä WoS että Scopus sisältävät kuratoitua aineistoa ja niillä on tietyt laatukriteerit tietokantansa sisällölle: lehdillä pitää mm. olla vertaisarviointiprosessi ja toimituskunta, ISSN numero ja tiettyjä kielivaatimuksia. Viittaustietoja voi tarkastella myös avoimesti saatavilla olevista Dimensions ja Google Scholar (GS) palveluista. Sekä Dimensions että Google Scholar indeksoivat auttomaattisin menetelmin aineistoja kokoelmiinsa ilman erillistä validointiprosessia. Dimensions tietokannan perussisältö ja -toiminnot ovat tarjolla avoimesti ja maksuttomasti. Maksaville tilaajille on lisäksi tarjolla sisällöltään laajempi ja monipuolisempia analyysitoimintoja sisältävä versio. Google Scholar (GS) on maksuton hakukone, ei siis varsinainen viittaustietokanta. GS on erikoistunut tieteellisen tiedon etsimiseen, mutta viittausdata sisältää myös paljon ei tieteellisiä viittauksia, joten viittausmäärät eroavat suuresti WoS ja Scopus kantojen lukemista. Kaikki neljä edellä mainittua tietokantaa on esitelty tarkemmin omissa luvuissaan.
Viittaustietokantojen vertailua
Ominaisuus | Web of Science | Scopus | Dimensions | Google Scholar |
---|---|---|---|---|
Saatavuus | maksullinen | maksullinen | perussisältö ja -toiminnot avoimesti saatavilla. Edistyneempi käyttö ja kattavammat sisällöt ovat maksulliset. | avoimesti saatavilla |
Lehtien lkm. | ~22 000 | ~24 000 | ~99 000 | ei julkinen |
Muu sisältö | julkaisut: konferenssijulkaisuja, monografioita. Pienissä määrin myös muita julkaisutyyppejä. sisältää lisäksi tietoa rahoittajista | julkaisut: konferenssijulkaisuja, monografioita, kirjan/kokoomateoksen osia, ammattilehtiä ja patentteja. Pienissä määrin myös muita julkaisutyyppejä. sisältää lisäksi tietoa rahoittajista | julkaisut: kirjan/kokoomateoksen osia, konferenssijulkaisuja, preprinttejä, monografioita, patentteja ja yhteiskunnallisia julkaisuja sisältää lisäksi tietoa dataseteistä, tutkimuksen rahoituksesta ja kliinisistä kokeista. tieteelliset julkaisut ja tiedot dataseteistä sisältyvät ilmaisversioon. Muu sisältö maksullista. | konferenssijulkaisuja, monografioita, preprinttejä, opinnäytteitä, ppt-esityksiä, www-sivuja |
Keskeisimmät alat | luonnontieteet, lääketiede, tekniikka, yhteiskuntatieteet, taiteet ja humanistiset tieteet | luonnontieteet, tekniikka, terveystieteet, yhteiskuntatieteet, taiteet ja humanistiset tieteet | ei julkinen | |
Ajallinen kattavuus | vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities), aineiston saatavuus riippuu organisaation hankkimista lisensseistä | kattavuus vaihtelee, osa lehdistä 1780-luvulle asti, viitteissä lähdetiedot 1970 lähtien | ei julkinen | |
Päivitys | Core Collection päivittäin, muut tietokannat harvemmin | päivittäin | ei julkinen | |
Kokoelmapolitiikka | julkinen | julkinen | ei julkinen, sopimus useimpien merkittävien kustantajien kanssa | |
Viittausanalyysi | Citation Report -työkalu | Citation Overview -työkalu | hakutulosten yhteydessä Cited by -linkki, josta näkee viittausten määrän per julkaisu ja viittaavia julkaisuja voi tarkastella | |
Viittaustietokantojen ajallinen kattavuus | vuodesta 1900 lähtien (Science), vuodesta 1956 (Social Sciences) ja 1975 (Arts and Humanities) | vuodesta 1970 | ei julkinen | |
Indikaattoreita | ||||
Dataa hyödyntäviä rankingeja | Academic Ranking of World Universities (ARWU) eli Shanghai Ranking University Ranking by Academic Performance (URAP) U.S. News & World Report's Best Global Universities Rankings U-Multirank National Taiwan University (NTU) Ranking CWTS Leiden Ranking CWUR (Center for World University Ranking, United Arab Emirates) Round University Ranking (RUR) Suomen Akatemian Tieteen tila -raportit | Times Higher Education World University Ranking Times Higher Education Impact Ranking QS Ranking Suomen Akatemian Tieteen tila -raportit | ||
Tutkijaprofiili | ResearcherID/Publons | Scopus Author Identifier | Google Scholar Profile | |
Taulukossa 1. on yhteenveto neljän keskeisimmän monitieteellisen viittaustietokannan ominaisuuksista.
Viittaustietokantojen kattavuuseroja
Koska viittaustietokantojen aineistojen indeksointimenetelmät ja kokoelmapoliittiset linjaukset ovat keskenään hyvin erilaisia, eroavat myös tietokantojen sisällöt merkittävästi toisistaan. WoS ja Scopus noudattavat valikoivaa kokoelmapolitiikkaa ja käyttävät eri alojen asiantuntijoista koostuvaa toimituskuntaa sisältönsä valintaan ja indeksointiin. Dimensions nojaa laajasti koneoppimiseen ja automatisoiduilla algoritmeilla tapahtuvaan tiedonkäsittelyyn, asiantuntijoiden manuaalisesti suorittaman kuratoinnin sijaan. Dimensions indeksoi pääsääntöisesti kaikki tieteelliset julkaisut ja datasetit, joilla on DOI. Google Scholarin automatisoidut menetelmät puolestaan kahlaavat verkkoa ja indeksoivat kaikki julkaisut, joilla on näennäisesti akateeminen rakenne.
Tieteenalojen julkaisukäytännöt kuten julkaisutyyppi ja julkaisukieli vaikuttavat kattavuuteen. Perinteiset viittaustietokannat kuten WoS ja Scopus sisältävät pääsääntöisesti tieteellisiä lehtiä. Erityisesti tieteenalat, joille on tyypillistä julkaista kirjoissa, ovat huonosti edustettuina kyseisissä tietokannoissa. Myös konferenssijulkaisujen osalta on puutteita. Huonointa kattavuus on tyypillisesti yhteiskuntatieteiden ja humanististen tieteiden osalta. Myös tietokantojen keskittyminen pääasiassa englanninkieliseen kirjallisuuteen aiheuttaa omat rajoitteensa kattavuuteen. Vaikka tietokantoihin hyväksytään myös muun kuin englanninkielisiä julkaisuja, yhtenä valintakriteerinä on kuitenkin julkaisukanavissa julkaistavien artikkeleiden englanninkieliset tiivistelmät ja otsikot. Automaattisiin indeksointimenetelmiin perustuvat modernimmat tietokannat Dimensions ja Google Scholar, yltävät merkittävästi parempaan kattavuuteen useimmilla tieteenaloilla. Dimensions on huomattavan paljon kattavampi kuin Scopus tai Web of Science erityisesti toimitettujen kirjojen, niiden sisältämien kappaleiden, sekä monografioiden osalta. Ei-englanninkielisten julkaisujen osalta Dimensions on kilpailijoitaan kattavampi, mutta niiden tavoin myös puutteellinen.
Tietokantojen eroista ja siitä, miten hyvin ne kattavat eri tieteenalojen aineistoja, on tehty lukuisia tutkimuksia.
Lähteet:
Martín-Martín, A. & Thelwall, M. & Orduna-Malea, E. & López-Cózar, E.D. 2021 Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics 126: S. 871–906. doi: https://doi.org/10.1007/s11192-020-03690-4
Singh, V.K., Singh, P., Karmakar, M. et al. The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics 126, 5113–5142 (2021). https://doi.org/10.1007/s11192-021-03948-5
Visser, M. & van Eck, N.J. & Waltman, L. 2021. Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies 2(1): S. 20–41. doi: https://doi.org/10.1162/qss_a_00112