Kirjaudu Wikiin oikeasta yläkulmasta, jos haluat kommentoida opasta.

|

Log in from the top right corner if you want to comment on the guide.

Web of Science (WoS) on monitieteinen viittaustietokanta, joka tarjoaa tilauspohjaisen pääsyn useisiin tietokantoihin, jotka tarjoavat viittaustietoja monille eri tieteenaloille. Sen on alun perin tuottanut Institute for Scientific Information (ISI) ja sitä ylläpitää tällä hetkellä Clarivate Analytics. WoS-alusta rakentuu monista erillisistä monitieteellisistä, alakohtaisista ja alueellisista viittaustietokannoista sekä patentti- ja tutkimusdatatietokannoista. Kaiken kaikkiaan WoS:n tietokannat sisältävät 182 miljoonaa tietuetta aina 1800-luvulta lähtien. Maailmanlaajuisesti merkittävimmiksi valikoitujen monitieteellisten aikakauslehtien, kirjojen ja konferenssijulkaisujen joukko muodostaa Web of Science Core Collection -tietokantakokonaisuuden. Core Collection -tietokannat toimivat pohjadatana myös Clarivate Analyticsin InCites-analyysityökalussa ja Journal Citation Reports -lehtityökalussa. Tässä oppaassa keskitytään erityisesti Web of Science Core Collection -tietokantoihin.


Kuvassa on kaavio, jossa on esitetty Web of Science tietokantakokonaisuus

Kaavio 1. Web of Science -tietokantakokonaisuus koostuu useista erillisistä monitieteellisistä, alakohtaisista ja alueellista tietokannoista. © Clarivate, 2021. 24.11.2021.

Tietokannan sisältö ja laadun varmistus

WoS Core Collection koostuu kuudesta erillisestä tietokannasta (kaavio 1.), jotka sisältävät yhteensä lähes 22 000 maailmanlaajuisesti julkaistua korkealaatuista tieteellistä aikakauslehteä, yli 226 000 konferenssijulkaisua, ja yli 126 000 toimituksellisesti valittua kirjaa luonnontieteiden, yhteiskuntatieteiden, humanististen tieteiden, tekniikan ja taiteiden alalta (tiedot vuodelta 2022). Clarivate myy erillisiä lisenssejä kuhunkin tietokantaan sekä osaan lisäksi erillisiä takautuvia aineistopaketteja. Yhteiskuntatieteiden ja luonnontieteiden aineistojen ajallinen kattavuus on laajin, aineistoja on mahdollista lisensioida 1900-luvun alusta lähtien. Taiteiden ja humanististen tieteiden aineistot alkavat vuodesta 1975, konferessijulkaisut 1990-luvulta ja monografioita on indeksoitu vuodesta 2005 alkaen. Tilaava organisaatio voi valita, mitkä viittaustietokannat ja millaisen ajallisen kattavuuden se sisällyttää tilaukseensa. Tämä asia on hyvä huomioida bibliometrisiä analyysejä tehtäessä. Hakutuloksessa löydettyjen julkaisujen määrä riippuu käytössä olevista lisensseistä. Artikkelin saamien viittausten lukumäärä on kuitenkin riippumaton tilauksen laajuudesta. Suomessa FinElib-konsortion kautta on pääsy keskeisimpiin Core Collection-indekseihin Science Citation Index Expanded, Social Sciences Citation Index, Arts and Humanities Citation Index sekä Emerging Sources Citation Index. FinElib-lisenssien ulkopuolelle jäävät erikseen tilattavat aineistot Conference Proceedings Citation Index ja Book Citation Index.

Kattavuus eri tieteenaloilla

Useat tutkimukset osoittavat WoS Core Collection-tietokannan kattavuuden monien tieteenalojen osalta heikommaksi kuin kilpailevissa tietokannoissa (mm. Mongeon, P. & Paul-Hus, A. 2016, Martín-Martín, A. et al. 2021, Singh, V.K. et al. 2021, Visser, M. et al. 2021). Tieteenalojen julkaisukäytännöt kuten julkaisutyyppi ja julkaisukieli heijastuvat kattavuuteen. WoS Core Collection sisältää pääsääntöisesti lehtiä ja erityisesti tieteenalat, joille on tyypillistä julkaista kirjoissa, ovat huonosti edustettuina tietokannassa. WoS Core Collection sisältää etupäässä englanninkielistä aineistoa, joten tieteenalat, joille on tyypillistä tuottaa muun kuin englanninkielisiä julkaisuja, ovat heikommin edustettuna tietokannassa. Alhaisinta kattavuus on yhteiskuntatieteiden ja humanististen tieteiden osalta, joilla kattavuus voi jäädä jopa alle kymmeneen prosenttiin. Parhainta kattavuus on puolestaan biotieteissä ja lääketieteissä sekä osassa luonnontieteitä ja tekniikan alaa. Viittaustietokantojen kattavuuseroista on kerrottu tarkemmin tämän luvun johdanto-osiossa.

Kokoelmapolitiikka

Eri viittaustietokannoilla on erilaiset kokoelmapoliittiset linjaukset. WoS käyttää sisäistä toimituskuntaa sisältönsä valintaan. Kukin toimituskunnan jäsen keskittyy tietyn aihealueen aineistoihin, ja toimittajat ovat puolueettomia eivätkä ole sidoksissa kustantamoihin tai tutkimuslaitoksiin. WoS korostaa valikoivaa kokoelmapolitiikkaa, mikä osittain selittää muihin viitetietokantoihin verrattuna heikompaa kattavuutta. Tullakseen indeksoiduksi tietokantaan, tulee esimerkiksi tieteellisen lehden täyttää kaiken kaikkiaan 24 laatukriteeriä ja neljä viittaustietoihin perustuvaa vaikuttavuuskriteeriä. Lehdillä tulee mm. olla vertaisarviointiprosessi ja toimituskunta, ISSN-tunnus ja artikkelin otsikko sekä abstrakti tulee olla englanninkielisiä. Vaikuttavuuskriteerien tarkoituksena on tunnistaa ja valita tietyn tieteenalan vaikutusvaltaisimmat lehdet. Lehdet, jotka täyttävät kaikki laatukriteerit, hyväksytään Emerging Sources Citation Index -kokoelmaan (ESCI). Lehdet, jotka lisäksi täyttävät neljä vaikuttavuuskriteeriä, hyväksytään Science Citation Index Expanded (SCIE), Social Sciences Citation Index (SSCI) tai Arts & Humanities Citation Index (AHCI) -kokoelmiin, riippuen lehden tieteenalasta.

Tarkemmat tiedot WoS:n lehtien arviointiprosessista ja valintaperusteista on luettavissa palvelun omilta sivuilta.

Julkaisutyypit

Core Collection -tietokannat sisältävät yhteensä lähes 22 000 maailmanlaajuisesti julkaistua korkealaatuista tieteellistä aikakauslehteä (mukaan lukien Open Access -lehdet); yli 226 000 konferenssijulkaisua; ja yli 126 000 toimituksellisesti valittua kirjaa luonnontieteiden, yhteiskuntatieteiden, humanististen tieteiden, tekniikan ja taiteiden alalta (tiedot vuodelta 2022). Pienissä määrin Core Collection sisältää myös muita julkaisutyyppejä kuten toimituksellista materiaalia, tutkimusdataa kuvailevia dokumentteja ja taiteellisten teosten arvosteluja. Koko listauksen tietokannan sisältämistä julkaisutyypeistä, voi lukea palvelun omilta sivuilta.

Core Collection -tietokantojen lisäksi Web of Science -tuoteperheeseen kuuluu mm. erillinen patenttitietokanta Derwent Innovations Index (DII) ja tutkimusdata-aineistoja sisältävä Data Citation Index.

Tietokantapäivitykset 

Maaliskuusta 2021 lähtien WoS Core Collection -tietokantapäivitykset ovat olleet päivittäisiä. Joulukuussa 2017 viikoittaiset päivitykset muuttuivat ensin päivittäisiksi maanantaista perjantaihin ja nykyään tietokanta päivittyy jokaisena viikonpäivänä. Muiden kuin Core Collection -kokonaisuuteen kuuluvien tietokantojen sisältöpäivitykset vaihtelevat viikottaisista kerran kuukaudessa tapahtuviin. On kuitenkin syytä huomioida, että julkaisuhetkestä kestää keskimäärin neljästä kahdeksaan viikkoa ennen kuin julkaisu indeksoidaan tietokantaan. Joskus julkaisun indeksoimisessa voi kestää huomattavasti kauemminkin.

Tieteenalaluokitukset

Tieteenalaluokitukset ovat keskeinen näkökulma, kun tarkastellaan julkaisujen keräämiä viittauksia. Yksittäisen julkaisun keräämä viittausmäärä on suhteellisen merkityksetön luku. Mutta kun verrataan viittausmäärää muihin saman alan julkaisuihin, voidaan nähdä, onko se keskimääräistä korkeampi vai matalampi ja kuinka paljon. Jotta viittausmäärien vertailtavuus ja viittaustietojen pohjalta muodostettavien indikaattoreiden käyttö on järkevää, tulisi tietokannan pystyä mahdollisimman täsmällisesti ja tarkasti määrittelemään julkaisujen ja julkaisukanavien tieteenalaluokat. 

Jokainen Core Collection-tietokantoihin kuuluva lehti, konferenssijulkaisu ja kirja on luokiteltu yhteen tai useampaan tieteenalan mukaiseen aihekategoriaan (Web of Science Subject Categories). Jokainen yksittäinen tietue sisältää tiedon lähdejulkaisunsa aihekategoriasta. Aihekategorioita on yhteensä noin 250 luonnontieteissä, yhteiskuntatieteissä, taiteissa ja humanistisissa tieteissä. Luokitus on muodostettu määrittämällä jokainen lehti, kirja ja konferenssijulkaisu yhteen tai useampaan aihekategoriaan. Laajat tieteenalat, kuten fysiikka, on luokiteltu edelleen tarkempiin ala-aihekategorioihin, esimerkiksi "Physics, applied" ja "Physics, nuclear".

Tämä tarkempi luokittelu on tärkeää, koska viittauskäytännöt voi vaihdella merkittävästi tieteenalojen sisällä. Koska yksittäistä lehteä, kirjaa tai konferenssijulkaisua ei kuitenkaan usein voida liittää ainoastaan yhteen kategoriaan, luokitteluissa on päällekkäisyyksiä, mikä voi vaikeuttaa analyysiä. Jokainen julkaisu perii kaikki emojulkaisulle määritetyt aihekategoriat. Monitieteisten lehtien kuten Nature ja Science julkaisut uudelleenluokitellaan mahdollisimman täsmälliseen luokkaan. Monitieteiset lehdet julkaisevat artikkeleita monista aiheista, mutta yksittäiset artikkelit keskittyvät yleensä yhteen tutkimusalueeseen. Hyödyntämällä tällaisten artikkelien viittaustietoja algoritmisin menetelmin pystytään usein määrittelemään artikkelille sopiva aihekategoria. Mikäli sopivaa kategoriaa ei kuitenkaan tunnisteta, jätetään artikkelin aihekategoriaksi monitieteinen. Lista WoSin käyttämästä tieteenalaluokituksesta sekä tieto yksittäisille lehdille määritellyistä aihekategorioista löytyy palvelun sivuilta.

Tietokannan perusominaisuudet

Hakumahdollisuudet

WoS -käyttöliittymässä tiedonhaut aloitetaan valitsemalla ensin halutut tietokannat. Samalla käyttöliittymällä voi tehdä hakuja kaikkiin WoS-tuoteperheen tietokantoihin. Julkaisumetriikassa tyypillisesti käytetään Core Collection -tietokantoja. Jokainen Core Collection -tietokantaan indeksoitava tietue sisältää julkaisun bibliografiset tiedot sekä tiedot kaikista artikkelin kirjoittajista affiliaatioineen, julkaisun abstraktin ja avainsanat (mikäli kirjoittaja on ne sisällyttänyt), tiedot julkaisun rahoittajista sekä apurahan numerot (mikäli ilmoitettu) sekä täsmälliset tiedot kaikista julkaisuun viittaavista artikkeleista. Core Collection -tietokannat toimivat pohjadatana myös Clarivate Analyticsin InCites-analyysityökalussa ja Journal Citation Reports-lehtityökalussa.

Tiedonhaun voi aloittaa hakemalla julkaisuja (documents), kirjoittajia (authors) tai tiettyyn julkaisuun viittaavia dokumentteja (cited references). Julkaisuja voi hakea joko perushaulla tai tarkennetulla haulla. Tarkennetussa haussa on mahdollista hakea 35:n eri tiedon perusteella, esimerkiksi julkaisun otsikon, DOI:n, tekijän, tutkijatunnisteen, aiheen, tekijän ilmoittamien avainsanojen, rahoitusnumeron, rahoittajan ja tietyn affiliaation perusteella. Hakukenttiä voi yhdistää Boolen operaattoreiden (AND, OR, NOT) avulla ja jo tehtyjä hakuja yhdistää edelleen. Saatua hakutulosta on mahdollista rajata useiden filttereiden kuten julkaisuvuosi, julkaisutyyppi, WoS-tieteenala tai kirjoittajan affiliaatio avulla. Vielä beta-vaiheessa olevan kirjoittajahaun avulla voi hakea tietyn henkilön kirjoittamia julkaisuja. WoS:n algoritmit pyrkivät tunnistamaan tietylle henkilölle kuuluvat julkaisut huomioimalla henkilön nimen lisäksi affiliaatiotiedot, henkilön julkaisuhistorian, julkaisujen aihealueen ja julkaisujen muut kirjoittajat sekä hyödyntämällä kirjoittajien ylläpitämiä tutkijatunnisteita sekä niihin liitettyjä julkaisuja. Kirjoittajahaun ja kirjoittajaprofiilien tarkkuutta pyritään parantamaan tarjoamalla tietokannan kirjautuneille käyttäjille, ei pelkästään artikkelin kirjoittajalle, mahdollisuus korjata tietoja. Cited references -haku hakee kaikki tiettyyn julkaisuun viittaavat dokumentit; myös sellaiset, joita ei ole indeksoitu WoS-tietokantoihin.

Web of Science -analyysityökalut

WoS -tietokantaan tehdyn haun tulosta voi tarkastella kahden analyysityökalun avulla: analysoi tulosta (Analyze Results) ja viittausraportti (Citation Report).

Analysoi tulosta -toiminnon mahdollistaa WoS:n kattava määrä indeksoitavia kenttiä. Hakutuloksesta voi esimerkiksi selvittää useimmin esiintyvät maat, organisaatiot tai tutkijat ja tulosta voi ryhmitellä lehtien tieteenalojen, julkaisutyyppien tai tutkimusrahoittajien mukaan. Tarjolla on muutamia erilaisia valmiita visualisointinäkymiä tai tulokset voi ladata jatkokäsiteltäväksi muissa ohjelmissa.

Viittausraportti kokoaa yhteen hakutuloksen yhteenlasketut viittaustilastot. Raportti sisältää seuraavat tiedot:

  • Löydettyjen julkaisujen kokonaismäärä

  • Löydettyjen julkaisujen keräämien viittausten kokonaismäärä

  • Löydettyjen julkaisujen keräämien viittausten kokonaismäärä, vähennettynä itseviittauksilla (viittaukset, jotka ovat peräisin tarkasteltavaan hakutulosjoukkoon sisältyvistä artikkeleista)
  • Viittaavien artikkelien kokonaismäärä

  • Viittaavien artikkelien kokonaismäärä vähennettynä itseviittauksilla (viittaavat artikkelit, jotka sisältyvät tarkasteltavaan tulosjoukkoon poistettu)

  • Viittausten keskiarvo per julkaisu

  • Hakutuloksen sisältämien julkaisujen h-indeksi

On hyvä huomata, että viittaustilastoihin on laskettu viittaukset ainoastaan haussa käytettyihin tietokantoihin indeksoiduista julkaisuista. Mikäli haluaa hakea viittaustiedot kattavammin, on suositeltavaa käyttää WoS:n Cited references -viittaushakua.Kuva 1. Näkymä WoS-viittausraportista. © Clarivate Analytics, 2022.

Web of Science -tutkijaprofiili ResearcherID

Tutkijatunnisteet auttavat ratkaisemaan julkaisujen tekijöiden tunnistamiseen liittyviä ongelmia kuten yleiset sukunimet, nimenvaihdokset ja englannin kielessä esiintymättömät merkit. Web of Science ResearcherID on tutkijatunniste, jonka tarkoituksena on yhdistää tutkija oikeisiin julkaisuihin Clarivate Analytics -tuoteperheen palveluissa Web of Science ja InCites. ResearcherID-palvelun perustana on tutkijoiden itsensä luomat ja ylläpitämät profiilit. Jokainen tutkija voi luoda itselleen profiiliin palveluun. ResearcherID-tunnistenumero pysyy samana vaikka tutkijan nimi tai affiliaatiotiedot muuttuvat.

Lisätietoa tutkijatunnisteiden käytöstä voi lukea myös tämän oppaan Tekijyys-kohdasta.

Web of Science -organisaatioprofiilit

Tutkijaprofiilien lisäksi WoS Core Collection -tietokannoissa on mahdollista ylläpitää myös organisaatiokohtaisia profiileja. Kuten tutkijoiden nimet, myös organisaatioiden nimet kokevat vaihdoksia ja organisaatioissa voi tapahtua rakenteellisia muutoksia. Suomessa esimerkiksi yliopistosektorilla Aalto-yliopisto on muodostettu entisistä itsenäisistä Helsingin kauppakorkeakoulusta, Taideteollisesta korkeakoulusta ja Teknillisestä korkeakoulusta ja Itä-Suomen yliopisto on muodostettu yhdistämällä Kuopion ja Joensuun yliopistot. Core Collection -tietokannoissa on käytössä Organization-Enhanced -profiilit, joiden ajantasaisuudesta tyypillisesti huolehtivat organisaatioiden tiedekirjastojen asiantuntijat. Viitetietokantojen organisaatioprofiilien ajan tasalla pitäminen on tärkeä tehtävä koska tietoja käytetään erilaisissa benchmarking- ja yhteistyöselvityksissä. Lisäksi monet ranking-organisaatiot hyödyntävät tietoja. WoS Core Collection -dataan pohjautuvan InCites-analyysityökalun organisaatioprofiilit on muodostettu suoraan Organization-Enhanced -profiilien pohjalta.

Rajoitteet ja kritiikki

WoS:n merkittävin rajoite on saatavuus, sillä tietokannan käyttäminen vaatii maksullisen lisenssin. Yliopistot ovat tyypillisesti hankkineet lisenssin, mutta monilta tutkimuslaitoksilta ja ammattikorkeakouluilta lisenssi voi puuttua. Suomalaisten organisaatioiden osalta WoSin saatavuuden voi tarkistaa FinElib-konsortion Web of Science -tilaajat -sivuilta.

Toinen keskeinen rajoite on WoS:n indeksoiman sisällön kattavuus. WoS:n valikoiva kokoelmapolitiikka johtaa muihin tietokantoihin verrattuna selvästi huonompaan kattavuuteen monilla tieteenaloilla, erityisesti yhteiskuntatieteiden ja humanististen tieteiden osalta.

WoS-tietokannassa on myös joitakin teknisiä rajoitteita, jotka hankaloittavat erityisesti suurien tulosjoukkojen jatkokäsittelyä. WoS-tietokannasta voi tallentaa muihin järjestelmiin kerrallaan korkeintaan 1000 tietuetta. Poikkeuksena InCites-palvelu, johon on mahdollista siirtää 50000 tietueen datasetti. Isompien tulosjoukkojen tallentamisen voi kuitenkin toistaa useassa erässä (1-1000, 1001-2000, 2001-3000 jne).Muita mahdollisuuksia WoS-datan käyttöön

Clarivate on tuotteistanut WoS-dataa myös useisiin erillisiin - ja erikseen maksullisiin - koneluettaviin rajapintoihin. Useiden suomalaisten organisaatioiden FinElib -konsortion kautta jo tilaama WoS -saatavuus sisältää vain yksinkertaisimmat WoS API Lite ja Links AMR -rajapinnat. Laajemmat julkaisujen metatiedot ja mm. viittausmäärät sisältävä WoS API Expanded, tai julkaisukanavien JIF-metriikkoja sisältävä WoS Journals API edellyttävät lisätilauksia.Lähteet

Clarivate Analytics. (2021) WoS_Collection_Diagram_002_CMYK_V5 [kaavio]. Saatavilla: https://clarivate.libguides.com/webofscienceplatform/coverage [Viitattu 24.11.2021]

Clarivate Analytics. (2022) Web of Science Core Collection Help. Saatavilla: http://images.webofknowledge.com/WOKRS535R111/help/WOS/index.html [Viitattu 4.2.2022]

Clarivate Analytics. (2022) Web of Science LibGuides. Saatavilla: https://clarivate.libguides.com/home [Viitattu 4.2.2022]

Clarivate Analytics. (2022) Näkymä WoS viittausraportista [kuvankaappauskuva]. Saatavilla: https://www.webofscience.com/wos/ [Viitattu 4.2.2022]

Leino, Y. (2020) Web of Science julkaisujen osuus VIRTA-julkaisuista päätieteenaloittain vuosina 2012-2017 [Kaavio]. Esityksessä Julkaisutietokantojen kattavuus: VIRTA vs. Web of Science, Bibliometriikkaseminaari 2020. Saatavilla: https://wiki.eduuni.fi/display/CSCbibliometriikka/Bibliometriikkaseminaari+2020 [Viitattu 4.2.2022]

Martín-Martín, A., Thelwall, M., Orduna-Malea, E. and López-Cózar, E.D. (2021) Google Scholar, Microsoft Academic, Scopus, Dimensions, Web of Science, and OpenCitations’ COCI: a multidisciplinary comparison of coverage via citations. Scientometrics, 126, pp. 871–906. Saatavilla: https://doi.org/10.1007/s11192-020-03690-4

Mongeon, P. and Paul-Hus, A. (2016) The journal coverage of Web of Science and Scopus: a comparative analysis. Scientometrics, 106, pp. 213–228. Saatavilla: https://doi.org/10.1007/s11192-015-1765-5

Singh, V.K., Singh, P., Karmakar, M. et al. (2021) The journal coverage of Web of Science, Scopus and Dimensions: A comparative analysis. Scientometrics, 126, pp. 5113–5142. Saatavilla: https://doi.org/10.1007/s11192-021-03948-5

Visser, M., van Eck, N.J. and Waltman, L. (2021) Large-scale comparison of bibliographic data sources: Scopus, Web of Science, Dimensions, Crossref, and Microsoft Academic. Quantitative Science Studies, 2(1), pp. 20–41. Saatavilla: https://doi.org/10.1162/qss_a_00112

  • No labels