Vaikuttavuusindikaattoreita

Sisältösuunnitelma

Normalisoidut indikaattorit
- Top%- indikaattorit
- Tieteenalanormalisoidut viittausindikaattorit
Hirsch-indeksi (h-indeksi)
Yrjö Leinon Lyhyesti vaikuttavuusindikaattoreista -sisältö

Tarkistettava ainakin seuraavien termien käytön johdonmukaisuus indikaattori, indeksi, tieteenala,

Vaikuttavuusindikaatorit perustuvat julkaisujen saamiin viittausmääriin. Julkaisuun tehtyjen viittausten määrä kertoo siitä, kuinka paljon sitä on hyödynnetty ilmestymisensä jälkeen tehdyssä tutkimuksessa. Viittausten voidaan ajatella kertovan jotain julkaisussa esitetyn tutkimuksen hyödyllisyydestä tiedeyhteisölle, ja siten sen tieteellisestä vaikuttavuudesta. Lue lisää viittauksista.

Julkaisujen saama viittausmäärä, julkaisujoukon viittausten keskiarvo ja h-indeksi ovat esimerkkejä vaikuttavuusindikaattoreista. Tieteenalojen väliset erot viittauskäytännöissä on pyritty ottamaan huomioon normalisoiduissa indikaattoreissa. <COMMENT> Normalisoinnin toinen oleellinen motiivi on eri ikäisten julkaisujen vertailun mahdollistaminen <END COMMENT>

Viittausten lukumäärä

Keskimääräinen viittausmäärä

Normalisoidut indikaattorit

Normalisoiduilla indikaattoreilla tarkoitetaan indikaattoreita, joiden laskennassa on pyritty huomioimaan julkaisun tieteenala, ikä ja julkaisutyyppi. <COMMENT> OK, täällähän se ikä tulikin. <END COMMENT> Normalisoinnissa keskeistä on julkaisun tieteenalan määrittely. Julkaisut luokitellaan tietokannoissa erilaisiin tieteenalaluokituksiin erilaisin perustein ja menetelmin. Monissa kansainvälisissä tietokannoissa käytetään julkaisusarjojen tieteenalaluokitukseen perustuvaa luokitusta. Tällöin julkaisusarjassa (esim. lehdessä) ilmestynyt julkaisu (esim. tieteellinen artikkeli) luokitetaan kuuluvaksi samaan luokkaan kuin mihin julkaisusarja kuuluu. Lue lisää tieteenalaluokituksista luvusta Tieteenalojen välisiä eroja.

Tietokannassa saman ikäisten, samaa tieteenalaa ja samaa julkaisutyyppiä edustavien julkaisujen saamista viittausmääristä muodostetaan viittausjakauma ja lasketaan keskiarvo. Normalisointi toteutetaan näiden viittausjakaumien ja keskiarvojen avulla. Tieteenalanormalisoiduilla indikaattoreilla pyritään mahdollistamaan eri alojen julkaisujen vertailu. Tieteenalanormalisoituja indikaattoreita ovat esimerkiksi Top x% -indikaattorit ja tieteenalanormalisoidut viittausindikaattorit . <COMMENT> Siis "Tieteenalanormalisoituja indikaattoreita ovat esimerkiksi ... tieteenalanormalisoidut viittausindikaattorit". Mitä tuossa oikeastaan tarkoitetaan? Eikö ole jonkinlainen tautologia, että tieteenalanormalisoidut viittausindikaattorit ovat tieteenalanormalsoituja indikaattoreita? <END COMMENT>

Top x% -indikaattorit

Top x%-indikaattorit perustuvat tietokannan tieteenalakohtaisiin viittausjakaumiin. Top x% -indikaattorit ilmaisevat, kuinka suuri suhteellinen osuus tarkasteltavasta julkaisujoukosta kuuluu saman tieteenalan, julkaisuvuoden ja -tyypin viitatuimpaan x prosenttiin.

Top x% -indeksit

Top 1% ja Top 10% -indeksien yhtäaikainen käyttö kertoo sekä korkeaan (10%) että huippuvaikuttavuuteen (1%) yltävien julkaisujen suhteellisesta määrästä julkaisujoukossa. Esimerkiksi Top 1% -indeksin ykkösen ylittävä arvo tarkoittaa, että tarkasteltavan joukon julkaisuista enemmän kuin 1% kuuluu oman tieteenalansa viitatuimman 1% joukkoon.

Esim. kuinka Top 10% -indeksi lasketaan

Muodostetaan tieteenalan viittausjakauma: Tieteenalalla y on ilmestynyt 250000 julkaisua vuosina 2014-2018. Viittausjakaumassa Top 10%:iin kuuluu siis 25000 julkaisua. <COMMENT> Tuo, että esimerkin julkaisut ovat ilmestyneet usean eri vuoden aikana, voi olla hiukan harhaanjohtavaa, varsinkin kun puhutaan yksikössä viittausjakaumasta. Joku voi saada sen (virheellisen) käsityksen, että kaikki mainittujen viiden vuoden aikana ilmestyneet julkaisut pannaan yhteen riviin viittausmäärien mukaan ilmestymisvuodesta riippumatta, vaikka tosiasiassa joka vuosiluokka tietysti arvioidaan omana kokonaisuutenaan viiden eri viittausjakauman avulla. <END COMMENT>
Tarkasteltava julkaisujoukko: Samalla tieteenalalla toimii tiedekunta x. Tiedekunnan tutkijat ovat julkaisseet vuosina 2014-2018 500 julkaisua. Julkaisusta 100 kuuluu edellämainitun viittausjakauman top 10%:iin. Tilastollisesti odotusarvo tiedekunnan top 10%:ssä olevien julkaisuiden määrälle on 50 eli 10% tiedekunnan julkaisuista.
Top 10% indeksin laskeminen: Top 10% indeksi lasketaan jakamalla laitoksen top 10% kuuluvien julkaisuiden lukumäärä odotusarvolla eli 100/50=2.
huomioi että esimerkki on yksinkertainen, todellisuudessa julkaisut kuuluvat eri tieteenaloille ja tarkasteltavia julkaisuja verrataaan moneen viittausjakaumaan. <COMMENT> Suuri ero todellisuuden ja esimerkissä käsitellyn ideaalitapauksen välissä seuraa siitä, että julkaisujen viittausmäärä on diskreetti muuttuja - se saa vain kokonaislukuarvoja. Niinpä käytännössä ikinä ei käy niin onnekkaasti, että julkaisujoukossa, jossa olisi 250 000 julkaisua, löytyisi täsmälleen 25 000 julkaisun Top 10 %-luokka. Toinen iso ongelma syntyy laskettaessa verrattain tuoreiden julkaisujen (alle 5 vuotta vanhat julkaisut) Top x%-indeksejä. Joillain aloilla viittauskertymät ovat yksinkertaisesti niin pieniä, että mitään mielekästä jakaumaa ei vielä ole olemassa. Näiden alojen julkaisut täytyy jättää pois Top x% -analyysista. <END COMMENT>

Top x% -osuudet

Top x%-osuudet perustuvat tietokannan tieteenalakohtaisiin viittausjakaumiin. Topx% -osuus ilmaisee, kuinka suuri %-osuus tarkasteltavasta julkaisujoukosta kuuluu saman tieteenalan, julkaisuvuoden ja -tyypin viitatuimpaan x prosenttiin. Esimerkiksi mikäli julkaisujen Top1% -osuus on enemmän kuin 1% tarkoittaa se, että tarkasteltavan joukon julkaisuista enemmän kuin 1% kuuluu oman tieteenalansa viitatuimman 1% joukkoon.

Esim. kuinka Top 10% -osuus lasketaan

Lasketaan tieteenalan viittausjakauma: Tieteenalalla y on ilmestynyt 250000 julkaisua vuosina 2014-2018. Viittausjakaumassa Top 10%:iin kuuluu siis 25000 julkaisua.
Tarkasteltava julkaisujoukko: Samalla tieteenalalla toimii tiedekunta x. Tiedekunnan tutkijat ovat julkaisseet vuosina 2014-2018 500 julkaisua. Julkaisuista 100 kuuluu edellämainitun viittausjakauman top 10%:iin.
Top 10% osuuden laskeminen: lasketaan tiedekunnan top 10% kuuluvien julkaisuiden prosenttiosuus kaikista tiedekunnan julkaisuista: 100/500 *100%=20%
esimerkki on yksinkertainen, todellisuudessa julkaisut kuuluvat eri tieteenaloille ja tarkasteltavia julkaisuja verrataaan moneen viittausjakaumaan.

<COMMENT> Pitäisikö lisätä maininta Top x% -tyyppisten indikaattorien hyvistä (eivät herkkiä yksittäisille erittäin paljon viitatuille julkaisuille) ja huonoista puolista (Julkaisut jakautuvat jyrkästi kahteen luokkaan, ja sitä jyrkemmin, mitä pienempi prosenttiosuus vailtaan tarkasteltavaksi. Vain pieni osuus julkaisuista katsotaan arvokkaiksi, loput jäävät merkityksettömäksi massaksi. Pienten organisaatioiden kohdalla tämä johtaa helposti suuriin vuosittaisiin vaihteluihin. 10% raja mielivaltainen, miksei yhtä hyvin vaikka 8,2%? Nimi on todellisuudessa harhaanjohtava, koska millään alalla, minään vuonna Top10% -luokka ei itse asiassa sisällä täsmälleen 10 % julkaisuista)? Miksi näitä mielellään käytetään, milloin ne voivat olla huonoja valintoja. <END COMMENT>

Top x% -julkaisut

Essential Science Indicator - ja Web of Science -tietokannan Highly Cited Papers- ja Hot Papers-merkinnät ovat yksi versio Top x%-indikaattoreista. Ne perustuvat julkaisujen tieteenalakohtaisiin viittausjakaumiin. Highly Cited Papers- ja Hot papers- statuksen saavat julkaisut, jotka ylittävät tietokannassa määritellyt viittausten raja-arvot.

Highly Cited papers merkinnän saavat julkaisut, jotka ovat korkeintaan 10 vuotta vanhoja ja jotka ylittävät Top 1% raja-arvon samalla alalla samana vuonna ilmestyneiden julkaisujen viittausjakaumassa.

Hot Papers merkinnän saavat julkaisut, jotka ovat korkeintaan kaksi vuotta vanhoja ja jotka ylittävät top 0,1% raja-arvon samalla alalla samana päivityskertana tietokantaan lisättyjen julkaisujen viittausjakaumassa. Päivitykset tehdään kahden kuukauden välein. Viittauksia laskettaessa otetaan huomioon ainoastaan viimeisimmässä päivityksessä lisättyjen julkaisujen tekemät viittaukset.

Tieteenalanormalisoidut viittausindikaattorit

Normalisoidut viittausindikaattorit kuvaavat sitä, kuinka paljon enemmän tai vähemmän viittauksia julkaisut ovat keränneet suhteessa tieteenalansa keskitasoon maailmassa. Edellinnen on suora lainaus tieteen tila-julkaisusta, voiko käyttää? <COMMENT> Tieteen tila -raportti on Akatemian henkilökunnan kirjoittama, joten mahdollinen lupa pitänee pyytää sieltä. Lause on kyllä sinänsä loogisesti tosi, mutta kieliopillisesti kömpelöhkö. <END COMMENT> Indikaattorit kuvaavat julkaisun tai julkaisujoukon saaman viittausmäärän suhdetta samalla tutkimusalalla samana vuonna ilmestyneiden julkaisujen viittausten keskiarvoon. Keskimääräistä viittausvaikutusta vastaava arvo on 1. Sen alittavat arvot kertovat keskimääräistä pienemmästä viittausmäärästä ja sen ylittävät keskimääräistä suuremmasta viittausmäärästä. Kun yksikkö saa esimerkiksi arvon 1,78. merkitsee se 78 prosenttia maailman keskiarvoa suurempaa viittausvaikutusta.

Esim. kuinka Tieteenalanormalisoidut viittausindikaattorit lasketaan

Esimerkki 1. Katsausartikkeli on saanut 15 viittausta. Saman aihepiirin lehdissä, samana vuonna ilmestyneet katsausartikkelit ovat saaneet keskimäärin 12 viittausta. Katsausartikkelin normalisoitu viittausindeksi lasketaan: 15/12= 1,25.

Esimerkki 2. Kun lasketaan normalisoitua viittausindeksiä julkaisujoukolle, yksittäisten julkaisujen viittausindeksit täytyy yhdistää.

Lasketaan tieteenalanormalisoitu viittausindeksi kolmen julkaisun joukolle.

Julkaisu	artikkelin saamat viittaukset	samanlaisten artikkelien viittausten keskiarvo	julkaisun viittausindeksi
1.	15	12	15/12= 1, 25
2.	100	85	100/85=1,17
3.	60	30	60/30=2

Joukon viittausindeksi on 1/3 * (1,25+1,17+2) = (1,25+1,17+2)/3 = 1,57 = 1,6

<COMMENT> Sama kommentti kuin edellä: mitä etuja, mitä haittoja? <END COMMENT>

Normalisoitujen indikaattoreiden toteutuksia tietokannoissa ja muissa lähteissä

Topx% indeksit	Tietokanta(lähde)	Menetelmän kuvaus	Vastuullinen käyttö
PP(topx%)	Leiden ranking	https://www.leidenranking.com/information/indicators#size-independent	Kesken
top 10-indeksi	Tieteen tila	Bibliometrisiin analyyseihin liittyviä käsitteitä	Kesken
Topx% osuudet
% Documents in Top 1% % Documents in Top 10%	InCites	https://clarivate.libguides.com/incites_ba/understanding-indicators välilehti Percentiles Myös: https://incites-help-clarivate-com.libproxy.helsinki.fi/Content/Indicators-Handbook/ih-impact-indicators.htm	Kesken
Outputs in Top Citation Percentiles	SciVal	https://service.elsevier.com/app/answers/detail/a_id/28193/supporthub/scival/p/10961/	Kesken Yrjö Leino & Marianne Gauffriaun. Guest Post: Understanding SciVal’s calculation of field-weighted percentile indicators – The Bibliomagician (wordpress.com)
Top% julkaisut
Highly cited papers	Essential Science Indicators, Web of Science, InCites	https://webofscience.help.clarivate.com/en-us/Content/esi-highly-cited-papers.html http://esi.help.clarivate.com/Content/highly-cited-thresholds.htm	Kesken
Hot papers	Essential Science Indicators, Web of Science, InCites.	http://esi.help.clarivate.com/Content/hot-paper-thresholds.htm	Kesken Eri alojen viittauskäytännöt- onko joillain aloilla edes mahdollista saada ainuttakaan viittausta kahden vuoden aikana
Normalisoidut viittausindikaattorit	Tietokanta
CNCI Category Normalized Citation Impact	InCites	https://clarivate.libguides.com/incites_ba/understanding-indicators See tab "Normalized"	Kesken
FWCI Field-Weighted Citation Impact	SciVal	https://www.elsevier.com/research-intelligence/resource-library/research-metrics-guidebook	Kesken
MNCS Mean Normalized Citation Score	Leiden ranking	https://www.leidenranking.com/information/indicators#size-independent	Kesken
The Field Citation Ratio (FCR)	Dimensions	https://dimensions.freshdesk.com/support/solutions/articles/23000018848-what-is-the-fcr-how-is-it-calculated-	Kesken

h-indeksi

Määritelmä

h-indeksi, jota kutsutaan myös Hirsch-indeksiksi, on yksi tunnetuimmista bibliometrisista indikaattoreista. Sen kehitti Jorge E. Hirsch vuonna 2005 [https://doi.org/10.1073/pnas.0507655102].

h-indeksi määritellään seuraavasti: tutkijan h-indeksin arvo on h, jos h kappaletta hänen julkaisuistaan ovat jokainen saaneet vähintään h viittausta ja loput julkaisut ovat saaneet korkeintaan h viittausta.

Tähän voisi laittaa klassisen kuvaajan joka löytyy esim. englanninkielisestä wikipediasta (Kuva ilmeisesti vapaasti käytettävissä, teksti kuvan tiedoissa: "Permission details: Own work released as Public domain")

Esimerkki.
h-indeksin arvo 10 tarkoittaa, että tutkijalla on 10 julkaisua, joihin kaikkiin on viitattu vähintään 10 kertaa. Hänen mahdollisiin muihin julkaisuihinsa on viitattu korkeintaan kymmenen kertaa tai ei lainkaan.

Esimerkki.

Tutkijoiden h-indeksin arvo voi olla sama vaikka tutkijoiden julkaisuprofiilit (julkaisuidensa määrä ja niiden saamien viittausten määrä) poikkeaisivat toisistaan paljon.

Tutkija 1 on julkaissut viisi artikkelia joihin on viitattu seuraavasti: 9,9,7,6,5
Tutkija 2 on julkaissut 11 artikkelia, joihin on viitattu seuraavasti: 200, 150, 99, 70, 5, 4,4,3,2,1,1
Kummankin tutkijan h-indeksin arvo on 5 <COMMENT> Tämä on hyvä, paljastava esimerkki. Vielä dramaattisemman siitä tietysti saa, jos pudottaa tuon jälkimmäisen tutkijan viidennen julkaisun viittausmäärän 4:ään. <END COMMENT>

Vastuullinen käyttö

h-indeksi on:

Riippuvainen julkaisujen määrästä. h-indeksi ei voi olla suurempi kuin julkaisujen lukumäärä. Esim. Jos tutkija on julkaissut 10 julkaisua, h-indeksin maksimiarvo on 10 vaikka kaikkiin kyseisen tutkijan julkaisuihin olisi viitattu satoja kertoja.
Kumuloituva mittari. h-indeksi ei voi pienentyä. Se voidaan määritellä myös lyhyemmälle tarkastelujaksolle (esim 5 vuotta) kuin koko uralle.
Riippuvainen käytetystä tietokannasta. Eri tieteenalojen julkaisujen kattavuus eri viittaustietokannoissa voi vaihdella paljon. <COMMENT> Sama pätee kyllä kaikkiin bibliometrisiin indikaattoreihin. <END COMMENT>

h-indeksi ei huomioi:

tieteenalojen erilaisia julkaisu- ja viittauskäytäntöjä. Eri tieteenalojen tutkijoiden h-indeksejä ei voi verrata toisiinsa.
julkaisujen tekijöiden lukumäärää. Se suosii aloja, joissa on suuret tutkimusryhmät ja tutkijoilla siten paljon julkaisuja.
kirjoittajien roolia julkaisussa. Keskeinen rooli kirjoitustyössä ja muut roolit vaikuttavat yhtä paljon.
tutkijan uran pituutta. Pidempään julkaisseella tutkijalla on aloittelevaa tutkijaa suurempi todennäköisyys saada korkea h-indeksi, koska hänellä on ollut enemmän aikaa julkaista ja julkaisuilla on ollut enemmän aikaa saada viittauksia.
Esimerkki. Tässä voisi olla linkki esimerkkiin https://www.leidenmadtrics.nl/articles/halt-the-h-index
milloin tekijä on julkaissut tai onko hän lopettanut julkaisemisen. Lopettamisen jälkeen h-indeksi voi jatkaa kasvuaan viittausten kertymisen myöta.
tutkijan merkittäviä yksittäisiä julkaisuja. h-indeksin muunnelmat

<COMMENT> Tässä on juuri sen tyyppistä pohdintaa, mitä kaipailin aiemmin esiteltyjen indikaattorien kohdalla. <END COMMENT>

Indikaattorin toteutukset tietokannoissa

Tietokanta

Menetelmän kuvaus

Huomioitavaa

Web of Science

Scopus

A scientist has an index h if h of his/her Np papers has at least h citations each, and the other (Np h) papers have no more than h citations each.

https://blog.scopus.com//posts/the-scopus-h-index-what-s-it-all-about-part-i

Google Scholar

The h-index of a publication is the largest number h such that at least h articles in that publication were cited at least h times each. For example, a publication with five articles cited by, respectively, 17, 9, 6, 3, and 2, has the h-index of 3.

https://scholar.google.com/intl/en/scholar/metrics.html#metrics

Google Scholar sisältää myös seuraavat muunnelmat: h5-, h5-core ja 5-median

Page tree