Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Matti Ruuskanen, mikrobiologian ekologia, bioinformatiikka, mikrobiomitiede

Tutkijatohtori Matti Ruuskanen kertoi mikrobiekologian, bioinformatiikan ja datatieteen alojen käytännöistä oman tutkimustyönsä kautta. Tavoitteena on kuvailla tutkimusaineistoja siten, että koko tutkimus on toistettavissa projektin jälkeen ja FAIR-periaatteita noudattaen. Hän kertoi yksityiskohtaisesti miten data tuotetaan, säilytetään ja dokumentoidaan. Esimerkiksi on äärimmäisen tärkeää dokumentoida tarkka näytteenottomenetelmä, näytteiden käsittely sekä koodit, joilla raakadata on analysoitu, jotta tutkimus on mahdollista toistaa. Kuulijan näkökumasta dokumentointiprosessi näytti huippuunsa viritetyltä, eikä se jättänyt paljoa toivomisen varaa. 

...

Ari Mujunen, maa- ja ympäristötieteet, fysiikka ja tähtitiede

Laboratorioinsinööri Ari Mujusen alustuksessa kuultiin, miten Aalto-yliopiston Metsähovin radiotutkimusasemalla mitataan  auringon radiosignaaleja ja dokumentoidaan mittaustuloksia ja millaista suunnittelutyötä he olivat tehneet kuvailuun liittyen. He olivat tutkimusryhmässä pohtineet yhdessä, minkälaista kuvailua he tarvitsevat, sillä ajatuksella, että tuloksena olisi tiivis ja ytimekäs metadata.Varsinaisia standardeja ei ollut käytettävissä tällaiseen tarkoitukseen. Mujunen käyttää Qvain-työkalua metadatan kirjaamiseen ja kokee sen tarpeisiinsa sopivaksi työkaluksi. Hyötynä hän näkee myös pysyvät tunnisteet, jotka data saa ja joihin on helppo viitata. Heidän tuottamansa datan kohdalla on tärkeää, että käytössä on sellainen palvelu, joka mahdollistaa kertyvän aineiston kuvailun ilman että vanha data muuttuu. Tällöin uusi data tulee vanhan yhteyteen ja lisäksi. Data on myös löydettävissä research.fi -portaalista, ja muutkin  integraatiot ovat mahdollisia.

Pasi Kolari, ilmakehätiede, fysikaaliset tieteet, ekologia, evoluutiobiologia, informaatiotieteet'

Pasi Kolari, Helsingin yliopiston Ilmakehätieteiden keskuksesta kertoi miten SMEAR-asemilla toteutetaan datan kuvailua. SMEARin datavirrat on suunniteltu raakadatan keräyksestä ja prosessoinnista datan säilytykseen sekä jakamiseen ja julkaisuun loppukäyttäjille. Dokumentointi on kehittynyt huomattavasti hankkeen alkuajoista, jolloin käytössä oli tekstimuotoisia päiväkirjoja ja tietoa dokumentoitiin pitkälti sisäpiirin ilmaisuin. Tänä päivänä hanke käyttää koneluettavia päiväkirjasovelluksia, jotka sisältävät muun muassa tiedot instrumenteista, joilla data on kerätty. He hyödyntävät myös verkkosivuja, joilla metatiedon kerääminen tutkimusryhmän kanssa yhdessä helpottuu. Koneluettavuus mahdollistaa myös tietojen nopean etsimisen. 

...

Samuli Kaislaniemi, englantilainen filologia

Tutkijatohtori Samuli Kaislaniemi Itä-Suomen yliopistosta tutustutti yleisön englantilaisen filologian, tekstikorpusten ja sosiolingvistiikan maailmaan. Oman tutkimustaustansa esittelyssä hän sivusi myös tutkimusalan määrittelyn ongelmaa: Mihin kategoriaan rastittaa tutkimuksen kuuluvan eri tiedonkeruun alustoissa, kun se ei taivu vain yhteen tutkimusalaan? Tätä taustaa vasten päästiin luontevasti kuvailun käytäntöjen paikoitellen hajanaiseen maailmaan. 

...

Tero Alstola, Lähi-idän kulttuuri & kielet, kieliteknologia

Tutkijatohtori Tero Alstola Helsingin yliopistosta kertoi Lähi-idän kulttuurin ja kielten tutkimuksesta sekä kieliteknologiasta erityisesti Muinaisen Lähi-idän imperiumit -projektissa (ANEE), jossa on noin 35 tutkijaa ja heistä lähes puolet ulkomailla. Aineistojen ymmärtäminen tutkijoiden kesken on siten tutkimuksen arkipäivää. Hyvänä taustatietona työpajalaisille Alstola kuvasi tiiviisti oman ryhmänsä tutkimuskysymyksen ja tutkimuksessa hyödynnettävät menetelmät. On tärkeä muistaa, että aineistot on tunnettava hyvin, jotta niitä voi lähteä digitaalisin keinoin tutkimaan tai tuottamaan. Ei riitä, että digitoidut tekstit ikään kuin sellaisinaan ovat verkossa tarjolla, vaan tekstejä on käsiteltävä eri tavoin. Esimerkiksi muinaisen Lähi-idän tutkimuksessa nuolenpääkirjoituksella kirjoitettujen savitaulujen kuvat ovat toki tarpeen ja hyödyllisiä, mutta tarvitaan myös esimerkiksi tekstien translitteraatiot, lukutapojen tulkinnat ja kieliopilliset jäsennykset. Alstola käytti esimerkkinä Oracc-korpusta (Open richly annotated cuneiform corpus), jossa eri projekteissa tuotettuja nuolenpääkirjoitustekstikokonaisuuksia on translitteroituina ja annotoituina, alan tiedeyhteisön yhteistyönä. Tämä korpus on viety Kielipankin KORP-palveluun ja kuvailtu Kielipankin kielivarantojen MetaShare-kuvailutietovarannossa, jossa on suhteellisen paljon koneluettavaa metadataa verrattuna vaikkapa Zenodon pakolliset kentät.

...