1. Taustaa

Interoperability (EIF)

Technical interoperability​:  the ability of different information technology systems and software
applications to communicate and exchange data.
Semantic interoperability​: the ability of computer systems to exchange data with unambiguous, shared meaning.​
Organisational interoperability​: the way in which organisations align their business processes, responsibilities and expectations to achieve commonly agreed and mutually beneficial goals.
Legal interoperability​: the broader environment of laws, policies, procedures and cooperation agreements needed to allow the seamless exchange of information between different organisations, regions and countries. 

In the FAIR principles Interoperability contains three principles:

The data usually need to be integrated with other data. In addition, the data need to interoperate with applications or workflows for analysis, storage, and processing.

2. Yhteentoimivuuden ohjeiden muodostaminen palveluntarjoajalle, data-asiantuntijalle / kouluttajalle ja tutkijalle

2.1. Ohjeet palveluntarjoajalle

Palvelun tarjoajalla tarkoitamme tässä esimerkiksi  datakatalogin tai tutkimusdatapalvelun ja sanastojen kehittäjiä ja ylläpitäjiä.

I1: (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.I2: (Meta)data use vocabularies that follow FAIR principles.I3: (Meta)data include qualified references to other (meta)data.
  • Huomioi käyttäjien tarpeet ja tieteenalan käytännöt, metadatassa mahdollisimman laajasti ja datassa mahdollisimman tarkasti. Sanastoja voi käyttää rinnan useita:
    • suomalaisia/suomenkielisiä 
    • kansainvälisiä 
    • yleisiä
    • tieteenalakohtaisia
  • Koneluettavuus ja semanttinen yhteentoimivuus on oleellista, sillä käytössä sanastojen on oltava myös ihmisen ymmärrettävää. Riippuvuuksien ja relaatioiden pitää olla ihmiselle näkyviä.
  • Vastataan käyttäjien tarpeeseen alojen sanastojen käyttöönottoon joustavasti palveluissa esimerkiksi rajapintojen avulla. Käyttäjälle voi myös tarjota mahdollisuutta lisätä tunnisteita termille tai sanastolle. 
  • Palvelun/palveluntarjoajan/taustajärjestelmän pitää pystyä tukemaan tutkijaa tuottamaan kuvailutietoja, joiden perusteella voidaan edelleen tuottaa semanttisesti yhteensopivaa metadataa 
  • Palveluntarjoaja käyttää jotain linkitetyn datan skeemaa (esim. RDF tai JSON LD)
  • Sanastojen tulee olla koneluettavia. Tieteenalakohtaiset sanastot tulee mahdollisuuksien mukaan ontologisoida ja ylläpitää kytkettynä ontologiapalveluun  
  • Käytetään versioituja, ylläpidettyjä, alakohtaisia ja yleisiä sanastoja ja ontologioita
  • Käytettävien sanastojen on itsessään oltava FAIR - koneluettavia ja dokumentoituja
  • Sanastojen ja niiden käsitteillä tulisi olla pysyvät tunnisteet ja niiden tulisi olla käytettävissä avoimien rajapintojen kautta

  • Aina kun mahdollista tulisi hyödyntää olemassa olevia FAIR-periaatteita noudattavia sanastoja. Uusia sanastoja ja tietomalleja rakennettaessa tulee kiinnittää huomiota, että ne julkaistaan (ja kuvataan) FAIR-periaatteita noudattaen. 

  • Sanastot tulee toteuttaa niin, että niiden käyttäjät voivat osallistua niiden ylläpitoon esimerkiksi ehdotus- ja korjaustoimintojen avulla.
  • Tunnista kohdeyhteistön tarpeet ja käytännöt ja seuraa niitä.  Huolehdi vuorovaikutuksesta ja sisällön ja ratkaisujen kehittämisestä.
  • Käytä kansallisten ja kansainvälisten keskeisten tietovarantojen tuntemia pysyviä tunnisteita jos mahdollista. Huomioi lisenssi, laatu ja luotettavuus.
  • Kontrolloituja arvoja (esim. sanaston käsite tai toimijan tunniste) ja mahdollisuuksien mukaan pysyviä tunnisteita mahdollisimman paljon:
    • Kuvailevassa metadatassa:  lisätään käsitteisiin pysyviin tunnisteisiin perustuvia linkkejä muihin tietojärjestelmiin (esim. finto.fi).

    • Hyödynnä myös organisaatiolle, tekijöille ja muille toimijoille tarjolla olevia tunnisteita (esim. ORCID). Edistä kansallisten resurssien kehittämistä.

    • Rakenteellisessa metadatassa: Metadatan tulisi koneluettavasti  kuvata datan rakennetta. Käytä DataCiten relaatioita kuvaamaan esimerkiksi datasettien välisiä suhteita, esimerkiksi versioita.
    • Hallinnollisessa metadatassa: Lisenssit, käyttöoikeuksien rajoitukset ja niiden perusteet

  • Näitä tulisi tarjota palveluun integroituina ja käyttäjäystävällisinä toiminnallisuuksina: luokitteluja, sanastoja, PIDit. Linkitysten ja koneluettavuuden pitäisi käyttäjän kannalta syntyä automaattisesti.
  • Referenssimetadata = sallitut arvot = > koneluettavuus. Laajennuksia ja vapaatekstiä  on myös hyvä sallia mutta omissa kentissään.

2.2. Ohjeet data-asiantuntijalle / kouluttajalle

I1: (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.I2: (Meta)data use vocabularies that follow FAIR principles.I3: (Meta)data include qualified references to other (meta)data.
  • tue virallisten ja de facto standardien löytämistä, käyttämistä ja noudattamista
  • tue kontrolloitujen sanastojen ja ontologioiden käyttämistä, täydentämistä ja kehittämistä 
  • tunne sanastojen merkitys ja käyttö

    • datojen kuvailu ja sisällön ymmärrettävyys
    • datojen linkittyminen toisiinsa kuvailutermien välityksellä
    • datojen haku
    • tekoälyn käyttö johtopäätösten teossa
  • tunne keskeisimmät yleiset sanastot sekä semanttiset hakupalvelut ja osaa ohjaa kunkin erikoisalan sanastopalveluiden äärelle

  • Lähituessa  tieteenalasanastojen tuntijat

  • Kouluttajan on tunnettava perusteet linkitetyn datan vaatimuksista ja vaikutuksista sekä ymmärrettävä tieteenalakohtaiset näkökulmat.
    • Datametriikan näkökulma
    • Linkitetty data lisää tutkijan ja tutkimuksen näkyvyyttä ja vaikuttavuutta sekä datan uudelleenkäyttöä
    • Linkitetty metadata: eri vaihtoehtojen, seurausten sekä oman alan metadatastandardin tunteminen
  • Yhdessä tutkijan kanssa asioiden selvittäminen: voisiko tämä sopia teille, että tiedosta tulisi yhteentoimivampaa

  • Ontologioissa on implisiittistä oletusta tieteenaloista, mikä on haastavaa

  • Metadatan kuratointi (tarkistus ja täydennys) 

2.3. Ohjeet tutkijalle

I1: (Meta)data use a formal, accessible, shared, and broadly applicable language for knowledge representation.I2: (Meta)data use vocabularies that follow FAIR principles.I3: (Meta)data include qualified references to other (meta)data.
  • Harvemmin tutkijan käsissä, usein kiinni tarjolla olevista palveluista
  • Huomioi datan keräämisessä, luomisessa ja julkaisemisessa määrämuotoiset muuttujat
  • Suosi avoimia metadataformaatteja ja tiedostomuotoja kun mahdollista
  • Pyydä tarvittaessa tukea sopivan sanaston löytämisessä datatuesta tai palveluista tai muilta tutkijoilta. Jaa tietoa.

  • Tutkijan olisi hyvä antaa palautetta, jos sanasto ei ole riittävä tai kaipaa muutoksia.

  • Mitä rikkaampi kuvailu niin sen parempi/kuvailun rikastaminen pitkin matkaa

  • Huomioi, että (meta)tietojen säilyttämispaikka voi vaikuttaa sanastojen käyttämisen mahdollisuuteen

  • Oman alan sanaston hallinta osa tutkijan ammattiosaamista

  • Kerrottava, mihin sanasto perustuu. Dokumentaatiosta ja metadatasta tulisi käydä ilmi käytetty sanasto.

  • Tietää mistä saa apua ja osaa valita tallennuspaikan datalle, joka tarjoaa linkitetyn datan palveluita
  • Osa vastuullista tiedettä, koskee kaikkia tieteenaloja
  • On tietoinen/kiinnostunut asiasta

  • Osaavat vaatia käyttäjäystävällistä ja ymmärrettävää palveluja

  • Tutkimuksen tekemisen dokumentointi
    • Metadatasta viittauksia sekä eri data-aineistojen välille sekä muuhun metadataan
  • Versionhallinta 

3. Keskusteltavaa/pohdittavaa

4. Hyödyllisiä linkkejä*


* Avoimen tieteen kevättyöpajassa 18.3. sovittu, että tehdään lista ontologioista/niitä kokoavista palveluista