• Alkuperäinen taulukko jaettu kolmeksi taulukoksi (10.10.2023):
    • Taulukko 1 koostuu Suomen Akatemia yleisohjeituksista eri verkkosivuilla (kts. linkit)
    • Taulukko 2 koostuu Suomen Akatemian DMPol-templaatin johdannosta, ja
    • Taulukko 3 pitää sisällään varsinaisen DMPol-templaatin kysymyksineen.
  • Kerätään taulukoihin yleisiä huomioita Suomen Akatemian ohjeistuksista ja ehdotuksia uusiksi muotoiluiksi (pienryhmä-työstönä), sekä kommentteja uusista ehdotuksista.
  • Lisäksi Taulukossa 3 on omat sarakkeet DMPol - kommentoijien tueksi (mitä tulisi mainita ja mitä kannattaa jättää pois) ja viimeisenä sarake johon voi ehdottaa lisäyksiä tutkijan ohjetta varten (kootaan ns. Rahoituksen hakijan Check list - dokumenttia).


Taulukko 1:

AKATEMIAN YLEISET OHJEET: A-O Hakemisto, Hakuohjeistus ja toimintasuunnitelman ohjeistus
UUSI MUOTOILUEHDOTUS OHJEISIIN (määritelmien tarkennukset, uudelleenmuotoilut, lisäykset)
HUOMIOITA AKATEMIAN YLEISOHJEISTA (DMPol määritelmä, sanoitus, puutteita ohjeissa..)

FI: Ohjehakemisto A-Ö

EN: A–Z index of application guidelines


********************************************

LINKIT (pvm):
https://www.aka.fi/tutkimusrahoitus/hae-rahoitusta/nain-haet-rahoitusta/ohjehakemisto/ (2.6.2023 NN)
Alasivut:


FI:  Aineistonhallintasuunnitelmat - Suomen Akatemia (2.6.2023 NN)
EN: Data management plan guidelines - Academy of Finland (aka.fi)  (2.6.2023 NN)


Infrastruktuurien kohdalla tulisi käyttää sanoja:

FI: Aineistonhallinnanpolitiikka

EN: Data Management Policy (DMPol)


Ehdotuksena: Muutetaan "Ohjehakemisto A-Ö" verkkosivun otsikko 'Aineistonhallintasuunnitelmat' muotoon "Aineistonhallintasuunnitelma" josta linkki veisi vain Aineistonhallintasuunnitelman ohjesivulle. Sitten listataan omana otsikkonaan "Ohjesivusto A Ö"-sivulle 'Aineistonhallintapolitiikka', josta linkitys veisi puolestaan DMPol-sivulle. 2.6.2023

Tai: Ohjehakemisto A-Ö:n otsikko muutettaisiin muotoon "Aineistonhallintasuunnitelma ja -politiikka", josta linkitys sivulle joka listaa molemmat dokumentit, kuten tällä hetkellä. 2.6.2023

Terminologiaa pitää tarkentaa Akatemian sivuilla ja linkityksissä.

Aineistonhallintapolitiikka - FIRI


***************************************

LINKIT (pvm):
FI: Aineistonhallintapolitiikka - FIRI - Suomen Akatemia (2.6.2023 NN)
EN: Data management policy for researc - Academy of Finland (aka.fi) (2.6.2023 NN) 


Suomenkielisen ohjesivun lisääminen.

Tällä hetkellä ohjeet ovat vain englanniksi, jatkossa ohjeet tulisi olla myös suomeksi.




FIRI2023: Tiekartan ulkopuoliset tutkimusinfrastruktuurit

→ Hakemuksen osat ja niiden ohjeet

→ Toimintasuunnitelma:

"Aineistonhallintapolitiikka (data management policy). Tee suunnitelma DMPTuulin avustuksella tai Akatemian sivustolta löytyvän ohjeistuksen"

"Data management policy: write the plan with the DMPTuuli tool or following the Academy’s DMP guidelines."


*************************************

LINKIT (pvm):
FI: https://www.aka.fi/tutkimusrahoitus/hae-rahoitusta/haut/haut/firi2023-tiekartan-ulkopuoliset-tutkimusinfrastruktuurit/ (7.8.2023, HL)
EN: https://www.aka.fi/en/research-funding/apply-for-funding/calls-for-applications/apply-now2/firi-2023-non-roadmap-research-infrastructures/ (7.8.2023, HL)
FI: https://www.aka.fi/tutkimusrahoitus/hae-rahoitusta/haut/haut/firi2023-tiekartan-20212024-tutkimusinfrastruktuurit-ja-kansainvaliset-tutkimusinfrastruktuurijasenyydet/ (7.8.2023, HL)
EN: https://www.aka.fi/en/research-funding/apply-for-funding/calls-for-applications/apply-now2/firi-2023-roadmap-research-infrastructures-20212024-and-international-memberships/ (7.8.2023, HL)

DMPol ohjeisiin maininta:

FI: Kirjoita politiikka DMPTuulin avustuksella tai seuraavilla ohjeilla.

EN: "Write the policy with the DMPTuuli tool or the following guidelines."

Lisäksi terminologian korjaus toimintasuunnitelman ohjeisiin. (7.8.2023, HL)



Ehdotuksena joko lyhyt kuvaus sanan "Aineistonhallintapolitiikka" jälkeen siitä mikä Aineistonhallintapolitiikka on, ja että se ei ole sama kuin Aineistonhallintasuunnitelma? Vaihtoehtoisesti sanaan Aineistonhallintapolitiikka voisi upottaa tämä linkki. (14.9.2023, NN)


Tämä ei liity SA ohjeistuksiin, mutta ehkä Tuulinkin etusivulla** DMPol näkyä jotenkin (eikä vain vasta kun mennään templaattihakuun) joka myös helpottaisi DMPol/DMP erottamista? (14.9.2023 NN)


Terminologiaa pitää tarkentaa FIRI hakujen sivuilla ja DMPol ohjeissa. DMPol ohjeissa olisi hyvä maininta DMPTuuli työkalun olemassa olosta. (7.8.2023, HL)


FIRI2023-kuvauksen (linkki) Toimintasuunnitelma-osion alla on nyt selkeästi sana Aineistonhallintapolitiikka (14.9.2023 NN).


Jos asiakas tulee termin kanssa ensimmäistä kertaa kosketuksiin nimenomaan tässä FIRI-kuvauksen yhteydessä, pitäisikö myös tässä olla lyhyt selitys siitä mikä dokumentti on kyseessä? Mielestäni tässä nykyisessä ratkaisussa Aineistonhallintapolitiikan ja Aineistonhallintasuunnitelman käsite voi sekoittua ehkä siksi että ohjeistuslinkki ohjaa linkkiin jonka takaa paljastuu Aineistonhallintasuunnitelma-otsikko* kts kuvakaappaus alla:

*


Samoin DMPTuuli** työkalu ensisijassa mielletään Aineistonhallintasuunnitelmiin, vaikka tietysti linkki työkaluun on erittäin hyvä tässä (14.9.2023, NN)

**


FIRI 2023 guidelines for action plan: infrastructures on 2021–2024 roadmap and international RI memberships

"The research infrastructure’s data management policy is described on a separate appendix. The data management policy that you have submitted with your roadmap application needs to be updated only if the project described in this application significantly changes it."


******************************

LINKIT (pvm):
WORD-templaatteja:
EN: https://www.aka.fi/globalassets/10rahoitus/2023-liitteet/academy_action-plan_template_firi_roadmap2023.dotx (7.8.2023, HL)
&
EN: https://www.aka.fi/globalassets/10rahoitus/2023-liitteet/academy_action-plan_template_firi_non-roadmap2023.dotx (7.8.2023, HL)


Vastaava ohjeistus verkkosivuilla:
FI: https://www.aka.fi/tutkimusrahoitus/hae-rahoitusta/nain-haet-rahoitusta/ohjehakemisto/tutkimussuunnitelma/2023/firi2023-tiekartan-2021-2024-tutkimusinfrastruktuurit-ja-kansainvaliset-tutkimusinfrastruktuurijasenyydet/ (14.9.2023 NN)
EN: https://www.aka.fi/en/research-funding/apply-for-funding/how-to-apply-for-funding/az-index-of-application-guidelines2/research-plan-structure/2023/firi-2023-guidelines-for-action-plan-infrastructures-on-20212024-roadmap-memberships/ (14.9.2023 NN)



DMPol ohjeissa olisi hyvä myös mainta, että  muutokset mainintaan toimintasuunnitelmassa. Tuleeko muutosten näkyä myös DMPolissa? (7.8.2023, HL)








Kuvakaappaukset verkkosivuilta FI/EN (10.10.2023 NN):



Taulukko 2:

AKATEMIAN DMPOL-TEMPLAATTI: Johdanto
UUSI MUOTOILUEHDOTUS TEMPLAATIN JOHDANTOON (määritelmien tarkennukset, uudelleenmuotoilut, lisäykset)
KOMMENTIT UUDESTA MUOTOILUEHDOTUKSESTA (pvm, nimikirj.)
YLEISIÄ HUOMIOITA AKATEMIAN TEMPLAATIN JOHDANNOSTA (DMPol määritelmä, sanoitus, puutteita ohjeissa..)

Data management policy for research infrastructures

Research infrastructures should have a research data management policy that offers guidelines to staff and users and ensures the appropriate maintenance of research data. This entails having clear instructions on how and where the produced data can be preserved for reasonable periods of time and on how the user should make the data available for verification and (re-)use.1 Data produced by the research infrastructure should aim to be FAIR (findable, accessible, interoperable and re-usable)2.



***********************

LINKIT (pvm):
https://www.aka.fi/en/research-funding/apply-for-funding/how-to-apply-for-funding/az-index-of-application-guidelines2/data-management-plan/data-management-policy--research-infrastructures/



Ohjeissa tulee olla selkeä määritelmä DMPolicylle ja sen mahdollinen lyhennne avattuna.

Lisäksi DMPolicyn määritelmässä voisi tuoda esille eron sekä aineistohallintasuunnitelman että -politiikan välillä: "Research infrastructures and users should agree on a data management plan (DMP), outllining how the research data of the project will be handled."


Viittauksen "European Commission, (2016) European Charter for Access to Research Infrastructures - Principles and Guidelines for Access and Related Services (Chapter 4 – Principles & Guidelines, pp. 10–13)" verkkosivuilla voisi laittaa kattamaan myös ohjeituksen, jossa määritellään DMP. (7.8.2023, HL)


Jotkut tiekartalle hakevat infrat Suomessa liittyvät kansainväliseen suurempaan tutkimusinfrastruktuuriin, jolla on jo selkeä yhtein datanhallintapolitiikka. Silloin DMPolicyn tekeminen on selkeämpää kuin se, että tehdään jotain ihan ensimmäisenä. Infran kypsyysasteetta riippuen, voi olla ettei ole vielä mitään suuntaviivoja, miten dataa hallinnoidaan yhteisen politiikan mukaan. Infran saattaa kuulua monta osapuolta, jossa jokaisessa yksikössä on  omat systeemit datan tuottamiseen, varmuuskopiointiin, jakamiseen ja tallentamiseen. Ensin on tiedostettava: mitä infrassa tehdään? kuka tekee ja miten, millä välineillä, mitä infrassa tuotetaan ja kenelle? Nämä nimenomaan datan kannalta. Pitääkö infran tarjoamat avoimet palvelut kuvat DMPolissa vai Toimintasuunitelmassa? Näiden suhde on joskus hankala. (2020 kommentit)


Tutkimusinfrastruktuurin DMPolin suhde olemassa oleviin muihin dokumentteihin pitäisi määritellä eli selkeä maininta siitä, mikä on pohja-asiakirja. Ks. esimerkki https://www.fsd.tuni.fi/fi/tietoarkisto/asiakirjat/tietoarkiston-aineistonhallintapolitiikka/ (7.8.2023, HL)


Aineistonhallinnansuunnitelman määritelmä löytyy ainakin tutkimushallinnon sanastosta: FI: "dokumentti, jossa kuvataan mikä tutkimuksessa käytettävä aineisto on, miten sen omistajuus on järjestetty, miten se hankitaan, miten sitä säilytetään ja käytetään sekä mitä tutkimusdatalle tehdään tutkimuksen päätyttyä. Suunnitelma on muuttuva dokumentti ja sitä täydennetään tutkimuksen edetessä." ja EN: "a document describing what material is used in the study, how its ownership is organised, how it is obtained, how it is stored and used, and what is done to the research data at the end of the study. The plan is a changing document and will be updated as the research progresses." (28.8.2023, HL)

DMPolin määritelmä (EU 2016, vier. viite): Research Infrastructures should have a research data management policy ensuring that research data are appropriately maintained, archived for a reasonable period, and available for review and (re-)use. Research Infrastructures and Users should have an agreement on how to (re-)use the data. If appropriate, they are also encouraged to consider providing open access to research data. (LS 14.9.2023)





Tulisiko alussa olla viittaus "Tutkimusaineistojen ja -menetelmien avoimuus. Korkeakoulu- ja tutkimusyhteisön kansallinen linjaus ja toimenpideohjelma 2021–2025: Osalinjaukset 1 (Tutkimusdatan avoin saatavuus) ja 2 (Tutkimusmenetelmien ja -infrastruktuurien avoin saatavuus)" osalinjaukseen, jossa määritellään esimerkiksi avoin tutkimusinfrastruktuuri? (7.8.2023, HL)



Taulukko 3.

AKATEMIAN DMPOL-TEMPLAATTI: Kysymykset ja apukysymykset
UUSI MUOTOILUEHDOTUS TEMPLAATIN KYSYMYKSEEN
KOMMENTIT UUDESTA MUOTOILUEHDOTUKSESTA (pvm, nimikirj.)
YLEISIÄ HUOMIOITA AKATEMIAN TEMPLAATIN KYSYMYKSESTÄ


DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi mainita?
DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi jättää pois?
RAHOITUKSEN HAKIJAN KENTTÄ: Tarkistuslistalle lisättäviä
General description of data managed within research infrastructure





  • What kinds of data are produced by or associated with the research infrastructure?

Ohje: FIN

  • Mieti, mitä tietotyyppejä (esim. numeeriset arvot, kuvat, tekstit) infrastruktuurisi käsittelee. Käytä apuna taulukkoa, (lisää myös datan alkuperä, esimerkiksi itse tuotettu data, asiakkaiden tuottama data)
  • Kuvaa, miten data liittyy infrastruktuurisi toimintaan: Onko se dataa, jota infrastruktuuri itse tuottaa, vai tuleeko se ulkopuolisista lähteistä?
  • Jos infrastruktuurisi yhdistää erilaisia datalähteitä, mainitse tämä ja selitä, miten.

EN

  • Consider the types of data (e.g., numerical values, images, texts) that your infrastructure handles. Use the table as a reference, (also add the origin of the data, for example, self-produced data, data produced by clients).
  • Describe how the data relates to the operation of your infrastructure: Is it data that the infrastructure itself produces, or does it come from external sources?
  • If your infrastructure combines different data sources, mention this and explain how.


Sanoituksesta: tässä huomioitu että infra ei välttämättä tuota dataa eli infra voi "itsessään" olla dataa (jokin resurssi kuten kokoelma tietoa), johdannossa painotetaan että osan kysymyksistä voi jättää tyhjiksi (2.6.2023 NN)

Erilaisia tapauksia erilaisissa infroissa:

  • Infrassa on ylläpitäjien keräämää/kokoamaa dataa.
  • Infrassa asiakkaat tuottavat itse datan esim. mittalaitteilla.
  • Asiakkaat tuovat oman datansa infraan.
  • Asiakkaat käyttävät infrassa olemassa olevaa dataa omaan tutkimukseensa.
  • Asiakkaat mittaavat itse datan, ottavat sen ulos, mutta antavat sen myös infralle.
  • Asiakas tilaa infralta palvelun ja saa datan infralta.
  • Asiakas tilaa infralta palvelun, saa datan infralta, mutta data jää myös infraan.
  • Infra säilyttää asiakkaan data palvelun jälkeen. (20.9.2023 LS)

Tee taulukko eri datatyypeistä, esim. mittausdataa, mikroskooppikuvia, tekstitiedostoja, ääninäytteitä, sekvenssejä. (26.9.2023 LS)

Lisää taulukkoon, missä kukin datatyyppi tai osa-aineisto on tuotettu tai mistä siirretty. Jos FIRI säilyttää asiakkaiden tuottamaa dataa tietyn ajan tai se jää FIRIin muiden käyttöön, se voidaan merkitä myös taulukkoon. (26.9.2023 LS)

Mikäli FIRI on laaja esim. monista eri yksiköistä koostuva, datan lähteitä tai tyyppejä on paljon, tiivistä kuvailu, kerro yleisesti minkä tyyppistä data on tai tee erillinen aineistonhallintasuunnitelma esim. FIRIn sisäiseen käyttöön. (26.9.2023 LS)

Esimerkkejä:

Palvelussa säilytetään erilaisten lajien havaintotietoja. Tieto kerätään viranomaisilta ja sitä syntyy mm. iNaturalistin käytön yhteydessä. Lisätietoa: https://laji.fi/save-observations (2021, MEK/26.9.2323 LS)

Mittalaitteet. Jokainen laite tuottaa erilaista dataa, esim. UV-spektrejä, massaspektrometridataa. Laitteiden tuottama data on pääsääntöisesti laitevalmistajakohtaisessa suljetussa formaatissa, mutta käyttöohjeissa on kerrottu, kuinka datan voi konvertoida alan tieteellisten lehtien hyväksymään avoimeen jaettavaan formaattiin: (linkki käyttöohjeeseen). (2021, MEK/26.9.2323 LS)

"Infrastruktuurissa säilytetään biologista materiaalia potilaista ja terveistä ihmisistä. Näytetyyppejä ovat esim. DNA, kudokset, solut, veri tai muut ruumiinnesteet, sisältäen linkkejä kliiniseen ja tutkimusdataan." (26.9.2323 LS)

Minna 28.9.2023: Huom. esim. CSC RI:ssä me olemme palveluntuottaja ja tarjoamme infran, mutta emme edes tiedä mitä kaikkea dataa loppukäyttäjät palveluihin laittavat eikä meillä ole lupaa tarkastella kaikkea dataa. Erilaiset tietotyypit/ types of data olemme jakaneet tekstin, kuvan tai numeerisen datan sijaan palveluiden perusteella esim. onko active data, dynamic research data, research data publication, digital preservation.. Tai computing puolella sillä perusteella onko public, non sensitive/sensitive personal information, security classified data etc.

Tässä kuvataan infrassa tuotettu tai siihen siirretty tutkimusdata. (20.9.2023 LS)

  • Does your infrastructure handle personal or sensitive data? If yes, please give a link to your data privacy policy or attach the document.


  • Henkilötietoja ovat kaikki tiedot, jotka voidaan liittää suoraan tai epäsuorasti yksittäiseen henkilöön. Arvioi, sisältääkö infrastruktuurisi tällaisia tietoja (21.9.2023 LM)
  • Personal data includes all information that can be directly or indirectly linked to an individual. Evaluate whether your infrastructure contains such information (21.9.2023 LM). 
  • Tutustu organisaatiosi tietosuojaa koskeviin ohjeisiin ja ota tarvittaessa yhteyttä tietosuojavastaavaan. (27.9.2023 NMS)
  • Please consult your organisation's personal data guidelines and contact the Data Protection Officer if necessary. (27.9.2023 NMS)

Onko infrastruktuurissa itsessään tai voiko siellä käsitellä henkilötietoja tai sensitiivistä dataa? (26.9.2023 LS)

Vastaako infrastruktuurin ylläpitäjä vai palvelua käyttävä asiakas henkilötietojen käsittelystä? (26.9.2023 LS)

Missä muodossa data on tai voidaan käsitellä infrastruktuurissa? (esim. pseudonymoituna, anonymisoituna) (26.9.2023 LS)

If personal data are processed, how will compliance with legislation on personal data and on security be ensured? (26.9.2023 LS) https://scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_final.pdf

Consider data protection, particularly if your data is sensitive for example containing personal data, politically sensitive information, or trade secrets. Describe the main risks and how these will be managed. (26.9.2023 LS)  https://scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_final.pdf

Mikäli infrastruktuurissa voidaan käsitellään henkilötietoa tai sensitiivistä dataa tarvitaan tietosuojaseloste (vai ilmoitus?). Tämä olisi hyvä julkaista avoimesti infrastruktuurin kuvailussa ja käyttöehdoissa.  Mikäli infrastuktuurilla ei ole vielä tietosuojailmoitusta, niin kerro, kuka tulee olemaan henkilötietoa sisältävän datan rekisterinpitäjä, henkilötiedon keruun peruste, tutkittavien informointi jne. (26.9.2023 LS)

Kerrotaanko palvelun  käyttöohjeissa ja -ehdoissa, että palvelu ei sovellu arkaluonteisten henkilötietojen käsittelyyn? (26.9.2023 LS)

Jos henkilötiedon tai sensitiivisen datan käsittely ei ole sallittua, miten tätä kontrolloidaan? (26.9.2023 LS)

Kysymys:

Jos eri tutkijat ovat tuoneet infraan henkilötietoa, niin säilyykö rekisterinpitäjyys tutkijalla vai siirtyykö se infrastruktuurin ylläpitäjälle?  (26.9.2023 LS)

DMPolissa ei käsitellä infrastruktuurin asiakkaista muodostuvaa henkilörekisteriä. Käsitellään tutkimusdataa. (20.9.2023 LS)
  • Give a rough estimate of the size of the data produced, for example per day, month or year.


  • Arvioi, kuinka paljon dataa infrastruktuurisi tuottaa tai vastaanottaa tietyssä ajassa (esim. päivässä, kuukaudessa, vuodessa). Voit käyttää GB, TB tai muita yksiköitä) 
  • Estimate how much data your infrastructure produces or receives within a specific timeframe (e.g., daily, monthly, yearly). You can use GB, TB, or other units


Jos dataa tuotetaan vain tutkijan omaan käyttöön, tuotetun datan määrä arviointi voi olla hankalaa. (2020 kommentti)

Sanoituksesta: tässä voi vielä painottaa että kohdan voi jättää tyhjäksi jos kysymys ei ole relevantti, esim, muotoilulla "If relevant, give a rough estimate.."? (2.6.2023 NN)

Give details on the volumes (they can be expressed in storage space required (bytes), and/or in numbers of objects, files, rows, and columns). https://scienceeurope.org/media/4brkxxe5/se_rdm_practical_guide_extended_final.pdf

Esimerkkejä:

"Palvelu ei kirjaa tuotetun datan määrää, eikä ota kantaa sen läpi virtaavan datan laadusta." (2021 MEK/26.9.2023 LS)

"Palvelussa on (19.11.2021) 40 916 955 havaintoa, 41 620 lajia ja 454 aineistoa." (2021 MEK/6.9.2023 LS)

"We expect 50-100 users that operate up to 3000 samples/year in the laboratory" ((26.9.2023 LS))




  • Does your infrastructure use data quality control procedures or recommend these to users? If yes, please describe these procedures.


  • Jos annat suosituksia tai ohjeita käyttäjillesi datan laadusta, kuvaa ne lyhyesti.
  • Kuvaa, miten varmistat datan laadun ja eheyden infrastruktuurissasi. Tämä voi sisältää automaattisen datan validoinnin, manuaalisen tarkistuksen tai muut menetelmät. 
  • If you provide recommendations or guidelines to your users about data quality, briefly describe them.
  • Describe how you ensure data quality and integrity in your infrastructure. This might include automatic data validation, manual checks, or other methods.

  • Lisää esimerkkejä:

"Havaintotiedon laadunvalvonta: https://laji.fi/about/772" (2021 MEK/6.9.2023 LS)

"Infrastruktuuri tarjoaa työkaluja datan validointiin ja monitoriointiin." (2021 MEK/6.9.2023 LS)

"Throughout the preparation and analyses, the use of the Laboratory Information Management System (LIMS) is preferred in storing the essential data related to process quality control and reporting."  (26.9.2023 LS)

  • Laatukäsikirja











Agreements on rights of use








  • How are ownership and user rights agreed upon concerning research data?
  • How is ownership agreed upon concerning the research data? 

-Does the user of the infrastructure own the data (produced by the device or taken from a collection of data) or is there joint ownership?

-In the case of distributed infra, are there several partners who own the devices or facilities?

-In the case of a virtual infra (such as a collection of data), does the data originate from the same contributor/source or are there various contributors to the virtual data infra, with implications for agreeing about ownership?


  • How are user rights agreed upon concerning the research data?

- Examples of user rights: merging new files, administrative use, re-identification, redistribution right, use for training and awareness, destruction of files. 


FI:

  • Miten tutkimusdatan omistajuudesta on sovittu?

-Omistaako infran käyttäjä datan (joka on joko tuotettu infrasta tai josta infra koostuu datakokoelmana) itse vai onko datalla yhteisomistajuus infran kanssa?

-Hajautetun infran tapauksessa, omistaako useampi taho laitteen tai tilat?

-Virtuaalisen infran tapauksessa (kuten kokoelma dataa), onko sama taho koonnut/tuottanut datan vai onko useampi taho osallistunut datan tuottamiseen siten että se vaikuttaisi omistajuudesta sopimiseen?


  • Miten tutkimusdatan käyttöoikeuksista on sovittu?

-Esimerkkejä käyttöoikeuksista: tiedostojen yhdistäminen, hallinnollinen käyttö, jakeluoikeus, käyttö opetustarkoitukseen ja tiedon levittämiseen, tiedostojen tuhoaminen.




Infraan kertyneen datan käyttöoikeus ja omistajuus on sovittava. Jos tutkija mittaa tai mittauttaa infrassa omaan tutkimukseensa datan, pitäisi olla sopimus, jos data jää myös infraan, mihin sitä voidaan käyttää. (2020 kommentti)


Ehdotuksessamme uudeksi muotoiluksi olemme jakaneet kysymyksen omistajuudesta ja käyttöoikeuksista kahdeksi eri kysymykseksi. Tämän taustalla oli se että aloimme miettiä näitä erikseen, mitä ne pitävät sisällään miten niitä määritellään tutkimusdatan puitteissa. Jakamalla kysymyksen voisimme myös tarjota enemmän ohjeistavia lisäkysymyksiä (kts ranskalaisin viivoin luonnokset mahdollisista ap), jotka ottaisivat huomioon eri skenaarioita (hajautetut infrat, virtuaali infrat tms..) (10.10.2023). 

Datan omistajuuden määrittelystä, esim. “data ownership is widely considered as the possession of complete control over the data and its rights including, but not limited to access, creation, generation, modification, analysis, use, sell, or deletion of the data, in addition to the right to grant rights over the data to others.” 

Datan käyttöoikeuksista, esimerkkeinä: "merging new files, administrative use, re-identification, redistribution right, use for training and awareness, destruction of files."

lähde: https://www.mdpi.com/2078-2489/12/11/465. (10.10.2023)




  • If you have a user agreement document, please give a link to it or attach the document


  • If the infrastructure has a user rights agreement document, please i) give a link to it, or ii) add it here as an attachment. If there are several such documents, please link them accordingly.


  • If the infrastructure does not have a user rights agreement yet, please consider preparing one.

FI:

  • Jos infrastruktuurilla on käyttäjän sopimus (koskien datan käyttöoikeuksia), i) anna sen linkki, tai ii) lisää se tähän liitetiedostona.


  • Jos infrastruktuurilla ei ole käyttäjän sopimusta, kannattaa sellainen tehdä.



Tässä ehdotuksena kakkosbullett, jossa kehotetaan infraa tuottamaan dokumentti. Eli tämä nyt sellaisena "opetuksellisena vinkkinä" mutta voi ottaa poiskin.


Huomiona että pitäisikö user agreement - termin sijaan kirjoittaa tähän kysymykseen "user rights agreement"?  Tässä nyt ehdotettu sellaista muotoilua. Tämä tuli mieleen siitä, että ylemmässä kysymyksessä puhutaan "user rights" ja tässä puolestaan vain "user agreement" eli voiko tämä "user agreement" termi olla liian ylimalkainen? Yritin etsiä julkista esimerkkiä infran "user agreement" dokumentista mutta en löytänyt. Ohessa kuitenkin samantyyppinen Oulun yliopiston infrasta, nimellä "Data license agreement" linkki: https://www.sgo.fi/Data/licence.php, . Jos tuo infra tekisi DMPol niin voisiko he linkata tämän "user agreement" dokumenttina vai onko se vielä jotain muuta?  (10.10. 2023 NN)

Tässä varalta lisätty myös monikkomuoto, sillä voiko olla niin että hajautettu infra koostuu useasta laitteesta ja niillä on omat käyttäjäsopimukset? (10.10.2023 NN)













Opening or restricted sharing of data (tämä tulisi DMPolin loppuosaan)
UUSI MUOTOILUEHDOTUS TEMPLAATIN KYSYMYKSEEN
KOMMENTIT UUDESTA MUOTOILUEHDOTUKSESTA (pvm, nimikirj.)
YLEISIÄ HUOMIOITA AKATEMIAN TEMPLAATIN KYSYMYKSESTÄ


DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi mainita?
DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi jättää pois?
RAHOITUKSEN HAKIJAN KENTTÄ: Tarkistuslistalle lisättäviä
  • What part of the data managed by the research infrastructure is restricted, openly available or published?


Is the data or parts of the data managed by the research infrastructure restricted, openly available, published or a combination by these? Please describe and justify why.


FI: Onko tutkimusinfrastruktuurin tuottama data pääsyoikeuksiltaan rajoitettua, avoimesti saatavilla, julkaistua vai yhdistelmä näistä? Kuvaile ja perustele miksi.


Miksi kysytään osuuksia? TS, PL 26.9.2023: Tässä varmaankin ajatellaan sitä, että infra voi tuottaa monentyyppistä dataa ja se voi tuottaa sellaista dataa, joka voidaan avata, mutta myös sellaista, jota voidaan jakaa vain tietyin, rajoitetuin käyttöehdoin (infran käyttäjälle?). Siksi on ajateltu, että kysymys muotoillaan noin alunperin eli mikä osa datasta on sellaista ja tällaista? TS 3.10.2023

Kertokaapas viisaammat mikä ero on openly available vs. published? Vai voiko olla openly available vaikka ei olekaan published? Sitäkö tässä haetaan takaa (non-restricted) (smile) TS 26.9.2023

Eli tässä kuvaillaan "datasetit" tai "datatyypit", jotka kuuluvat johonkin noista kolmesta kategoriasta? Olisiko taulukko hyvä neuvo tähän? Tai jos infra on suuri ja kuvaa kaikki mahdolliset datatyypit, joita voi olla satoja, niin taulukko ei sovellu. TS 26.9.2023

Käytännössä tässä pitää miettiä datan käyttöoikeuksien astetta, eikös juu? TS 26.9.2023

Tarvitsemme siis esimerkkejä (infratyyppi-esimerkkejä?) näihin kaikkiin ohjekohtiin!!! TS 26.9.2023

Voisiko kysyä infroilta, että voiko heidän DMPoliaan käyttää esimerkkeinä? Joko kommentoijat kysyvät tai Akatemia? TS, PL 26.9.2023

Kaksi ensimmäistä kysymystä on infralle itselleen ja loput ovat infran käyttäjille suunnattuja "käyttöohjeita". TS 3.10.2023

Ensi viikolla suomennos kaikkiin kohtiin (smile)Tehty viikolla 41 TS

Kuvaile ja perustele loppuun! Ja laita data tyypit mukaan kysymykseen. TS 13.10.2023 Tehty 16.10.2023 TS

suom.kieliseen pääsy dataan? Tehty 16.10.2023 TS




  • Describe development work and actions that you have for opening or the restricted sharing of data.


Describe plans of action that the infrastructure has for promoting openness and transparency of the data. 


FI: Kuvaile miten tutkimusinfrastruktuuri edistää datan avoimuutta ja läpinäkyvyyttä.



Tähänkö kirjoitetaan esim. käyttöoikeussopimusten sisältöä? Vai valittuja datarepoja avaamiseen/julkaisemiseen vai infran nettisivut? TS 26.9.2023

Esimerkkejä tähänkin kohtaan tarvittaisiin. TS 26.9.2023

Kysymyksen muotoilu: onko teillä development työtä vai oletetaanko, että kaikilla on aina jotain kehitettävää? TS, PL 26.9.2023

Ehdotus Paulalle ja Annalle kysymyksen muotoiluksi (TS 3.10.2023): 

  • Describe plans of action that the infrastructure has for opening or the restricted sharing of data. 

Mutta edelleen en ole varma mitä itse tähän kirjoittaisin? Samojako kuin nuo alla olevat asiat usereille? (TS 3.10.2023)

Mitä infra tekee edistääkseen datan avaamista? Ja ehkäpä ristiriitaa siinä, että voiko kehittää datan rajattua pääsyoikeutta 13.10.2023 Muotoilin kysymyksen uudelleen ja poistin rajatun pääsyn kokonaan uudesta kysymyksestä, mutta sen voi lisätä takaisin, jos halutaan. 16.10.2023 TS




Describe the guidelines you give to users on the following issues:

  • How should the research infrastructure be cited?


  • Describe how the research infrastructure should be cited by the user?

FI: Kerro kuinka käyttäjän tulisi siteerata tutkimusinfastruktuuriinne omissa tuotoksissaan?


Tämä on helppo kohta. TS 26.9.2023

Siteeraminen on tärkeää infran omien palveluiden markkinoinnin kannalta sekä myös (infrojen/organisaatioiden/erillisen tutkijan) datojen löydettävyyden kannalta!!!!! Tarvitseeko tällaista motivaatiota kirjoittaa kysymykseen alakohdaksi?


Kertoa infran siteerauksen esimerkki.
Onko infran siteeraus kerrottu?
  • Do you provide a model/example data citation? Do you provide unique and persistent identifiers (e.g. Digital Object Identifier (DOI)) for datasets, records or other digital objects?


  • Does the infrastructure provide a model/example of data citation for the user? Does the infrastructure provide unique and persistent identifiers (e.g. Digital Object Identifier (DOI)) for datasets, records or other digital objects for the users to utilize in their later work?


FIN: Tarjoaako infrastruktuuri käyttäjälle mallin/esimerkin tutkimusdatan siteeraamisesta? Tarjoaako infrastruktuuri dataseteille tai muille digitaalisille objekteille pysyviä tunnisteita (esim. Digital Object Identifier (DOI)), joita käyttäjät voivat hyödyntää myöhemmässä työssään?


Tässä templaatin kysymykset ovat kyllä/ei vastauksella kuitattuja? Voisiko muotoilla jotenkin, niin että kertovat keinot kuinka toteuttavat nämä asiat? Vai onko tarpeen meidän tietääkään (smile)

Vai onko tuo alun describe komento näille kaikille kohdille?

TS 26.9.2023

Edellä oli kohta infran siteeramisesta ja tässä datan siteeramisesta? Puuttuu muuten of-prepositio tuolta. TS 26.9.2023

Kenelle DMPolia kirjoitetaan? Arvioijalle voi riittää vain kyllä/ei vastaukset...TS, PL 26.9.2023

Minna 28.9.2023: Hyviä pointteja! Alan kallistua useammassa kohdassa templaattia kyllä/ei vastauksiin (smile)

Ehdotus Paulalle ja Annalle kysymyksen muotoiluksi (TS 3.10.2023): 

  • Does the infrastructure provide a model/example of data citation for the user? Does the infrastructure provide unique and persistent identifiers (e.g. Digital Object Identifier (DOI)) for datasets, records or other digital objects for the users to utilize in their later work?



  • What licence(s) do you recommend for data sharing?


  • What licence(s) does the infrastructure recommend when the user of the infrastructure is making the data openly available?

FIN: Mitä lisenssejä tutkimusinfrastruktuuri suosittelee datan avaamiseksi?


Tässä puhutaan yhtäkkiä "sharing", jonka itse ymmärrän datan antamisena ihmiseltä toiselle eikä ns. avaamisena (julkaisemisena). Eli tarkoitetaanko tässä, että kuinka toimitaan kun infralla tuotettua dataa jaetaan edelleen (uusiokäyttöön) vai kun sitä avataan esim. repossa? eli epäselvä! TS 26.9.2023

Halutaanko tässäkin vain kyllä/ei/NA vastaus? Vai halutaanko kuitenkin laittaa miettimään mikä olisi validi lisenssi? TS, PL 26.9.2023

Tässä voisi vielä miettiä noita avaaminen/julkaiseminen/jakaminen termejä, että mikä nyt on oikea ja mitä tässä halutaan kysyä. TS 3.10.2023




  • How do you recommend that data is preserved in the long term?


  • How does the infrastructure recommend that data is preserved in long term by the user?

FIN: Millaisia käytänteitä tutkimusinfrastruktuuri suosittelee käyttäjälle tutkimusdatan pitkäaikaiseen säilytykseen?


Selkeä kysymys...

Voiko tähän olla vastauksena NA? Ehkä nyt kun ajattelee, niin infra voi joko omistaa käyttäjälle antamansa datan tai olla omistamatta, jolloin infralla ei välttis ole tarjota pitkäaikaissäilytysratkaisua (vai onko hyvää asiakaspalvelua (wink) ) TS 26.9.2023

Ehdotus Paulalle ja Annalle kysymyksen muotoiluksi (TS 3.10.2023): 

  • How does the infrastructure recommend that data is preserved in long term by the user?



Documentation and metadata








  • What kinds of tools and guidance do you provide for documentation and metadata?

EN:

  • What kinds of tools and guidances (e.g. OpenAIRE Guidelines for Data Archives — OpenAIRE Guidelines documentation) does the research infrastructure (RI) provide for documentation? Add links to documentation guidelines if possible.
    • Does RI provide unique and persistent identifiers (PID), either DOI or URN for datasets, records or other digital objects? Or which services RI will use to provide them?
    • What licence(s) does RI recommend for data sharing?
  • Does the RI use some recommended metadata standards or README files or other documentation guidelines for data(sets)? What standard vocabularies or classifications does RI recommend/require to be used in metadata? 

FI:

  • Millaisia työkaluja ja ohjeita (esim. OpenAIRE Guidelines for Data Archives — OpenAIRE Guidelines documentation) tutkimusinfrastruktuuri (RI) tarjoaa dokumentointiin? Lisää linkkejä dokumentaatio-ohjeisiin, jos mahdollista.
    • Tarjoaako RI yksilöllisiä ja pysyviä tunnisteita (PID), joko DOI- tai URN-tunnisteita, aineistoille, tallenteille tai muille digitaalisille objekteille? Tai mitä palveluita RI käyttää niiden tarjoamiseen?
    • Mitä lisenssiä/lisenssejä RI suosittelee tiedon jakamiseen?
  • Käyttääkö RI joitakin suositeltuja metadatastandardeja tai README-tiedostoja tai muita dokumentointiohjeita datoille/aineistoille? Mitä standardisanastoja ja
    luokituksia RI suosittelee/edellyttää käyttämään metadatoille?


Liian yksinkertaistettu kysymys, johon hankala vastata (antaa tilaa luovuudelle). Sinä muodon sijasta voisi käyttää tutkimusinfrastruktuuria.

Tulisiko tämän kysymyksen olla ennen kohtaa "Opening or restricted sharing of data", koska avaamista ei voida tehdä, jos dokumentointi on puutteellista/olematonta.

Pitäisikö tässä kohdin olla enemmin mainittuna PID ja lisenssi? Katso OpenAIRE ohjeet dokumentoinnille: OpenAIRE Guidelines for Data Archives — OpenAIRE Guidelines documentation.

Dokumentointiohjeet lyhyesti ja/tai linkki dokumentointiohjeisiin

Metadatastandardi mainittuna tai kuvailtu dokumentointi kerrottuna

PID

Lisenssi


Ei FAIR periaatteiden läpikäyntiä esim. "We will make data FAIR."

Ei yksityiskohtaista dokumentointia aineiston keräämisen osalta



Ks. DMPOL KOMMENTOIJAN KENTTÄ









Storage, backup and access control to data
UUSI MUOTOILUEHDOTUS TEMPLAATIN KYSYMYKSEEN
KOMMENTIT UUDESTA MUOTOILUEHDOTUKSESTA (pvm, nimikirj.)
YLEISIÄ HUOMIOITA AKATEMIAN TEMPLAATIN KYSYMYKSESTÄ


DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi mainita?
DMPOL KOMMENTOIJAN KENTTÄ: Mitä tässä kohdassa hakijan tulisi jättää pois?
RAHOITUKSEN HAKIJAN KENTTÄ: Tarkistuslistalle lisättäviä
  • What kinds of data storing services do you provide?
    • Do you provide services for storing sensitive data?


Kysymykset:

  • What kinds of data storing services do you provide?
    • Does the infrastructure provide services for storing sensitive data? 
    • Does the infrastructure have a defined access policy? Link or attach if applicable.
  • Does the infrastructure provide backups? If yes, where do the services store it and who has access to it?

  • Millaisia palveluja tutkimusinfrastruktuuri (RI) tarjoaa datan tallentamiseen?
    • Onko RI:llä palveluja sensitiivisen datan tallentamiseen?
    • Onko RI:llä määritelty käyttöoikeuspolitiikka? Lisää linkki tai liite, jos mahdollista.
  • Tarjoaako RI varmuuskopioita? Jos kyllä, minne ne tallennetaan ja keillä on pääsy niihin?

Ohje:

  • Does the infrastructure provide long term preservation? 
  • Are your storing services GDPR compliant? Link to your Privacy Notice.
  • Access policy: Research Infrastructures should have a policy defining how they regulate, grant and support access to users.

  • Tarjoaako tutkimusinfrastruktuuri palveluja datan pitkäaikaissäilytykseen?
  • Ovatko tallennuspalvelut GDPR-yhteensopivia? Linkki tietosuojailmoitukseen.
  • Käyttöoikeuspolitiikka: Tutkimusinfrastruktuureilla tulisi olla politiikka, jossa määritellään, miten ne säätelevät, myöntävät ja tukevat käyttäjien pääsyoikeuksia dataan.



Pitäisikö mainita myös pitkäaikaissäilytys? Millainen pääsynvalvonta on sensitiivistä dataa sisältävään aineistoon (nt) → pitkäaikaissäilytyksestä kysytään toisaalla (jk) Siis jos on pitkäaikaissäilytys, niin missä? (nt)

Pitäisikö kysyä missä dataa säilytetään (sijainti ja mahdollinen tietojen luovutus kolmansille osapuolille)? nt

European Charter for Access to Research Infrastructures: Research Infrastructures should have a policy defining how they regulate, grant and support Access to (potential) Users from academia, business, industry and public services. (MA 3.10.)

Olisi hienoa, jos tässäkin voisi linkata eteenpäin esim. access policyyn. Miten oleellinen asia backup on tässä kohtaa ja millä tasolla pitäisi kuvata? Monissa palveluissa backup ei ole automaatio vaan käyttäjän vastuulla. (MA 3.10.)




  • What kind of certificate do you have for your data storage service?


  • What kind of certificate do you have for your data storage service (eg. ISO/IEC standards)?

  • Mitä sertifikaatteja RI:n tallennuspalveluilla on (esim. ISO/IEC-standardit)?


Standardi ja serfitikaatin myöntäjä. NT 2.10.2023.








  1. European Commission, (2016) European Charter for Access to Research Infrastructures - Principles and Guidelines for Access and Related Services (Chapter 4 – Principles, pp. 10–11).
  2. FAIR Data Principles









Vuoden 2020 keskustelujen kommentteja yllä olevan taulukon täyttämisen tueksi:

  • DMPolin kunkin osa-alueen kriittiset "hälytyskellot"; mitä missäkin kohdassa on syytä olla, mikä oli liikaa jne?
  • Alakysymyksiin ei tarvitse vastata erikseen, mikäli on luontevampaa niputtaa vastaus yhdeksi kokonaisuudeksi - näin voi välttää päällekkäisyyksiä
  • DMPolin kysymykset ja lopulta vastaukset niihin tuottavat ainakin joiltain osin infran käyttöehdot, palvelukuvauksen jne. - onko näin? Jos on näin, niin silloin DMPol-kirjoittamista voisi motivoida sillä, että tämä teidän pitää joka tapauksessa tuottaa, kun avaatte infran käyttöön jne. (DMPol ja Käyttöehdot eivät sama asia; ks. seuraava bullet point.)
  • DMPolin tarkoitus on kuvata rahoittajille infran tarjoamat palvelut esim. perustelut (kuvailut?) siitä miten tuetaan avointa tiedettä. Mihin kohtaan suunnitelmaa tämä pitäisi laitaa mielestänne? Tutkimussuunnitelmaan vai datapolitiikkaan? Vai molempiin omalla painotuksellaan? Infrastruktuuri voi tuottaa muitakin palveluita kuin datanhallintaa (ohjelmistot, koulutus, mittalaitteiden itsenäinen käyttö, mittauspalveluita). EU:n tekstistä: Access can be granted, amongst others, to machine time, computing resources, software, data, data-communication services, trust and authentication services, sample preparation, archives, collections, the set-up, execution and dismantling of experiments, education and training, expert support and analytical services. Vai ovatko nämä kaikki dataan liittyviä palveluita sitten kuitenkin?  Jos palvelut ovat maksullisia, onko se vastoin avointa tiedettä?
  • Kommentoijana on ymmärrettävä ehkä paremmin infrastruktuurin kypsyystaso (tai oikeastaan elinkaaritaso). Ollaanko vasta suunnittelemassa yhteistä infraa vai onko infralla jo vakiintuneet toimintavat (esim. kv-infraan liittyvillä voi olla). DMPolin tekeminen tavellaan käynnisti muutamassa ryhmässä tämän elintärkeän keskustelun konkreettisista toiminnoista ja prosessesista, mitä dataa kerätään, tuotetaan, kenelle, kenen käyttöön, mihin se jää ja miten se avataan tai kuka sen avaa ja miten?




  • No labels