Täydentävä ohje arkaluonteisia ja luottamuksellisia tietoja sisältävän datan hallinnan suunnitteluun (2019), CC0


Section

KOMMENTTEJA 11-12/2022 

Saate

Introduction

Tämä ohje koskee aineistotyyppejä, joissa on mukana arkaluonteista ja luottamuksellista tutkimusaineistoa. Tutkimusorganisaatiot opastavat tutkijoita tietosuoja- ja tietoturvaperiaatteiden noudattamisessa. Tämän lisäksi organisaation DMP-yleisohjeesta löytyvät organisaatiokohtaiset muut keskeiset tukipalveluiden yhteystiedot. Organisaatiot ovat myös voineet yhdistää tämän ja yleisohjeen. Tutustu organisaatiosi aineistonhallintaohjeisiin.

Kannattaisiko lähteä kirjoittamaan ohje suoraan englanniksi ja mietitään käännökset myöhemmin? Kannatan. > päätettiin kirjoittaa päivitystyö englanniksi / TS 12.1.2023 työpaja

Huom. pitää tarkistaa, että kysymyksiä ei ole itsessään muokattu sitten vanhan 2019 ohjeen tekemisen.

Olisiko hyvä muistuttaa tutkijaa ohjeen alussa, että DMP on päivittyvä dokumentti ja datanhallinnan työkalu + laadun varmistuksen ja riskinhallinnan työkalu, johon kannattaa kirjata uudet valinnat ja ratkaisut sitä mukaa, kun suunnitelmat arkaluonteisten aineistojen käsittelystä ja siihen liittyvistä tietosuoja- ja tietoturvatarpeista tarkentuvat tutkimuksen käynnistyessä? > Tämä hyvä kirjoittaa saatteeseen ja lisäksi introon selkeästi päivitykset ja versiot selkeästi eli esim. tätä ohjetta on päivitetty x-asetuksen jälkeen ym. / TS 12.1.2023 työpaja

Voiko ohjeen otsikkoa muokata? Eng. "Additional instructions for planning the data management of personal, sensitive and confidential data". Termit siis yhteneväisiksi pitkin ohjetta.> Saatteessa voisi lyhyesti määritellä personal data, sensitive data, confidential data ja käyttää näitä termejä pitkin ohjetta. / 12.1.2023 TS työpaja


Linkki yleisohjeistukseen (kansalliseen DMP kirjoitusohjeeseen) / TS 12.1.2023 työpaja


1. General description of data


1.1 What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Also give a rough estimate of the size of the data produced/collected?

1.1 Millaiseen aineistoon tutkimuksesi perustuu? Millaista aineistoa kerätään, tuotetaan tai käytetään uudelleen? Missä tiedostomuodoissa aineisto on? Arvioi myös karkealla tasolla, kuinka paljon levytilaa aineistosi lopulta tarvitsee?

1.1 Vilka slags data baserar sig forskningen på? Hurdana data samlas in, produceras eller återanvänds? Vilka filformat används? Ge även en grov uppskattning av hur stor produktionen/insamlingen av data kommer att vara?




Erittele kaikki aineistotyypit, jotka sisältävät henkilötietoa, arkaluonteista tai luottamuksellista tietoa. Tutkimusaineiston arkaluonteiset osat on erityisen tarpeellista tunnistaa, koska aineistonhallinnan suunnittelussa keskitytään näihin liittyvien riskien tunnistamiseen ja hallintaan. Henkilötietojen osalta kerro, mikä taho toimii rekisterinpitäjänä.


Arkaluonteinen ja luottamuksellinen tieto on sellaista, joka voi paljastuessaan aiheuttaa vahinkoa:

    • Arkaluonteinen henkilötieto; arkaluonteisista henkilötiedoista ei voi tehdä kattavaa listausta. Tutkimuksen tekijöiden vastuulla on tunnistaa tiedot, joiden paljastumisesta saattaisi olla haittaa tutkittaville.
        • Arkaluonteiset tiedot voivat liittyä terveyteen tai sairastumisriskeihin, seksuaaliseen suuntautumiseen, etniseen alkuperään, ammattiliittoon kuulumiseen, uskonnollisiin vakaumuksiin.
    • Sensitiivinen lajitieto, kuten uhanalaiset eläimet ja kasvit, luonnonsuojelullinen tieto tai bioturvallisuusuuteen liittyvä tieto.
    • Muu luottamuksellinen tieto, kuten patentit, maanpuolustukseen liittyvä tieto, organisatorinen tieto tai liikesalaisuudet.


Vinkkejä


Henkilötietoja ovat kaikki ne tiedot, joista henkilö on yksilöitävissä joko suoraan tai epäsuorasti.

  • Suorat tunnisteet: nimi, puhelinnumero, henkilötunnus, kuva, ääni, sormenjälki, hammaskartta, MRI-kuva
  • Epäsuorat tunnisteet: sukupuoli, ikä, koulutus, ammattiasema, kansallisuus, sijaintitunnisteet, työhistoria, järjestelmän lokitiedot, sivilisääty, asuinpaikka, auton rekisterinumero

Linkkejä: Mitä on henkilötieto (FSD), Henkilötietojen käsittely (Tietosuojavaltuutetun toimisto)

  • Kansallisen ohjeen kysymys hieman eri: What kinds of data is your research based on? What data will be collected, produced or reused? What file formats will the data be in? Additionally, give a rough estimate of the size of the data produced/collected.
  • Määrittelyt: Tietosuoja-asetuksessa puhutaan henkilötiedoista ja erityisiin henkilötietoryhmiin kuuluvista tiedoista. Pitäisikö näitä käyttää myös ohjeessa? Lisäksi voisi puhua esim. muista arkaluonteisisa tai luottamuksellisista tiedoista erotuksena henkilötiedoista. > tulevatko nämä saatteeseen termien määrittelyjen alle? / TS 12.1.2023 työpaja
  • Tietosuoja-asetuksen mukaisten määrittelyjen käyttäminen henkilötiedon osalta on hyvä ajatus. Tietosuojavaltuutetun määrittelysivun voisi myös linkata suoraan näiden termien yhteyteen samalla tavalla kuin nyt "Sensitiivinen lajitieto" -kohta on linkitetty Lajitietokeskuksen sivustolle.
  • Olisiko hyvä ohjeistaa ilmoittamaan/kuvaamaan myös mahdollinen yhteisrekisterinpitäjyys (esim. konsortiohankkeissa)? (Huom. jos tutkija suunnittelee, että käsittelyä tekee esim. ostopalveluna jokin käsittelijä, onko käsittelijästä ja käsittelysopimuksesta tarpeen kertoa DMP:ssä?) > puhuttiin, että onko relevantti täällä, mutta toisaalta olisi ainakin tässä jo heti alkuun tutkijan mietittävänä TS 12.1.2023 työpaja
  • Kun esitetään esimerkkejä henkilötiedoista, olisiko hyvä ottaa mukaan myös erityisesti tutkijoille tuttuja tietotyyppejä, esim. haastattelutallenteet, EEG-data, reittitiedot, ... Omien havaintojeni mukaan tutkijat eivät aina miellä henkilötiedoiksi tämäntyyppisiä tietoja, vaikka niitä käsittelisivät.
  • Olisiko tässä kohdassa hyödyllistä pyytää tutkijaa kuvaamaan (henkilötieto)aineistonsa käsittelyä myös seuraavista näkökulmista: aineiston laajuus (rekisteröityjen määrä, ajallinen ulottuvuus, ...), yhdistelläänkö eri lähteistä peräisin olevia aineistoja (esim. rekisteritutkimuksessa), tuottaako mahdollinen aineistojen yhdistäminen uuden aineiston, johon liittyy suurempia riskejä kuin yksittäisten aineistojen käsittelyyn > keskusteltiin, että sinällään hyvä idea, mutta menisikö enempi eettisen arvioinnin puolelle, voidaanko ohjata tutkijaa tekemään esim. DPIA, jos tarvis / TS 12.1.2023 työpaja
  • Kirjoitetaan tosi selkeästi ohjeet esim. että kirjoita/raksita taulukosta ne datasetit, jotka sisältävät henkilötietoa tai ovat sensitiivistä dataa ym. TS 12.1.2023 eli muistetaan, että tämä on DMP-kirjoitusohje
  • Tee esimerkiksi taulukko, jossa määrittelet datan sensitiivisyyden ym...

1.2 How will the consistency and quality of data be controlled?

1.2 Miten aineiston yhtenäisyys ja laatu varmistetaan?

1.2 Hur kontrolleras datamaterialets enhetlighet och kvalitet?


Pohdi, miten mahdollinen minimointi, pseudonymisointi tai anonymisointi vaikuttavat aineiston laatuun.

https://www.fsd.uta.fi/aineistonhallinta/fi/tunnisteellisuus-ja-anonymisointi.html#milloin-tieto-on-anonyymia-enta-pseudonyymia https://tietosuoja.fi/pseudonymisointi-anonymisointi

  • Auttaisiko tutkijaa tämän kohdan kirjoittamisessa, jos tässä annettaisi muutama esimerkki tietosuojatoimenpiteiden vaikutuksesta aineiston laatuun, esim. paikkatiedon tarkkuuden säätäminen?
  • Tampereen pohjassa näin, riittäisikö vai laittaisiko jonkun konkreettisen esimerkin: 

    Quality problems can emerge due to the technical handling, converting or transferring of data, or during its contextual processing and analysis.

  • Käytännön esimerkkejä datan laadun varmistamisesta / TS 12.1.2023 työpaja : esim. datan siirto softasta toiseen, niin ettei dataa häviä ja kaksi tutkijaa tarkastaa datan esim. tallennuksen jälkeen.
  • Lisäksi voisi ohjeistaa, että tutkimusryhmässä omat käytänteet datanhallintaan ja kaikille tutkimusryhmälaisille ne koulutetaan / TS 12.1.2023


2. Ethical and Legal Compliance


2.1 What ethical issues are related to your data management, for example, in handling sensitive data, protecting the identity of participants, or gaining consent for data sharing?

2.1 Mitä eettisiä seikkoja aineistosi hallintaan liittyy (esim. arkaluonteisten tietojen käsittely, tutkittavien identiteetin suojaaminen ja tietojen jakamista koskevan suostumuksen hankkiminen)?

2.1 Vilka etiska frågor är relevanta för datahanteringen, t.ex. hantering av sensitiv data, skyddande av deltagarnas identitet, samtycke till delning av data?

Tarkista: rekisterinpitäjyys

Erityisten henkilötietoryhmien käsittely: https://tietosuoja.fi/erityisten-henkilotietoryhmien-kasittely

Tietosuojavaltuutetun toimisto: usein kysyttyä: https://tietosuoja.fi/usein-kysyttya

https://www.tenk.fi/fi/ihmistieteiden-eettinen-ennakkoarviointiohje-uudistuu

Kansallinen neuvottelukunta

TUKIJA: Valtakunnallinen lääketieteellinen tutkimuseettinen toimikunta

Katso oman organisaatiosi ohjeet.

  • Kansallisen ohjeen kysymys hieman eri: What legal issues are related to your data management? (For example, GDPR and other legislation affecting data processing.)?
  • Eettinen ennakkoarviointi ja sen tarve
  • Henkilötietojen käsittelyn vaikutustenarviointi (DPIA) ja sen tarve
  • Henkilötietojen käsittelyn oikeusperuste
  • Miten tutkittavien/rekisteröityjen informointi toteutetaan (tästä voisi antaa esimerkkejä: tutkittavalle annettava tietosuojailmoitus, rekisteritutkimuksen tapauksessa hankkeen sivustolla julkaistava tiedote, ...)
  • Siirretäänkö henkilötietoja ETA-alueen ulkopuolelle (tai ylipäätään: käsitelläänkö tietoja ETA-alueen ulkopuolelta)
  • Mahdollinen tutkittavan tietosuojaoikeuksista poikkeaminen; täsmennetään laillinen peruste poikkeamiselle (esim. TSL 31 §; GDPR Art. 14, 17, 21; GDPR Art. 11) ja kuvataan, miksi poikkeaminen joudutaan tekemään

2.2 How will data ownership, copyright and Intellectual Property Right (IPR) issues be managed? Are there any copyrights, licenses or other restrictions which prevent you from using or sharing the data?

2.2 Miten aineiston omistajuuteen, tekijänoikeuksiin ja immateriaalioikeuksiin liittyviä asioita hallintaan? Estävätkö tekijänoikeudet, käyttöoikeudet tai muut rajoitukset aineiston käyttämisen tai jakamisen?

2.2 Hur hanteras frågor som gäller äganderätten till datamaterialet, upphovsrätt och immaterialrättigheter? Finns det hinder för användningen eller delningen av data på grund av upphovsrätt, licenser eller andra begränsningar?

Aineiston omistajuutta sekä muita immateriaalioikeuksia koskevat sopimukset tehdään ennen varsinaista konkreettisten tutkimustoimien aloittamista.

Sopimusmallit sekä konsultaatio on järjestetty omassa tutkimusorganisaatiossasi.


  • Kansallisen ohjeen kysymys muotoiltu näin: How will you manage the rights of the data you use, produce and share?
  • (Huom. Koskeeko tämä kohta lähinnä muita kuin henkilötieto-aineistoja? Mikäli näin on, olisiko se hyvä tuoda ohjeessa esille?)
  • Ulkoiset palvelut ja sopimukset (+tietosuojaselosteet) heidän kanssaan/ datan siirto ja käyttöoikeudet tai rajoitukset sopimusten kautta, olisiko tähän vai edelliseen kohtaan? / TS 12.1.2023 työpaja


3. Documentation & metadata


3.1 How will you document your data in order to make it findable, accessible, interoperable and re-usable for you and others?  What kind of metadata standards, README files or other documentation will you use to help others to understand and use your data?

3.1 Miten dokumentoit aineistosi, jotta se on löydettävissä, saavutettavissa, yhteentoimivaa ja uudelleen käytettävissä sekä itseäsi että muita varten?  Mitä metatietostandardeja, README-tiedostoja ja muuta dokumentaatiota käytät, jotta muut voivat ymmärtää ja käyttää aineistoasi?

3.1 På vilket sätt dokumenterar du ditt datamaterial så att det är sökbart, tillgängligt, interoperabelt och återanvändbart? Vilka metadatastandarder, README-filer eller annan dokumentation kommer att användas för att andra ska kunna förstå och använda datamaterialet?

Muista aineiston kuvailun yhteydessä, että myös tiedostonimet, tiedostokansioiden nimet sekä muuttujat ja metadata saattavat sisältää henkilötietoja tai arkaluonteista tietoa. Vaikka tutkimusdatasi sisältäisi henkilötietoja, voi metadatan julkaista, jos metadata ei sisällä tunnisteellista tietoa, jonka avulla tutkittavan voi identifioida.

Tähän käytännön esimerkkejä, kuinka tutkija voi parantaa datan FAIRia, esim. REPOOn tietosuojaseloste ja haastattelukysymykset metadataksi tms.


4. Storage and backup during the research project


4.1 Where will your data be stored, and how will it be backed up?

4.1 Minne aineistosi tallennetaan ja miten se varmuuskopioidaan?

4.1 Var kommer datamaterialet att lagras och hur sker säkerhetskopieringen?

Tietosuoja-asetuksen mukaan henkilötietojen käsittelyyn liittyviä riskejä on arvioitava ennen kuin henkilötietoja ryhdytään käsittelemään. Tutustu organisaatiosi tietosuoja- ja riskienhallinnan ohjeisiin ja mieti:

  • Mitä rekisteröidyn vapauksia ja oikeuksia käsittely voi vaarantaa?
  • Mitä vahinkoja rekisteröidylle voi aiheutua suunnitellusta henkilötietojen käsittelystä?
  • Mitä vahinkoja rekisteröidylle voi aiheutua, jos aineisto päätyy vääriin käsiin, tuhoutuu tai pilaantuu?
  • Millaisilta riskeiltä aineistojasi on suojattava?
  • Millä keinoin tunnistettuja riskejä hallitaan?
  • Mikä on jäännösriskien todennäköisyyksille ja vaikutuksille hyväksyttävä taso?

Arvion jälkeen varmista organisaatiosi tietosuojavastaavalta edellyttääkö aineistosi tietosuoja-asetuksen mukaista vaikutustenarviointia.

Selvitä myös, onko jollakin ulkoisilla tahoilla, kuten tutkimuksen rahoittajalla tai aineiston omistajalla omia vaatimuksiaan aineistoon liittyen.

Riskiarvion perusteella määritellään suojatoimenpiteet aineiston koko elinkaaren ajaksi (Ks. myös kohta 4.2).

Mieti:

  • Mitä tallennuspalveluja ja -laitteita tutkimuksen aikana käytetään?
  • Ketkä vastaavat käytettyjen tallennuspalvelujen ylläpidosta?
  • Miten varmuuskopiointi tehdään käyttämissäsi tallennuspalveluissa?
    • Kuka vastaa varmuuskopioinnin toteuttamisesta?
    • Minne varmuuskopiot tallennetaan?
    • Kuinka usein varmuuskopioita otetaan?
    • Kuinka kauan varmuuskopioita säilytetään?
  • Pitävätkö tallennuspalvelut kirjaa (lokia) aineiston käytöstä?
  • Onko aineisto etäkäytettävissä?
    • Jos kyllä, miten etäkäyttö suojataan?
  • Tarvitaanko tietojen salausta?
    • Jos kyllä, mieti:
      • Mikä osa aineistosta salataan ja mitä ei?
      • Mitä salausvälineitä käytetään?
      • Kuka hallinnoi salausavaimia ja salasanoja?
  • Miten aineiston käsittelyyn käytetyt tilat on suojattu?
    • Saako työtilojen ovet lukkoon?
    • Tunnetaanko kaikki kulkuoikeuksien haltijat?
    • Onko kiinteistössä nauhoittava kameravalvonta?
    • Onko käytettävissä murtosuojattuja säilytyskalusteita tai -tiloja fyysisille aineistoille ja tallennuslaitteille?
    • Onko työpisteet näkösuojattu?
  • Miten poistettavat aineistot ja kopiot hävitetään turvallisesti kun niiden käyttötarve päättyy?

Tutustu oman organisaatiosi ohjeeseen tallennuspalveluista ja työvälineistä, joilla taataan aineistojen tietoturvallinen käsittely. Selvitä myös organisaatiosi tietoturvayksikön ja IT-yksikön palveluosoite.

Lisätietoja:

Riskien arviointi (Tietosuojavaltuutetun toimisto)

Vaikutustenarviointi (Tietosuojavaltuutetun toimisto)

  • Kansallisen pohjan kysymys: Where will your data be stored, and how will the data be backed up?
  • "Selvitä myös, onko jollakin ulkoisilla tahoilla, kuten tutkimuksen rahoittajalla tai aineiston omistajalla omia vaatimuksiaan aineistoon liittyen" → kuuluisiko muualle (esim. 2.2)?
  • "Selvitä myös, onko jollakin ulkoisilla tahoilla, kuten tutkimuksen rahoittajalla tai aineiston omistajalla omia vaatimuksiaan aineistoon liittyen" → vai kuuluisiko olla "... vaatimuksiaan aineiston säilyttämiseen liittyen"?
  • Tässä kysymyksessä runsaasti apukysymyksiä (vrt. kysymykset 1-3, joissa ohjeistus ylimalkaisempaa).
  • "Arvion jälkeen varmista organisaatiosi tietosuojavastaavalta edellyttääkö aineistosi tietosuoja-asetuksen mukaista vaikutustenarviointia." → tässä voi olla organisaatiokohtaisia eroja, esim. OY:ssa tietosuojatukihenkilö on ensivaiheen kontakti, kun tutkija tekee riskiarvion ja käynnistää DPIA:n
  • "Miten aineiston käsittelyyn käytetyt tilat on suojattu?" → Voisiko tässä kohdassa yhtenä kysymyksenä olla myös "Kuinka monella henkilöllä on pääsy työtilaan?"
  • Voisiko tässä kohdassa antaa jonkin verran sellaista yleisluonteista ohjeistusta tai esimerkkejä, jotka pätisivät kaikkiin organisaatioihin (mikäli sellaista on)? Esim. muistitikku tallennusratkaisuna ei ole suositeltava, tai ulkoinen kovalevy ei useinkaan ensisijainen ratkaisu?
  • Minna & Siiri lisäävät tähän lyhyesti CSC:n SD-palveluista: https://research.csc.fi/sensitive-data-services-for-research
  • Datan siirtoon ja jakamiseen liittyvät ratkaisut (puuttuvatko kokonaan?) 12.1.2023 TS työpaja

4.2 Who will be responsible for controlling access to your data, and how will secured access be controlled?

4.2 Kuka valvoo pääsyä aineistoon ja miten suojattua pääsyä aineistoon valvotaan?

4.2 Vem reglerar åtkomsten till datamaterialet och hur övervakas skyddad åtkomst?

Pääsy henkilötietoihin on rajattava koskemaan vain niitä henkilöitä, jolle se on tutkimuksen suorittamisen kannalta tarpeellista. Ota huomioon, että kyseinen joukko sisältää myös käyttämiesi palvelujen ja välineiden ylläpitäjät ja muut, mahdollisesti ulkopuoliset palvelutoimittajat.

Mieti:

  • Miten, kenen ja millä tavalla aineistoa tarvitsee käyttää?
    • Kenelle käyttöoikeus voidaan myöntää?
    • Millainen käyttö on sallittua?
    • Mikä osa aineistoa edellyttää minkäkinlaisia käyttöoikeuksia?
    • Tarvitseeko aineistoa jakaa yhteistyökumppanien tai palvelutoimittajien kanssa?
    • Kuka ja millä perustein voi siirtää aineistoa osapuolelta toiselle?
  • Miten käytön- ja kulunvalvonta on toteutettu?
    • Kuka on pääsyoikeuksista vastaava henkilö?
    • Ovatko käyttö- ja kulkuoikeudet selvillä, muokattavissa ja poistettavissa?
    • Tarkistetaanko oikeuksien peruste ja rajaus säännöllisesti?
  • Miten aineiston käyttöä ja käytön asiallisuutta valvotaan?
    • Kuinka usein aineiston käyttöoikeudet tarkistetaan?
    • Mihin ja kenelle aineistoa tai sen osia kopioidaan?
    • Miten aineistokopioita hallitaan?
    • Miten aineistokopiot poistetaan kun käyttöoikeus päättyy?
    • Miten varmistutaan aineiston käyttötarkoituksista?
  • Onko aineistoa käsittelevien henkilöiden tietosuoja- ja -turvaosaaminen ja käsittelyä koskeva ohjeistus ajan tasalla?


Tutustu oman organisaatiosi pääsyoikeuksien hallinnan periatteisiin, ohjeisiin ja välineisiin. Selvitä miten organisaatiossasi ilmoitetaan henkilötietoihin liittyvistä väärinkäytöksistä ja vahingoista.

  • Mikäli tietyn tutkimuksen aineistonkäsittely perustuu suostumukseen, olisiko tässä (tai jossain muussa sopivassa) kohdassa hyvä ohjata tutkija varmistamaan, että suostumus pyydetään jokaiseen käsittelytarkoitukseen (esim. jos yhteistyökumppani tarvitsisi samaa aineistoa myös johonkin toiseen tutkimukseensa, aineistoa käytettäisiin opetustarkoituksiin jne.)? > kohtaan 2.1.? 12.1.2023 TS työpaja
  • Data  on nimetyn tunnistaumisen takana
  • Salassapitosopimukset ym. ryhmän sisäiset datankäyttösopimukset, tarvitaanko DMPssä mainintaan, ohjataanko tutkijaa/tutkijaryhmää tekemään tällaisia? Mihin kohtaan tulisi? 12.1.2023 TS työpaja

5. Opening, publishing and archiving the data after the research project


5.1 What part of the data can be made openly available or published? Where and when will the data, or its metadata, be made available?

5.1 Mikä osa aineistosta voidaan asettaa avoimesti saataville tai julkaista? Missä ja milloin aineisto tai siihen liittyvät metatiedot asetetaan saataville?

5.1 Vilken del av datamaterialet kan göras öppet tillgängligt eller publiceras? Var och när kommer datamaterialet eller dess metadata att göras tillgängliga?

Henkilötietoja sisältävät aineistot on mahdollista avata ainoastaan anonymisoituina. Anonymisointi kannattaa muutoinkin, sillä anonymisoitu aineisto ei ole enää henkilötietoa eikä siten tietosuojalainsäädännön piirissä ja sen avaaminen ja jakaminen on mahdollista. Pseudonymisoitu aineisto on edelleen henkilötietoa ja sitä ei tästä syystä voi avata. Henkilötietoja sisältävä data voidaan kuitenkin jakaa siitä kiinnostuneiden kanssa luvanvaraisesti alkuperäisen käsittelyperusteen mukaiseen tarkoitukseen.

Henkilötietoja sisältävän aineiston alkuperäinen käsittelyperuste, esimerkiksi lakiin perustuva tai suostumus, voi rajoittaa aineiston jatkokäyttöä. Jos esimerkiksi alkuperäisessä suostumuslomakkeessa ei ole huomioitu aineiston jatkokäyttöä, aineiston avaaminen voi vaatia uuden suostumuksen hankkimista tutkittavilta.

Henkilötietoja sisältävän aineiston avaamiseen tai julkaisemisen tapoja ovat:

  1. Datan anonymisointi ja anonymisoidun datan avaaminen data-arkistossa.
  2. Datan keskeisten metatietojen julkaiseminen (tutkimustietojärjestelmässä tai muussa julkaisupalvelussa) ja varsinaisen aineiston saattaminen käyttöön luvanvaraisesti aineiston tuottajalta tai luotettavasta datarepositoriosta.
Linkkejä
  • Kohdassa 5 myös paljon selitettä verrattuna kysymyksiin 1-3.
  • "Henkilötietoja sisältävä data voidaan kuitenkin jakaa siitä kiinnostuneiden kanssa luvanvaraisesti alkuperäisen käsittelyperusteen mukaiseen tarkoitukseen." → olisiko tässä hyvä avata, mitä luvanvarainen jakaminen tarkoittaa, ts. kuvata lyhyesti, miten tutkijan on toimittava, jotta hän voi jakaa aineistoaan luvanvaraisesti.
  • Voisiko tähän osioon lisätä erityisten henkilötietoryhmien näkökulman ja painottaa esim. sitä, että tällaisia tietoja sisältävien aineistojen avaamisessa on noudatettava erityistä varovaisuutta? Voisiko vastaavasti ohjeistaa myös muun arkaluonteisen tai luottamuksellisen tiedon osalta ja ohjata tällaisten aineistojen tutkija suunnittelemaan metatietojen julkaisemista (kuten nyt on tehty henkilötietoaineiston osalta kohdassa 2.)?
  • Voitaisiko tässä kohtien 4.1 ja 4.2 tapaan ohjata tutkija tutustumaan (mahdollisiin) oman organisaation ohjeisiin henkilötietoja ja erityisiä henkilötietoryhmiä sisältävien aineistojen avaamista koskien?
  • Lähdettäisiinkö liikkeelle metadatan avaamisesta ja siitä edetään erikoistilanteisiin? 12.1.2023 TS+ perustelut miksi kannattaa edes metadata avata ja toisaalta kannattaa metadata julkaista vaikka Qvaimeen tutkimuksen aikana
  • Ja muistutus tutkijalle että perustelee miksi ei voi avata/julkaista dataa
  • Siiri+Minna voi lisätä CSC:n uudet palvelut: " At the end of your research, you can publish sensitive data under controlled access with SD Submit (pilot phase) or Federated EGA (for biomedical data) and enable its reuse with SD Apply (pilot phase)."
  • PAS käyttäjätarina, joka sisältää erityisiä henkilötietoryhmiä: PAS-käyttäjätarinoiden luonnokset - Fairdata-verkosto - kokous 8.12.2022

5.2 Where will data with long-term value be archived, and for how long?

5.2 Mihin pitkällä aikavälillä arvokkaat tiedot arkistoidaan ja kuinka pitkäksi ajaksi?

5.2 Var bevaras datamaterial av långsiktigt värde och hur länge?

Opetus- ja kulttuuriministeriö tarjoaa korkeakouluille ja tutkimuslaitoksille palvelun tutkimusaineistojen pitkäaikaissäilytykseen (ms. PAS-palvelu). Kukin organisaatio määrittää prosessinsa pitkällä aikavälillä arvokkaiden tutkimusaineistojen tunnistamiseksi jasiirtämiseksi PAS-palveluun. Riippuen organisaation ohjeistuksesta ja tutkimusluvasta PAS-palveluun on mahdollista tallentaa myös arkaluonteisia henkilötietoja sisältäviä aineistoja.

Arkaluontoista henkilötietoja sisältävän aineiston arkistointi vaatii säilytysluvan Kansallisarkistolta. Aineisto on minimoitava ennen säilytystä. Tällaisen aineiston jatkokäyttö on mahdollista tutkimusluvalla.

Perinteisesti arkaluonteinen aineisto kehotetaan hävittämään tutkimushankkeen jälkeen, koska sen säilyttäminen on riskialtista ja vaatii erityisjärjestelyjä. Siksi on tärkeää myös suunnitella, miten aineisto hävitetään turvallisesti. Esimerkiksi pelkästään tiedoston poistaminen (deletointi) ja tietokoneen roskakorin tyhjentäminen ei tarkoita, että tiedosto olisi tuhoutunut lopullisesti. Poistettuja tietoja voi palauttaa jopa kiintolevyn uudelleen alustamisen jälkeen. Tiedon lopulliseen hävittämiseen on olemassa erilaisia ohjelmia, jotka perustuvat esimerkiksi tietojen ylikirjoittamiseen tai kiintolevyn magnetointiin. Tallennusväline voidaan myös murskata mekaanisesti lukukelvottomaksi.

Anonymisoinnin seurauksena aineisto ei sisällä enää henkilötietoja eikä siten ole tietosuojalainsäädännön piirissä.

Vinkkejä

  • Muistathan, että aineiston anonymisointi ja hävittäminen tai arkistointi tehdään viimeistään tutkimusluvan määräajan päättyessä.
  • Aito anonymisointi edellyttää sekä suoran että välillisen tunnistamisen mahdollisuuden poistamista sekä tunnisteavaimen hävittämistä.
  • Useilla korkeakouluilla ja tutkimuslaitoksilla on oma sisäinen ohjeistuksensa tallennusvälineiden hävittämisestä.

Linkkejä

Kenen vastuulla datan hävittäminen?

Tässä mentävä tietosuojailmoituksen mukaisesti.

Arkistolain muutos tulossa syksyllä 2023.

Pitäisi selvittää onko tämä vielä validi: Arkaluontoista henkilötietoja sisältävän aineiston arkistointi vaatii säilytysluvan Kansallisarkistolta.

https://www.finlex.fi/fi/laki/ajantasa/kumotut/1999/19990523#L7P35

https://www.finlex.fi/fi/laki/ajantasa/2018/20181050#L5P27



6. Data management responsibilities and resources

6.1 Who will be responsible for specific tasks of data management during the life cycle of the research project? Also estimate the resources (e.g. funding, time, and effort) required for data management.

6.1 Ketkä vastaavat aineistonhallintaan liittyvistä tehtävistä tutkimusprojektin elinkaaren aikana? Arvioi myös aineistonhallintaan tarvittavat resurssit (esim. taloudelliset, ajalliset, työmäärään liittyvät).

6.1 Vem ansvarar för specifika uppgifter i datahanteringen under projektets livscykel? Uppskatta även de resurser som krävs för datahantering (t. ex.finansiering, tid och arbetsmängd) .

Kuka on vastuussa arkaluonteisen ja luottamuksellisen aineiston hallinnasta ja sen toteutumisen valvonnasta aineiston koko elinkaaren ajan?

  • Kuka vastaa tietosuojasta (katso kohta 2) ja tietoturvasta (katso kohta 4)?


Tarvittavia resursseja suunniteltaessa ota huomioon:

  • aineiston minimoinnin, pseudonymisoinnin ja anonymisoinnin kustannukset eli siihen menevä aika ja tarvittavat ohjelmistot.
  • korkeamman turvatason vaatimukset toiminnalle ja tekniikalle sekä niistä koituvat lisäkustannukset.

Kansallisen pohjan kysymys: Who (for example role, position, and institution) will be responsible for data management? + PUUTTUU kysymys 6.2. What resources will be required for your data management procedures to ensure that the data can be opened and preserved according to FAIR principles (Findable, Accessible, Interoperable, Re-usable)?

  • Vastuuasiat: Voisiko tässä määritellä/listata tehtäviä aineiston elinkaaren eri vaiheiden mukaan, tai antaa niistä esimerkkejä vastuiden määrittämisen tueksi? Esim. tietoturvallisten käsittelyratkaisujen määrittäminen, tietosuojadokumentaation luominen ja ylläpito, aineiston hävittäminen tai arkistointi tutkimuksen/käyttötarpeen päätyttyä, ...
  • Vastuuasiat: jos kyseessä on yhteistyöhanke, jaetaanko tietosuoja- ja tietoturvavastuita jollain tavalla osapuolten kesken?
  • Vastuuasiat: jos henkilötietojen käsittelyä tekee rekisterinpitäjän puolesta käsittelijä, miten varmistetaan ulkoistetun käsittelyn tietosuojan toteutuminen?
  • Resurssiasiat: Onko hankkeessa tarpeen kouluttaa tutkijoita tietosuoja- ja tietoturva-asioissa? Jos on, kuka (tai mikä rooli) on vastuussa kouluttamisesta?
  • Resurssiasiat yleisesti: Voisiko arkaluonteisen aineiston hallinnan resurssitarvetta hahmotella aineiston elinkaaren vaiheiden mukaan (esim. mahdollisen DPIA:n tekemiseen tarvittava työaika hankkeen alkupuolella, riskitasoa vastaavien tietoturvallisten tallenusratkaisujen suunnitteluresurssit ennen aineiston keruuta, metadatan julkaisemiseen tarvittava työaika, resurssit anonymisoinnin toteuttamiseksi julkaisuvaiheessa, ...)?
  • Näitä voidaan miettiä, että halutaanko eritellä tehtäviä vai annetaanko nämä esimerkkinä, että tällaisia tehtäviä voi tulla vastaan datanhallinnassa. 12.1.2023 TS työpaja
  • No labels