Tämän listauksen tarkoitus on koota tietoa datarepositorioista ja helpottaa niiden vertailua. Lista ei pyri olemaan kaiken kattava, vaan se antaa esimerkkejä datarepositorioista. Kommenttikenttään alalaitaan on koottu tietoa myös muista sivustoista joissa on listattu datarepositorioita. Lista on julkaistu 25.9.2024.

 

RepositorioTieteenalaPysyvät tunnisteetYksittäisen aineiston koko (aineistoja voi julkaista useita)Maksullisuus

Kuka ylläpitää ja missä maassa data sijaitsee

Kenellä käyttöoikeus tallentaa dataa

Standardi

Huomiota
Yleisrepositoriot
Dryad

Monitieteinen

Kyllä (DOI)

Yksittäinen tiedosto max 10 GB, aineisto 300 GB

maksullinen 

Hallinnoiva taho Yhdysvaltoihin rekisteröity yleishyödyllinen yhteisö.

Data Yhdysvalloissa, Euroopassa "data host" on CERN.

Kirjautuminen palvelun kautta.

Data saatavilla Creative Commons 0 -lisenssillä

Dublin Core, DataCite, OAI-ORE, RDF DataCube

Pakolliset metatietokentät: Journal name; Title; Author(s); Abstract; Research domain; Keyword(s).

Data julkaistaan aina CC0-lisenssillä.

EUDAT CDI B2SHARE / EUDAT B2SHARE Premium

Monitieteinen ja/tai yhteisökohtainen

Kyllä (DOI, Handle)

CDI B2SHARE: max 20 GiB / aineisto

Premium-palvelut: räätälöitävissä

CDI-palvelut: Maksuttomia

Premium-palvelut: maksullisia (asiakasorganisaatiolle)

Ylläpitäjä EUDAT CDI (eurooppalainen tutkimusorganisaatioiden verkosto). Data Euroopassa.

CDI-palvelut: avoimia kaikille

Premium-palvelut: räätälöitävissä

EUDAT Core ja Extended schema (perustuvat DataCite schemaan), sekä yhteisökohtaiset laajennukset.
https://schema.eudat.eu/eudatextended/
https://schema.eudat.eu/communityextensions/ 

EUDAT CDI B2SHARE on ilmaispalvelu, jossa kaikille yhteiset käyttöehdot. Yhteisökohtaiset räätälöidyt skeema-laajennukset mahdollisia myös ilmaispalvelussa, esimerkiksi sopivissa yhteishankkeissa.

EUDAT B2SHARE Premium -palvelut ovat organisaatioille maksullisia räätälöityjä palveluita, joissa mm. tallennuskapasiteettia, metatietomallia ja palvelun toiminnallisuuksia voidaan räätälöidä asiakkaan kanssa sovittavalla tavalla.
Pakolliset kentät (Premium-palveluissa räätälöitävissä): https://schema.eudat.eu/eudatextended_metadataelements/


Fairdata (IDA, Qvain, Etsin)


Monitieteinen

Kyllä (DOI, URN)

max ~ kymmeniä TB

maksuton

 Tarjoaa OKM, tuottaa CSC. Data Suomessa.

Suomalaiset korkeakoulut ja valtion tutkimuslaitokset sekä niiden yhteistyökumppanit (myös ulkomaalaiset)

Moni aineisto vapaasti saatavilla

Fairdata Metax tietomalli, perustuu DCAT 3.0. Konvertoituu myös DataCite -formaattiin

Fairdata Metax tietosisältö selkokielellä

Hyödyntävät organisaatiot hallinnoivat oikeutta tallentaa dataa Fairdata IDAan sekä datan elinkaarta. Ei erityisiä henkilötietoryhmiä sisältävälle datalle.

Kuvailu tapahtuu Fairdata Qvaimessa. Qvain on kuvailutyökalu IDAssa säilytettävälle, tai muualla säilytettävälle datalle. Qvaimen pakolliset metatietokentät: Lisenssi, aineiston kuvaus ja otsikko, julkaisupvm, avainsanat, tekijä (henkilö tai organisaatio) ja julkaisija (henkilö tai organisaatio).

Katalogi ja hakupalvelu julkaistuille aineistoille, sekä avatun datan lataus: Fairdata Etsin

Figshare

Monitieteinen

Kyllä (DOI)

max 20 GB

maksuton tutkijoille, organisaatioille laajempi maksullinen versio

Kaupallinen toimija, osa Digital Science yritystä.

Tutkijoille avoin maksuttomasti, organisaatioille ja kustantajille maksullinen versio

DataCite 

Pakolliset metatietokentät: Item title, item type, authors, categories, keywords, description, license

Pääasiassa organisaatioiden kautta saatavissa erillisellä sopimuksella.

Zenodo

Monitieteinen

Kyllä (DOI)

max 50 GB

maksuton

 CERN, data Euroopassa.

Avoin kaikille, rekisteröityminen esim. ORCID- tai GitHub-tunnuksin

DataCite

Pakolliset metatietokentät: Publication date, title, authors, description, access right, license

Zenodosta ei ole helppo löytää dataa hakutoiminnolla.

Tieteenala-/aineistotyyppikohtaset


GBIF, the Global Biodiversity Information Facility  

Biodiversiteetti dataa, monitieteinen

Kyllä (DOI)

 

maksuton

Eri maiden rahoittama kansainvälinen verkosto ja data infrastruktuuri

Julkaisee vain organisaatioiden kautta tulevaa data.

 


Gene Expression Omnibus (GEO)

Biotieteet, genetiikka

Kyllä, nk. accession number. Näitä on useampia, tallennetun datasetin luonteesta riippuen

 Ei tarkkaa kokorajaa, jos aikomuksena tallentaa erittäinsuuriamääriä dataa, suositellaan ottamaan yhteyttä GEO:n asiakastukeen.

 Maksuton

The National Center for Biotechnology Information (NCBI), joka kuuluu National Institutes of Health (NIH) alaisuuteen. Data pääsääntöisesti Yhdysvalloissa.

Tutkijat ja tutkimusryhmät. Datan tulee täyttää tietyt kriteerit (mm. metadatan ja avoimuuden suhteen), jotta se voidaan tallentaa GEOon.

 MIAME- ja MINSEQE-standardit

Datan tallennusta varten tarvitaan NCBI-tili. Tallennusvaiheessa toimitetaan kaikista dataseteistä myös kuvailevat tiedot. Tallennussivu: Submitting data - GEO - NCBI (nih.gov)

Kielipankki

Kielitieteet

Kyllä (URN, Handle)

max ~250 GB

maksuton

 

Suomalaiset korkeakoulut ja valtion tutkimuslaitokset sekä niiden yhteistyökumppanit (myös ulkomaalaiset)

Moni aineisto/palvelu vapaasti saatavilla

Metadata: META-SHARE-profiili v3.1 (lähde) Saatavilla via OAI-PMH myös CMDI/OLAC/DublinCore-formaatissa.

Data: Suositetut tiedostoformaatit

Ilmoitus kielivarasta - pakolliset kentät: Information provider, email address of information provider, organization, name of the language resource in Finnish and in English, type 

Paituli

Paikkatietoaineistot

Kyllä (URN Fairdata Etsimessä)

max ~2-3 TB

maksuton

CSC

Data sijaitsee Suomessa

Suomen korkeakoulujen ja tutkimuslaitoisten opiskelijat ja henkilökunta voivat jakaa aineistonsa ilmaiseksi Paituli-palvelussa. Aineistolle voi määritellä lisenssin.


Fairdata Metax tietomalli, perustuu DCAT 3.0. Konvertoituu myös DataCite -formaattiin

Fairdata Metax tietosisältö selkokielellä



Pangaea

Tieteenalakohtainen, ympäristö- ja biotieteiden aineistoille. 

Kyllä (DOI)

 

maksuton

Saksalaisten tutkimuslaitosten ylläpitämä.

 

Avoimesti tutkijoiden ja organisaatioiden käytettävissä.

 


The European Bioinformatics Institute (EMBL-EBI)

Molekyylidataan liittyviä resursseja ja bioinformatiikka palveluita. Useita datarepositorioita ja valintatyökalu  helpottamaan datan tallennuspaikan valintaa. Tarkista tarkemmat tiedot valitsemastasi repositoriosta.

 

 

 

 

Taustalla useita Euroopan maita, Suomi mukaan lukien.

 

 


Tietoarkiston Aila

Kaikki, erityisesti yhteiskunta-, humanistiset ja kasvatustieteet

Kyllä (URN, DOI)

Ei tarkkaa kokorajaa, sovittava Tietoarkiston kanssa​.

maksuton

 

Yliopistojen ja korkeakoulujen henkilökunta ja opiskelijat, ulkomaisten yliopistojen opiskelijat ja tutkijat sekä suomalaisten tutkimusorganisaatioiden jäsenet

Osa aineistoista on vapaasti saatavilla, osa kirjautuneille käyttäjille tutkimukseen, opetukseen ja opiskeluun. Jotkin aineistot aineiston luovuttajan erillisellä luvalla.

DDI, Data Documentation Initiative

Tietoarkiston hakuportaali on AilaAineistoa ehdotetaan Tietoarkistoon, joka tarkistaa sen sopivuuden. Pakolliset kentät ilmoituksessa: Aineiston tekijä tai kerääjän nimi, vastaus tutkittavien informoinnista, aineiston nimi ja lyhyt kuvaus, aineiston koko, ilmoittajan nimi, taustaorganisaatio ja email

Tietoarkisto vastaanottaa sekä kvantitatiivisia eli numeerisia että kvalitatiivisia eli kuvasta tai tekstistä koostuvia sähköisiä tutkimusaineistoja, jotka ovat jatkokäytettävissä. Tyypillisesti Tietoarkistoon tallennetut aineistot ovat havaintomatriisimuotoisia kyselylomakkeisiin perustuvia surveydatoja, haastattelujen, ryhmähaastattelujen ja erilaisten vuorovaikutustilanteiden litteraatteja tai erilaisia kirjoitusaineistoja. Lisäksi voidaan arkistoida myös tutkimusaineistoksi kerättyjä lehtiaineistoja. Tietoarkisto arkistoi pääosin anonyymejä tutkimusaineistoja muutamin poikkeuksin.

Tietoarkisto ei vastaanota audiovisuaalista aineistoa. Av-aineiston pitkäaikaissäilytykseen ja jatkokäytön hallinnointiin on erikoistunut Helsingin yliopiston yhteydessä toimiva Kielipankki. Kun suunnittelet av-aineiston keruuta tai harkitset jo olemassa olevan av-aineistosi arkistointia, ota yhteyttä Kielipankkiin, https://www.kielipankki.fi/



 

 

 


 

 


  • No labels