Tämän listauksen tarkoitus on koota tietoa datarepositorioista ja helpottaa niiden vertailua. Lista ei pyri olemaan kaiken kattava, vaan se antaa esimerkkejä datarepositorioista. Kommenttikenttään alalaitaan on koottu tietoa myös muista sivustoista joissa on listattu datarepositorioita. Lista on julkaistu 25.9.2024.
Repositorio | Tieteenala | Pysyvät tunnisteet | Yksittäisen aineiston koko (aineistoja voi julkaista useita) | Maksullisuus | Kuka ylläpitää ja missä maassa data sijaitsee | Kenellä käyttöoikeus tallentaa dataa | Standardi | Huomiota |
---|---|---|---|---|---|---|---|---|
Yleisrepositoriot | ||||||||
Dryad | Monitieteinen | Kyllä (DOI) | Yksittäinen tiedosto max 10 GB, aineisto 300 GB | Hallinnoiva taho Yhdysvaltoihin rekisteröity yleishyödyllinen yhteisö. Data Yhdysvalloissa, Euroopassa "data host" on CERN. | Kirjautuminen palvelun kautta. Data saatavilla Creative Commons 0 -lisenssillä | Dublin Core, DataCite, OAI-ORE, RDF DataCube | Pakolliset metatietokentät: Journal name; Title; Author(s); Abstract; Research domain; Keyword(s). Data julkaistaan aina CC0-lisenssillä. | |
EUDAT CDI B2SHARE / EUDAT B2SHARE Premium | Monitieteinen ja/tai yhteisökohtainen | Kyllä (DOI, Handle) | CDI B2SHARE: max 20 GiB / aineisto Premium-palvelut: räätälöitävissä | CDI-palvelut: Maksuttomia | Ylläpitäjä EUDAT CDI (eurooppalainen tutkimusorganisaatioiden verkosto). Data Euroopassa. | CDI-palvelut: avoimia kaikille Premium-palvelut: räätälöitävissä | EUDAT Core ja Extended schema (perustuvat DataCite schemaan), sekä yhteisökohtaiset laajennukset. | EUDAT CDI B2SHARE on ilmaispalvelu, jossa kaikille yhteiset käyttöehdot. Yhteisökohtaiset räätälöidyt skeema-laajennukset mahdollisia myös ilmaispalvelussa, esimerkiksi sopivissa yhteishankkeissa. |
Fairdata (IDA, Qvain, Etsin) | Monitieteinen | Kyllä (DOI, URN) | max ~ kymmeniä TB | maksuton | Tarjoaa OKM, tuottaa CSC. Data Suomessa. | Suomalaiset korkeakoulut ja valtion tutkimuslaitokset sekä niiden yhteistyökumppanit (myös ulkomaalaiset) Moni aineisto vapaasti saatavilla | Fairdata Metax tietomalli, perustuu DCAT 3.0. Konvertoituu myös DataCite -formaattiin | Hyödyntävät organisaatiot hallinnoivat oikeutta tallentaa dataa Fairdata IDAan sekä datan elinkaarta. Ei erityisiä henkilötietoryhmiä sisältävälle datalle. Kuvailu tapahtuu Fairdata Qvaimessa. Qvain on kuvailutyökalu IDAssa säilytettävälle, tai muualla säilytettävälle datalle. Qvaimen pakolliset metatietokentät: Lisenssi, aineiston kuvaus ja otsikko, julkaisupvm, avainsanat, tekijä (henkilö tai organisaatio) ja julkaisija (henkilö tai organisaatio). Katalogi ja hakupalvelu julkaistuille aineistoille, sekä avatun datan lataus: Fairdata Etsin. |
Figshare | Monitieteinen | Kyllä (DOI) | max 20 GB | maksuton tutkijoille, organisaatioille laajempi maksullinen versio | Kaupallinen toimija, osa Digital Science yritystä. | Tutkijoille avoin maksuttomasti, organisaatioille ja kustantajille maksullinen versio | DataCite | Pakolliset metatietokentät: Item title, item type, authors, categories, keywords, description, license Pääasiassa organisaatioiden kautta saatavissa erillisellä sopimuksella. |
Zenodo | Monitieteinen | Kyllä (DOI) | max 50 GB | maksuton | CERN, data Euroopassa. | Avoin kaikille, rekisteröityminen esim. ORCID- tai GitHub-tunnuksin | Pakolliset metatietokentät: Publication date, title, authors, description, access right, license Zenodosta ei ole helppo löytää dataa hakutoiminnolla. | |
Tieteenala-/aineistotyyppikohtaset | ||||||||
GBIF, the Global Biodiversity Information Facility | Biodiversiteetti dataa, monitieteinen | Kyllä (DOI) |
| maksuton | Eri maiden rahoittama kansainvälinen verkosto ja data infrastruktuuri | Julkaisee vain organisaatioiden kautta tulevaa data. |
| |
Gene Expression Omnibus (GEO) | Biotieteet, genetiikka | Kyllä, nk. accession number. Näitä on useampia, tallennetun datasetin luonteesta riippuen: | Ei tarkkaa kokorajaa, jos aikomuksena tallentaa erittäinsuuriamääriä dataa, suositellaan ottamaan yhteyttä GEO:n asiakastukeen. | Maksuton | The National Center for Biotechnology Information (NCBI), joka kuuluu National Institutes of Health (NIH) alaisuuteen. Data pääsääntöisesti Yhdysvalloissa. | Tutkijat ja tutkimusryhmät. Datan tulee täyttää tietyt kriteerit (mm. metadatan ja avoimuuden suhteen), jotta se voidaan tallentaa GEOon. | MIAME- ja MINSEQE-standardit | Datan tallennusta varten tarvitaan NCBI-tili. Tallennusvaiheessa toimitetaan kaikista dataseteistä myös kuvailevat tiedot. Tallennussivu: Submitting data - GEO - NCBI (nih.gov) |
Kielipankki | Kielitieteet | Kyllä (URN, Handle) | max ~250 GB | maksuton |
| Suomalaiset korkeakoulut ja valtion tutkimuslaitokset sekä niiden yhteistyökumppanit (myös ulkomaalaiset) Moni aineisto/palvelu vapaasti saatavilla | Metadata: META-SHARE-profiili v3.1 (lähde) Saatavilla via OAI-PMH myös CMDI/OLAC/DublinCore-formaatissa. Data: Suositetut tiedostoformaatit | Ilmoitus kielivarasta - pakolliset kentät: Information provider, email address of information provider, organization, name of the language resource in Finnish and in English, type |
Paituli | Paikkatietoaineistot | Kyllä (URN Fairdata Etsimessä) | max ~2-3 TB | maksuton | CSC Data sijaitsee Suomessa | Suomen korkeakoulujen ja tutkimuslaitoisten opiskelijat ja henkilökunta voivat jakaa aineistonsa ilmaiseksi Paituli-palvelussa. Aineistolle voi määritellä lisenssin. | Fairdata Metax tietomalli, perustuu DCAT 3.0. Konvertoituu myös DataCite -formaattiin Fairdata Metax tietosisältö selkokielellä | |
Pangaea | Tieteenalakohtainen, ympäristö- ja biotieteiden aineistoille. | Kyllä (DOI) |
| maksuton | Saksalaisten tutkimuslaitosten ylläpitämä.
| Avoimesti tutkijoiden ja organisaatioiden käytettävissä. |
| |
The European Bioinformatics Institute (EMBL-EBI) | Molekyylidataan liittyviä resursseja ja bioinformatiikka palveluita. Useita datarepositorioita ja valintatyökalu helpottamaan datan tallennuspaikan valintaa. Tarkista tarkemmat tiedot valitsemastasi repositoriosta.
|
|
|
| Taustalla useita Euroopan maita, Suomi mukaan lukien. |
|
| |
Tietoarkiston Aila | Kaikki, erityisesti yhteiskunta-, humanistiset ja kasvatustieteet | Kyllä (URN, DOI) | Ei tarkkaa kokorajaa, sovittava Tietoarkiston kanssa. | maksuton |
| Yliopistojen ja korkeakoulujen henkilökunta ja opiskelijat, ulkomaisten yliopistojen opiskelijat ja tutkijat sekä suomalaisten tutkimusorganisaatioiden jäsenet Osa aineistoista on vapaasti saatavilla, osa kirjautuneille käyttäjille tutkimukseen, opetukseen ja opiskeluun. Jotkin aineistot aineiston luovuttajan erillisellä luvalla. | Tietoarkiston hakuportaali on Aila. Aineistoa ehdotetaan Tietoarkistoon, joka tarkistaa sen sopivuuden. Pakolliset kentät ilmoituksessa: Aineiston tekijä tai kerääjän nimi, vastaus tutkittavien informoinnista, aineiston nimi ja lyhyt kuvaus, aineiston koko, ilmoittajan nimi, taustaorganisaatio ja email Tietoarkisto vastaanottaa sekä kvantitatiivisia eli numeerisia että kvalitatiivisia eli kuvasta tai tekstistä koostuvia sähköisiä tutkimusaineistoja, jotka ovat jatkokäytettävissä. Tyypillisesti Tietoarkistoon tallennetut aineistot ovat havaintomatriisimuotoisia kyselylomakkeisiin perustuvia surveydatoja, haastattelujen, ryhmähaastattelujen ja erilaisten vuorovaikutustilanteiden litteraatteja tai erilaisia kirjoitusaineistoja. Lisäksi voidaan arkistoida myös tutkimusaineistoksi kerättyjä lehtiaineistoja. Tietoarkisto arkistoi pääosin anonyymejä tutkimusaineistoja muutamin poikkeuksin. Tietoarkisto ei vastaanota audiovisuaalista aineistoa. Av-aineiston pitkäaikaissäilytykseen ja jatkokäytön hallinnointiin on erikoistunut Helsingin yliopiston yhteydessä toimiva Kielipankki. Kun suunnittelet av-aineiston keruuta tai harkitset jo olemassa olevan av-aineistosi arkistointia, ota yhteyttä Kielipankkiin, https://www.kielipankki.fi/ | |
|
|
|
|
|
3 Comments
Päivi Malinen
Biotieteiden repositoriolistaus: https://www.elixir-finland.org/data-arkistot/
Data submission wizard: Data submission | Services | EMBL’s European Bionformatics Institute (ebi.ac.uk)
Naturen tekemä listaus eri repositorioista: Data Repository Guidance | Scientific Data (nature.com)
Päivi Rauste
avoindata.fi
Siiri Fuchs
Kemian alan repositorio opas How to Choose the Right Repository | NFDI4Chem Knowledge Base