Hyppää pääsisältöön

Avoin tiede muuttaa tiedeyhteisöä

Julkaistu 17.5.2019
Tampereen yliopisto
Avoimen tieteen paneeli/ Kuva: Jonne Renvall
Some-datan käytön ongelmia pohdittiin paneelissa, jonka puheenjohtaja oli Henriikka Mustajoki (vas.). Marko Ahteensuu ja Taina Meriluoto seuraavat, kun Salla-Maaria Laaksonen ja Helena Eronen kättelevät toisiaan.
Sosiaalisen median käytön juridisia ja eettisiä kysymyksiä pohdittiin Tampereella.

Avoimen tieteen periaatteen odotetaan muuttavan tiedeyhteisön toimintakulttuuria ratkaisevasti. Muutokset koskevat koko tutkimusprosessia aineiston hankinnasta tutkimuksen tekemiseen, sen rahoitukseen ja raportoimiseen saakka.

Tutkimusdatan avoimuuden vaatimus lisää vaikeusastetta etenkin, kun sosiaalisen median aineistot ovat tulleet entistä laajemmin tutkijoiden mielenkiinnon kohteiksi.

Tampereella pidetyillä avoimen tieteen kevätpäivillä puhuttiin alan ajankohtaisimmasta aiheesta eli dataan liittyvistä juridisista ja eettisistä kysymyksistä, jotka ovat juuri some-aineistojen kannalta olennaisia.

Suomi avoimen tieteen kärkimaita

Suomi on avoimen tieteen kärkimaita maailmassa. Avoimen tieteen palveluiden päällikkö Susanna Nykyri Tampereen yliopistosta sanoo, että Suomessa on panostettu paljon yhdessä toimimiseen ja kansalliseen infraan. Tieteellisten seurain valtuuskunta (TSV) koordinoi Suomessa avoimen tieteen verkostoa ja strategiatyötä.

– Mikään yliopisto, korkeakoulu tai paikallinen yhteisö ei yksin pysty vastaamaan näihin haasteisiin. On ihan pakko tehdä kansallista ja kansainvälistä yhteistyötä. Me olemme kansallisesti onnistuneet luomaan kiinteän ja toimivan verkoston. Se on rikkaus, Nykyri sanoo.

Tieteellisten seurain valtuuskunnan kehittämispäällikkö Henriikka Mustajoki on samaa mieltä. Hän istuu pääkallonpaikalla, sillä avoimen tieteen koordinointi siirtyi juuri TSV:n hoitoon vuoden 2018 alussa.

– Muualla maailmassa toiminta on ministeriövetoista, meillä Suomessa se on tutkimusyhteisövetoista. Tämä on meidän ehdoton vahvuutemme, Mustajoki sanoi Tampereella pidetyssä seminaarissa.

Susanna Nykyri/ Kuva: Jonne Renvall
Susanna Nykyri iloitsee siitä, että Suomeen on onnistuttu luomaan toimiva verkosto avoimen tieteen edistämiseksi.

 

Tutkimusdata esiin maksumuurin takaa

Tutkimusdata ei useinkaan näy ulospäin tiedeyhteisön ulkopuolelle, mutta se kytkeytyy kuitenkin olennaisesti tutkimusjulkaisuihin ja tutkijan työhön. Julkaisujen vertaisarvioinnissa datalla on enenevästi merkitystä nimenomaan avoimesti saatavilla olevana aineistona. Jos julkaisujen taustalla oleva aineisto on avattu, näkyy se myös yleensä suurempina viittausmäärinä. Tiedelehdissä mietitään jopa sitä, pitäisikö olla erikseen ihmisiä, jotka erikoistuisivat datan arviointiin.

– Kaikkea dataa ei kuitenkaan voi eikä pidä avata, mutta silloinkin, kun itse tutkimusaineistoa ei voi avata, tulisi avata sen keskeiset kuvailutiedot eli metadata, Susanna Nykyri sanoo.

Avoimen tieteen ongelmista on suurin julkinen huomio kohdistunut tutkimusjulkaisuihin, joiden saatavuuden esteinä ovat suuret kansainväliset tiedekustantamot. Tutkimusyhteisöt luovuttavat niiden käyttöön ilmaiseksi tutkijoiden työn tulokset, joita kustantamot kauppaavat kalliilla hinnalla takaisin tutkimusyhteisöille korkeiden tilausmaksujen muodossa.

Yliopistojen ja tutkimuslaitosten yhteinen FinELib- kirjastokonsortio on käynyt neuvotteluja tilausmaksujen kohtuullistamiseksi, mutta tulokset ovat jääneet heikoiksi.

Tutkimusdatan ja tutkimusjulkaisujen avoimuusongelmaan ei ole olemassa helppoa ratkaisukeinoa. Yksinkertaisena keinona on esitetty, että suurten kustantamojen lisenssimaksut muutettaisiin suoralta kädeltä open acces -maksuiksi.

Tutkimusdatasta on tullut tiedejulkaisujen tapaan kauppatavaraa. Susanna Nykyrin mukaan on olemassa riski sille, että datasta tulee kaupankäynnin kohteita myös kielteisessä mielessä siten, että suurten kustantamoiden korkeat käyttömaksut estävät merkittävän datan uudelleen- ja jatkokäytön.

– Tavoitteena on se, että tutkimusdata ei päätyisi holtittomasti maksumuurien taakse. Ymmärrän että se voi olla myös kauppatavaraa. Sillekin on varmasti oma paikkansa, mutta viime kädessä on turvattava jatkotutkimus, että dataa voitaisiin käyttää osana jotakin uutta tutkimusta ja myös toistaa joitakin koeasetelmia. Tällaista tieteellistä arvoa ja käytettävyyttä pitäisi pystyä tukemaan paljon nykyistä enemmän, Nykyri sanoo.

Tampereen Tietoarkisto datankeruun edelläkävijä

Digitaalisointikehitys antaa uusia mahdollisuuksia tutkimustiedon käytölle ja tutkimusdatan jakamiselle. Tämän alan uranuurtaja on Tampereen yliopiston yhteydessä toimiva Tietoarkisto, jonka tontti on nyt laajentunut yhteiskuntatieteistä muillekin tieteenaloille.

– Selkeä muutos on siinä, että viime vuosina on avoimen tieteen painoarvo kasvanut ja sen tueksi on kehitetty sekä kansallisia että kansainvälisiä palveluita, Susanna Nykyri kertoo.

Hyvään tieteelliseen käytäntöön kuuluu se, että tutkimuksissa viitattaisiin aina alkuperäiseen tekijään. Sama periaate koskee tutkimusdataa niin, että sitä ei voisi ottaa uudelleenkäyttöön ilman, että viitataan sen alkuperäiseen tekijään.

Tutkimusdata liittyy myös tutkijoiden meritoitumiskäytäntöihin siten, että datan kokoamisesta ja jakamisesta tulisi tutkijoille meriitti samaan tapaan kuin tiedeartikkeleiden ja muiden tiedejulkaisujenkin. Merkittävän datan kerääminen on tutkijatuotos, jonka tulisi näkyä myös tutkijan CV:ssä.

Datan määrää vaikea mitata

Maailmassa julkaistaan vuosittain arviolta kaksi miljardia tiedeartikkelia. Suomalaisten yliopistojen ja korkeakoulujen osuus tästä on noin 30 000 tieteellistä artikkelia.

Susanna Nykyri arvioi, että tiedonkeruussa datan määrä voi olla suurempi kuin tutkimusjulkaisujen määrä. Tutkimusdatan määrän mittaaminen on kuitenkin vaikeampaa kuin julkaisumäärien arviointi, sillä vakiintuneet kriteerit puuttuvat sille, mikä määritellään dataksi.

Data voi olla luonteeltaan hyvinkin monimuotoista. Laadulliseen tutkimukseen liittyvät haastattelut ja havaintopäiväkirjat ovat yhtä lailla dataa kuin kemistien tarkat mittaustuloksetkin.

Tutkimusdatan määrää voidaan mitata vaikka terabitteinä, mutta Nykyri ei pidä tätä keinoa mielekkäänä. Tärkeämpää olisi miettiä, millaisia järkeviä kokonaisuuksia on olemassa.

Perinteisistä tiedejulkaisuista saadaan nykyisin kattava kuva, sillä yliopistot raportoivat julkaisumääristään osana opetus- ja kulttuuriministeriön rahoitusmallia.

Tutkimusdatan tiedonkeruu on ongelmallista jo senkin vuoksi, että aineistot ovat pitkin maailmaa hyvinkin erilaisilla alustoilla eikä niitä ole helppo löytää kattavasti nykyisin keinoin. Ratkaisuja kuitenkin kehitetään kaiken aikaa.

Some-datassa monta ongelmaa

Avoimen tieteen kevätpäivien paneelikeskustelussa puhuttiin ongelmista, jotka liittyvät some-datan käyttöön tutkimusaineistona.

Tampereen yliopiston tutkija Marko Ahteensuu pohjusti paneelia alustuksella, jossa hän nosti esiin joukon ongelmia yksityisyyden suojasta tekijänoikeuksiin saakka.

Tutkijan kannalta keskeinen ongelma on siinä, tarvitseeko hän tekijän suostumuksen, jos hän aikoo käyttää some-aineistoa tutkimuksessaan. Tuhansien tai jopa satojen tuhansien käyttäjien suostumuksen hankkiminen on käytännössä mahdotonta. Se ei välttämättä riitä, että käyttäjä olisi antanut luvan hyväksymällä some-alustan käyttöehdot, sillä useimmat ihmiset eivät näitä pitkiä tekstejä lue lainkaan.

Some-aineistoon liittyy melkein aina henkilötietoja, jotka voidaan anonymisoinnista huolimatta helposti tunnistaa.

Panelisteista melkein kaikki olivat samaa mieltä siitä, että tärkein eettinen periaate some-datan käytössä on tutkittavien kunnioitus ja vahingoittamisen välttäminen.

Teksti: Heikki Laurinolli
Kuvat: Jonne Renvall