Hyppää pääsisältöön

Kielen tulkinta auttaa ymmärtämään pimeän verkon yhteisöjä

Julkaistu 13.1.2021
Tampereen yliopisto
Kuva: Jonne Renvall / Tampereen yliopisto
Pimeällä verkolla on synkkä kaiku: huumeita, rikoksia, elämän nurjaa puolta. Tor-verkon huumekaupan ja ääriliikkeiden foorumien käytäntöjä tutkinut Tuomas Harviainen on työssään myös tutustunut alakulttuureihin, joissa tiivis verkkoyhteisö antaa vertaistukea omilleen.

Tampereen yliopiston informaatiotutkimuksen apulaisprofessorina työskentelevää Tuomas Harviaista kiinnostaa, miten slangi kehittyy ja miten ihmiset viestivät toisilleen alakulttuureissa. Pimeää verkkoa kahlaamalla hän on voinut kurkistaa huumekulttuurin jäsenten arvoihin ja elämäntapaan sekä nähdä, miten myös vertaistuki toimii.

– Siellä käydään elämänhallintaan liittyviä keskusteluja, yhteisö pitää omistaan huolta. Monelle kyse on ideologiasta, huumeiden käytön kirjo on laaja. Kaikki ei liity järjestäytyneeseen rikollisuuteen tai vakiintuneeseen huumeiden käyttöön, sanoo Harviainen.

Tiedon avulla voi puuttua haitalliseen toimintaan

Tuomas Harviaisen ENNCODE-tutkimuksen taustalla on ristiriita verkon vaatimusten välillä: toisaalta halutaan entistä tiukempaa viranomaisvalvontaa, toisaalta vahvempaa yksityisyydensuojaa.

– Kehitämme työkaluja, joilla voi luokitella pimeän verkon viestejä. Tehtävämme on määritellä datan analysoinnin käytännöt, joilla toteutuu sekä tehokas tiedonkeruu että yksilön suoja, Harviainen selvittää.

Tekoälyn avulla verkon miljoonista viesteistä voidaan tunnistaa esimerkiksi huumeiden myynti-ilmoitukset nettikirpputorien kaltaisilla ns. kuvalaudoilla tai ääriliikkeiden propagandaan ja rekrytointiin liittyvät meemit sekä niiden liikkuminen eri verkkoympäristöistä toisiin.

Huumeiden vastaisessa työssä hyödyt ovat selkeät: ennaltaehkäisevä ja vieroitustyö helpottuu, kun uusi työkalu auttaa ymmärtämään huumekulttuuria. Meemien kautta voidaan paitsi jäljittää terroritekojen suunnittelijoita, myös ymmärtää radikalisoituvien ihmisten maailmankuvaa.

– Tuloksemme voivat aikanaan kiinnostaa esimerkiksi sosiaalitoimea ja poliisia. Kun tunnistamme erilaiset yhteisöt ja niiden tavan kommunikoida, on mahdollista ehkäistä paremmin radikalisoitumista ja haitallista huumekäyttäytymistä, uskoo Harviainen.

Kielen tunnistamisen työkalut tulevat useiden tahojen vapaaseen käyttöön Suomessa, myöhemmin ehkä muuallakin Euroopassa.

Koneoppiminen avuksi kuvalautojen datan tulkintaan

Tutkimuksessa on parhaillaan käynnissä pimeän verkon kuvalaudoilta löytyvän, huumeisiin tai ääriliikkeiden meemituotantoon liittyvän datan analysointi.

– Kun saamme lisää dataa kasaan, alamme jatkokehittää koneoppimisen työkaluja, jotka mahdollistavat valtavien aineistojen analyysin, kertoo Tuomas Harviainen.

Anonyymin, indeksoimattoman verkon tärkeimpiä pontimia on ollut sananvapauden edistäminen. Pimeässä verkossa liikkuminen on osittain salattua, jotta tietoa voi jakaa ja hakea suhteellisen vapaasti ja turvallisesti.

– Verkkorikollisuus on teknologian mahdollistama lieveilmiö, ei pimeän verkon päätarkoitus, Harviainen muistuttaa.

Pimeä verkkokaan ei ole vedenpitävästi anonyymi. Viimeaikaiset tietosuojamurrot ovat nostaneet yksityisyydensuojan tapetille. Kansalaisia on askarruttanut se, kuinka vaikea rikollisen jäljille on päästä.

– Kyllä ihminen voidaan tunnistaa myös pimeässä verkossa, mutta reaaliaikainen jäljitys vaatii massiivisia järjestelmiä ja paljon tehoa, Harviainen toteaa.

Suomen Akatemian rahoittaman ENNCODE (Extremist Networks, Narcotics and Criminality in Online Darknet Environments) -konsortion tutkimusetiikkaa koskeva tiedeartikkeli julkaistiin HICSS-konferenssissa 4.1.2021. Vuoteen 2022 jatkuvassa tutkimuksessa on mukana informaatiotutkimuksen, koneoppimisen, mediatutkimuksen, politiikan tutkimuksen ja kielitieteen asiantuntijoita. Tutkimusta tehdään yhdessä Helsingin yliopiston ja Maanpuolustuskorkeakoulun kanssa.

Teksti: Anna Aatinen
Kuva: Jonne Renvall

Mikä ihmeen pimeä verkko?

Pimeä verkko muodostuu vapaaehtoisten ylläpitämistä anonyymeista palvelimista ja verkkosivuista, joihin saa yhteyden vain erityisellä ohjelmistolla. Näistä tunnetuin on Tor (The Onion Router), jonka monikerroksinen sipulireititysteknologia suunniteltiin 1990-luvun puolivälissä Yhdysvaltain tiedustelupalveluiden viestintää varten. Tor mahdollistaa anonyymin internetselaamisen, verkkokeskustelun ja pikaviestinnän. Anonyymiys on tehnyt Tor-verkosta tärkeän ilmaisunvapauden välineen mm. poliittisesti vainottujen käyttöön, mutta se mahdollistaa myös laittomuudet ja järjestäytyneen rikollisuuden. (Lähde: Wikipedia)