Hyppää pääsisältöön

Digital Language Typology: Mining from the Surface to the Core 2016-2019

Tampereen yliopisto

Kieli ja fonetikka muodostavat big data -materiaalivarantoja, joiden analyysi ja synteesi kiinnostavat insinööritieteen toimijoita.  

Kieliteknologia ja koneoppiminen mahdollistavat uudenlaisen tiedon visualisoinnin äänteiden, morfeemien, tavujen, sanojen ja lauseiden tasolla. Tutkimus paneutuu mm. kielen hierarkkisiin järjestelmiin, sanapainoihin ja taksonomioihin. Uralilaiset, indoeurooppalaiset, sekä samojedikielet ovat tutkimuksen kohdekieliryhmiä.    

Sovellettavia teknologioita ovat mm. konekäännös, puhesyntetisaattori, puheentunnistus sekä ääniohjattavat järjestelmät. Yhteistyöprojektissa tutkitaan kielellisiä järjestelmiä uusilla tietokonepohjaisilla menetelmillä.

Tausta

Suomen Akatemian rahottama Digitaaliset ihmistieteet eli Digital Humanities -hanke on uusi näkökulma kielitieteeseen. DLT-projektissa tutkitaan kieliryhmien puhuttua ja kirjoitettua materiaalia monialaisen tutkimusryhmän voimin.  

Uudet digitaaliset teknologiat mahdollistavat tiedon keräämisen, käyttämisen ja analysoinnin moderneilla tavoilla. Sovellusalueita ovat esimerkiksi korpuslingvistiikka ja sen laskennalliset menetelmät.  

Digitaalisten ihmistieteiden alalla on Suomessa vahva traditio. Yhdistämällä monialaista osaamista Suomen on mahdollista edustaa nopeasti kehittyvällä alalla maailman huippua. Ohjelma lähtee perustutkimuksen tarpeista, mutta teknologia mahdollistaa jatkokehityksen.  

Laaja-alainen yhteistyö rakentaa vaikutusmahdollisuuksia kulttuurin ja yhteiskunnan eri alueille. Edustettuna ovat erityisesti humanistiset ja yhteiskunnalliset alat.

Rahoituslähde

Suomen Akatemia

Koordinoiva organisaatio

TAUCHI, The University of Helsinki

Yhteyshenkilöt

Markku Turunen

Professori

markku.turunen [at] uta.fi

+358 40 533 9689