Tutkimus

Lapsen kielenoppimisesta mallia koneälylle

Okko Räsänen
Okko Räsänen tutkii lapsen kielenoppimisen mekanismeja ja niiden hyödyntämistä koneälyn kehittämisessä.
Lapsen kielenoppiminen perustuu kuunteluun ja vuorovaikutukseen ympäristön kanssa. Kielenoppimisen prosesseja voidaan tutkia analysoimalla lasta ympäröivää puhevirtaa puheteknologian ja erilaisten laskennallisten mallien avulla.

– Kun ymmärrämme ne mekanismit ja periaatteet, joihin lapsen kielenoppiminen perustuu, voimme hyödyntää tietoa koneälyn kehittämisessä, uskoo akatemiatutkija, apulaisprofessori Okko Räsänen.

Räsänen johtaa puheen ja kognition tutkimusryhmää (Speech and Cognition Research Group) Tampereen yliopiston informaatioteknologian ja viestinnän tiedekunnassa tietotekniikan yksikössä.

– Yksi tutkimusryhmämme pääteemoista on lapsen varhaisen kielenoppimisen tutkimus puheteknologian avulla. Teemme laskennallisia malleja lapsen kielenoppimisesta sekä kehitämme teknologisia työkaluja kielenoppimisen tutkimukseen, Räsänen kertoo.

Tutkimusryhmän kehittämien mallien ja työkalujen avulla voidaan analysoida automaattisesti suuria ääniaineistoja lasten kotiympäristöistä. Aineistojen keruussa käytetään lasten päälle puettavia mikrofoneja.

– Meillä on analysoitavia ääniaineistoja tuhansia tunteja. Ne sisältävät kaiken, mitä lapsi kuulee ääniympäristössään, Räsänen sanoo.

– Tällaisten aineistojen käsittely käsin on mahdotonta millekään tutkimusryhmälle maailmassa, eivätkä olemassa olevat puheentunnistusjärjestelmät sovellu tarkoitukseen. Nauhoitteet ovat usein huonolaatuisia, ja äänilähde saattaa olla kaukana mikrofonista. Työkalujen on myös toimittava riippumatta puhutusta kielestä.

Tutkimusryhmän käyttämät menetelmät perustuvat signaalinkäsittelyyn ja koneoppimiseen. Menetelmät soveltuvat sekä puheen määrän että laadun arviointiin. Niiden avulla voidaan analysoida esimerkiksi sitä, paljonko lapsi kuulee puhetta eri vanhemmilta ja puhutaanko lapselle suoraan vai kuuleeko hän vain vanhempien välisiä keskusteluja.

Mitä kone voi oppia lapselta?

Okko Räsäsen tutkimusryhmän erityisenä kiinnostuksen kohteena on se, millaisilla laskennallisilla malleilla kone voi oppia ymmärtämään kieltä puheaineistoista, jos kielen ymmärtämiseen ei ole olemassa valmista algoritmia. Myöskään ihmislapsi ei saa suoranaista ohjausta äidinkielen oppimiseen, vaan hän oppii kuulemalla ja vuorovaikutuksessa ympäristönsä kanssa.

– Tavoitteenamme on ymmärtää paremmin lasten kielikokemusten ja kielenoppimisen mekanismien vuorovaikutusta. Sitä kautta voidaan hahmottaa esimerkiksi yksilöllisiä eroja lasten kielenkehityksessä tai ylipäätään sitä, mitkä tekijät ovat kriittisiä normaalin kielenkehityksen kannalta, Räsänen sanoo.

–  Pyrimme selvittämään esimerkiksi äänne-, tavu- ja kielioppitason rooleja oppimisen eri vaiheissa.  Meitä kiinnostaa, miten lapsi oppii jäsentämään äidinkielensä puheäänteitä ja irrottamaan ja tunnistamaan sanoja jatkuvasta puhevirrasta tai miten sanojen merkitysten oppiminen kietoutuu sanojen tunnistamiseen puheesta. Tutkimme myös, mitä muuta informaatiota ja vuorovaikutusta kielenoppiminen vaatii kuullun puheen lisäksi.

Tutkimuksessaan Räsänen on esimerkiksi osoittanut laskennallisen mallinnuksen keinoin, että kieltä oppivan lapsen tai koneen ei välttämättä tarvitse ensin erikseen löytää sanoja puhevirrasta, jotta sanat voitaisiin yhdistää niiden merkityksiin. Sen sijaan sanojen erottelu ja niiden merkitysten omaksuminen tukevat toisiaan, ja ne voivat siksi tapahtua samanaikaisesti, kun lapsi on moniaistillisessa vuorovaikutuksessa ympäristönsä kanssa.

Ryhmä on myös tutkinut niin kutsutun tilastollisen oppimisen, tarkkaavaisuuden ja puheen prosodian välistä yhteyttä. 

– Tutkimuksessamme on syntynyt muun muassa teoria sille, miksi lapsille suunnattu puhe, ’infant directed speech’, kiinnittää lapsen tarkkaavaisuuden normaalia puhetapaa voimakkaammin tai miten lausepaino ylipäätään vaikuttaa kuullun puheen prosessointiin ja kuulijan tarkkaavaisuuteen myös aikuisilla, Räsänen selostaa.

Räsäsen mukaan teoria pohjautuu havaintoon siitä, että aistiärsykkeiden ennakoitavuus suuntaa tarkkaavaisuuden ohjautumista ympäristössämme. Lapselle suunnatun puheen rikas intonaatio vaikuttaa alustavien analyysien perusteella vaikeammin ennakoitavalta kuin tavallisen puheen intonaatio.

– Syntynyttä tietoa voidaan soveltaa tietokoneen tekemässä automaattisessa lausepainon analyysissä puheaineistoista ilman että kukaan opettaa koneelle erikseen esimerkkien avulla, miten lausepaino ilmenee puhutussa kielessä. 

Monialaista osaamista

Räsäsen tutkimusryhmän työssä yhdistyvät insinööriosaaminen, psykologia ja kielitiede. Puhedataa prosessoivien laskennallisten mallien kehittäminen vaatii signaalinkäsittelyn ja koneoppimisen osaamista, kun taas tutkittavat ilmiöt keskittyvät ihmisen kognitiiviseen kehitykseen sekä kielen rakenteisiin ja kieleen ilmiönä. 

Tällä hetkellä Räsäsen tutkimusryhmässä on käynnissä kaksi kielentutkimukseen liittyvää Suomen Akatemian hanketta. Computational basis of contextually grounded language acquisition in humans and machines -hanke tutkii lapsen kielenoppimisen mekanismeja ja niiden hyödyntämistä koneälyn kehittämisessä. Analyzing Child Language Experiences Around the World -hankkeessa (ACLEW) tutkitaan lasten kielenkehityksen vaikutteita erilaisissa kieli- ja kulttuuriympäristöissä.

Räsänen siirtyi Tampereen yliopistoon Aalto-yliopistosta vuonna 2018. ACLEW on virallisesti Aalto-yliopiston hanke, joka alkoi Räsäsen vielä työskennellessä Aalto-yliopistossa. Räsänen toimii edelleen hankkeen vastuullisena johtajana vierailevana tutkijana, ja hankkeessa työskentelee tutkijoita sekä Aallosta että Tampereen yliopistosta.

Räsäsen ja hänen tutkimusryhmänsä tutkimus lasten kielenoppimisprosessin ymmärtämiseksi on monella tavoin uraauurtavaa. Räsäsen mukaan kielenoppimisen mekanismien valjastaminen koneälyn käyttöön on kuitenkin vielä lapsenkengissä.

–  Viime vuosien nopea teknologinen kehitys koneoppimisen alueella on johtanut suuriin harppauksiin puhe- ja kieliteknologian sovelluksissa. Järjestelmät ovat kuitenkin vielä kaukana ihmisen kyvystä omaksua ja aidosti ymmärtää puhuttua kieltä. Lisäksi laskennallisten mallien käyttö esimerkiksi yksilötason kielenkehityksen tai sen ongelmien ymmärtämisessä ja ratkaisemisessa on vielä rajallista, Räsänen toteaa.

– Kielenoppimisen ymmärrys tai ihmisen kaltaisen kielellisen ja käsitteellisen kompetenssin kehittäminen tekoälyjärjestelmiin on valtavan pitkä ja haastava projekti. Aiheen parissa riittää taatusti töitä vielä vuosikymmeniksi.


Teksti: Tiina Wesslin
Kuva: Jonne Renvall