Hyppää pääsisältöön

Uusi käännösteknologia mullistaa ihmisten välisen vuorovaikutuksen

Julkaistu 24.1.2020
Tampereen yliopisto
Mary Nurminen, Mikhail Mikhailov ja Sirkku Latomaa/ Kuva: Jonne Renvall
Mary Nurminen, Mikhail Mikhailov ja Sirkku Latomaa iloitsevat uudesta käännösteknologiasta. Samalla he huomauttavat, että kääntämisen ammattilaisia tarvitaan entistä enemmän.

Käännösteknologian huima kehitys mullistaa käännösalan ja ihmisten välisen vuorovaikutuksen. Kieliesteet madaltuvat, mutta kääntäjän ammatti säilyy.

– Nyt voi jutella päivittäin konekäännettyjen tekstien avulla sellaisten ihmisten kanssa, joita ei olisi 10 vuotta sitten ymmärtänyt ilman tulkkien apua. Nyt saa tietoa, jota ei saanut 10 vuotta sitten, koska ei osannut kieltä, sanoo käännöstieteen tutkija Mary Nurminen.

Onko Raamatun tarina Baabelin kielten sekoituksesta vihdoinkin saamassa sovituksen, kun uusi käännösteknologia yhdistää kielet tuhansien vuosien hajaannuksen jälkeen?

– Ei täydellisesti, mutta nyt on mahdollista kommunikoida ihmisten kanssa ympäri maailman, Nurminen sanoo.

– Mutta voi tulla silloin tällöin väärin ymmärretyksi, huomauttaa käännöstieteen professori Mikhail Mikhailov, joka on erikoistunut suomen ja venäjän kielten väliseen kääntämiseen.

Mary Nurminen, Mikhail Mikhailov ja suomenkielisen viestinnän lehtori Sirkku Latomaa ovat järjestäneet Tampereelle kansainvälisen Konekäännin ja ihmiskääntäjä -työpajan. Se on osa Euroopan komission rahoittamaa Translating Europe Workshop -tapahtumasarjaa. Työpajan taustavoimina ovat komission käännöstoimen pääosaston (Directorate-General for Translation, DGT) lisäksi Turun yliopisto ja käännöstieteen maisteriohjelmien eurooppalainen verkosto European Master's in Translation.

Konekäännös onnistui
voittamaan ihmiskäännöksen

Käännösteknologian huima edistysaskel johtuu neuroverkoista, joihin pohjautuvat käännösohjelmat ovat yleistyneet vuodesta 2016, jolloin esimerkiksi Google Translate siirtyi tähän teknologiaan.

Konekääntämisen kansainvälisessä konferenssissa on jo usean vuoden ajan järjestetty kilpailuja kääntimien paremmuudesta; vertailuaineistona on ollut ihmisen kääntämiä tekstejä. Konekääntimet ovat hyppäyksittäin parantaneet sijoituksiaan.

Tulosten mukaan englanti–suomi-kieliparissa konekäännös jää merkittävästi jälkeen ihmiskäännöksestä, mutta esimerkiksi englanti–saksa-kieliparissa tilanne on kokonaan toinen, sillä kolmen konekääntimen käännökset arvioitiin vuonna 2019 paremmiksi kuin ihmiskääntäjien tulokset.

Sirkku Latomaa opiskeli käännösteknologian uutuuksia ja konekäännösten jälkieditointia syyskuussa järjestetyssä kesäkoulussa Antwerpenissa. Kokemuksen mukaan konekäännös nopeutti työprosessia huomattavasti verrattuna kokonaan itse tehtyyn työhön. Osalla osallistujista tuottavuus jopa kaksinkertaistui.

Mikhail Mikhailov sanoo, että nopeus riippuu tekstilajista. Hän kertoo saaneensa ristiriitaisia tuloksia kokeilussa, jossa hän antoi opiskelijoiden tehtäväksi kääntää samantyylisiä tekstejä kahdella tapaa: kääntämällä jokin teksti alusta loppuun itse ja tuottamalla toinen teksti Google-kääntäjän ja jälkieditoinnin avulla. Puolet opiskelijoista piti parhaimpana työtapaa, jossa konekäännös yhdistyi jälkieditointiin. Toiset pitivät parempana itse tehtyä käännöstä, sillä he kertoivat joutuneensa kirjoittamaan uusiksi kaiken koneen tuottaman tekstin.

Mikhailov arvioi, että lähdetekstin luonne vaikutti ratkaisevasti tuloksiin. Kaikkiin teksteihin ei konekäännös sovellu, mutta toisaalta myös kääntäjän ennakkoasenteilla ja kokeneisuudella on merkitystä prosessin onnistumisessa.

Tulkkauslaite ja konekäännös

Konekäännökset eivät ole ongelmattomia. Vasemmalla kuvakaappaus japanilaisen älylaitteen mainoksesta, joka lupaa laitteen osaavan jopa yli 40 kieltä.  Oikealla näyte Myanmarin hallinnon tiedotteesta, jossa Facebookin käännösohjelma muutti Kiinan presidentin nimen alatyyliseen muotoon.

Monta tapaa tuottaa
huonoja käännöksiä

Käännösteknologian mullistus luo helposti harhakuvan siitä, että kaikki kääntämisen ongelmat olisi kerralla voitettu. Tutkijat huomauttavat, että koneet eivät ratkaise kaikkea eikä kielen ja kääntämisen opiskelu ole tullut tarpeettomaksi.

Suomessakin markkinoidaan uutta japanilaista keksintöä, jossa pienen, kännykän kokoisen laitteen väitetään kääntävän reaaliaikaista puhetta jopa yli 40 kielelle. Mainoksen kömpelö otsikko kertoo siitä, että käännösteknologian tulokset ovat joskus todella huonoja.

– Sanoisin, että firma, joka käyttää konekäännöstä sellaisenaan mainoksessaan, ei menesty kovin pitkään. Voihan tosin olla niinkin, että he näyttävät rehellisesti sen, millaista kieltä laite tuottaa, Mary Nurminen epäilee.

– On monta tapaa tuottaa huonoja käännöksiä. Tehtävän voi antaa vaikka naapurin pojalle, joka osaa vähän englantia, sen sijaan, että käyttäisi ammattikääntäjiä.

Konekäännösten lipsahdukset nousevat helposti otsikoihin. Niin kävi äskettäin Myanmarin hallinnon tiedotteelle, jossa Facebookin käännösohjelma käänsi Kiinan presidentti Xi Jinpingin nimen alatyyliseen muotoon Mr. Shithole. Ongelman syyksi on arveltu sitä, ettei Facebookin käännösohjelmalla ollut presidentin nimeä burmankielisessä tietokannassaan. Siksi se hyödynsi englanninkielistä aineistoa ja arvasi sanan lopun kiinankielisestä sukunimestä Xi (äännetään: shi).

Erisnimien väärinkäännökset ovat tuttuja käännöstieteen ammattilaisille. He tähdentävätkin, että koneen tuottamaa käännöstä voi pitää vain raakaversiona, jonka hiomiseen tarvitaan ammattilaista.

– Kone tuottaa raakakäännöstä. Ei se ole aina kieliopillisesti eikä tyylillisesti hyvää tekstiä, mutta sitä voi käyttää joissakin tilanteissa, esimerkiksi kun riittää, että ymmärtää tekstin sisällön suurin piirtein. Toisaalta on tilanteita, joissa on järkevää käyttää vain ihmiskääntäjää ja olisi tyhmää harkita muuta keinoa, Mary Nurminen sanoo.

Wikipedian mukaan vuoden 2017 lopulla kaikista maailman käännöksistä 99 prosenttia on tehty konekääntimillä. Ammattikääntäjät tekevät vain yhden prosentin.

Käännösalan ammattilaiset vahvistavat, että kääntimiä käytetään nykyään todella paljon. Mikhail Mikhailov sanoo, että kaikki luvut ovat kuitenkin metaforia, sillä lukumäärien tarkka laskeminen on hyvin vaikeaa. Kukaan ei voi tarkkaan tietää, kuinka paljon käännöksiä tehdään erilaisilla itsepalvelukääntimillä.

Mary Nurminen on kerännyt tulevaa väitöskirjaansa varten käännösohjelmien käyttäjälukuja, joiden mukaan 800 miljoonaa ihmistä lukee kuukausittain Facebookin käännösohjelman tuottamia tekstejä. Yli 500 miljoonaa ihmistä käyttää Google-kääntäjää, joka on yleisin konekäännin.

Hirvikärpäsestä
tuli ”peurat lentävät”

Google-kääntäjä on saavuttanut merkittävän aseman kaiken kansan käännösohjelmana. Ammattilaisille ja yrityskäyttöön on räätälöity eriytyneempiä ohjelmia. Suuret yritykset, viranomaiset ja kansainväliset järjestöt käyttävät ja kehittävät konekääntimiä, jotka on treenattu juuri oman erityisalan teksteillä. Esimerkiksi Euroopan unionin lukuisten tekstien kääntämisessä käytetään apuna neuroverkkokäännintä eTranslation.

Mikhail Mikhailov huomauttaa, että uudet käännösohjelmat tulevat tarpeeseen etenkin pienille kielille. Esimerkiksi suomi‒ruotsi-kieliparin käännöksiä tarvitaan kaksikielisessä maassa paljon, mutta ilmaisohjelmat eivät tuota toivottua laatua. Se johtuu siitä, että niillä ei ole riittävästi tekstiresurssia juuri tässä kieliparissa, ja siksi käännin hoitaa tehtävän usein englannin kautta. Tällä hetkellä on onneksi kehitteillä oma käännin suomen ja ruotsin väliseen kääntämiseen, Fiskmö.

Ongelmiin törmätään myös sellaisissa kielipareissa, joissa toisena osapuolena on pieni kieli, esimerkiksi suomi‒venäjä. Mikhailovin kollega kokeili useita vuosia sitten Google-kääntäjällä, mikä olisi hirvikärpäsen vastine venäjäksi. Käännin päätyi tuolloin antamaan vastineeksi олени летят. Taustalla voi nähdä englannin kielen: hirvikärpäsestä on tullut ensin deer fly ja sitä kautta олени летят (’peurat lentävät’).

Arkaluontoinen tieto leviää
Google-kääntäjän kautta

Yritykset haluavat omia käännösohjelmia monestakin syystä. Yleisesti käytetyt työkalut eivät aina osaa erikoissanastoa. Toinen ongelma koskee tietosuojaa, sillä yritykset eivät halua antaa yrityssalaisuuksiaan avoimen työkalun kautta julkiseen käyttöön.

Sirkku Latomaa huomauttaa, että tavalliset ihmiset tulevat helposti tietämättään levittäneeksi omia yksityistietojaan, jos he käyttävät Google-kääntäjää omien sähköpostiensa kääntämiseen.

Google käyttää käännösohjelman tuottamaa muistivarastoa omaan kehitystoimintaansa. Sinne päätyvät myös käännösohjelman kautta kulkeneet rakkaus- ja erokirjeet, sairauskertomukset ja muut intiimit paljastukset.

Toisin päin voi ajatella, että monipuolinen tekstiaineisto auttaa kehittämään Google-kääntäjää entistäkin paremmaksi. Se taas hyödyttää ohjelman kaikkia käyttäjiä.

Näyttää hyvältä
mutta sisältää virheitä

Käännösteknologian huima kehitys synnyttää uusia vaatimuksia, joihin pitää varautua yhtä hyvin yliopistoissa ja peruskouluissa kuin tavallisten ihmisten keskuudessakin.

– Ongelmia voi tulla, jos ihmiset luottavat liikaa näihin työkaluihin. Turistin käytössä kaduilla ja ravintoloissa kaikki voi sujua hyvin, mutta jos yrittää tulkkauslaitteiden avulla selvitä neuvotteluista, niin voi tulla hankalia tilanteita. Ei kone pysty tulkkaamaan tai se voi tulkata paikoin väärin, Mikhail Mikhailov varoittaa.

– On paikkoja, mihin raakakäännöksen voi hyväksyä, ja on paikkoja, missä sitä ei pitäisi käyttää. Ihmisiä pitää kouluttaa ymmärtämään tämä ero. Uskon, että ihmisillä on hyvä tietämys riskeistä ja että niillä on terve epäilys sitä, että aina voi syntyä virheitä, Mary Nurminen sanoo.

Sirkku Latomaa sanoo, että Google-kääntäjä on kehittynyt suomen kielen tuottamisessa niin, että morfologian eli muoto-opin ongelmat on aika hyvin ratkaistu.

– On yllättävää, että Google osaa taivuttaa kaikki sijamuodot monikossa ja yksikössä, mutta semantiikan puolella on ongelmia. Merkitys voi mennä ihan pieleen. Sitä meidän pitää miettiä ja opettaa myös opiskelijat tekemään jälkieditointia näistä lähtökohdista. Heidän pitää tarkkaan katsoa lähtötekstistä, ovatko kaikki merkitykset kohdallaan silloin, kun teksti näyttää muuten hämmentävän hyvältä.

Mary Nurminen huomauttaa, että neuroverkkojen ongelma on juuri siinä, että teksti näyttää sujuvalta, mutta siinä voi olla asiavirheitä.

Latomaa sanoo, että käännösohjelmat ovat nyt erityisen ajankohtaisia kouluissa. Opettajat toimivat tutkijoiden mielestä väärin, jos he kategorisesti kieltävät oppilailta käännösohjelmien käytön. Tutkijoiden mielestä kouluissa pitäisi päinvastoin opettaa käyttämään uusia laitteita ja ohjelmia asianmukaisesti – ja myös kriittisesti.

– Koulujen kieltenopettajien pitäisi suhtautua konekääntimeen niin, että se on vain yksi apuväline, kielityöväline, jonka käyttöön oppilaita pitää opettaa. Sama tilanne oli aikoinaan taskulaskimen kanssa: ensin siihen suhtauduttiin epäilevästi ja sen käyttö kiellettiin esimerkiksi matematiikan kokeissa; sittemmin sitä on käytetty apuvälineenä.

Sirkku Latomaa, Mary Nurminen ja Mikhail Mikhailov/ Kuva: Jonne Renvall

Sirkku Latomaa, Mary Nurminen ja Mikhail Mikhailov haluavat opettaa yliopisto-opiskelijoille epävarmuuden sietokykyä ja ongelmanratkaisun taitoja, sillä kääntämisen ammattilaisia ei voi kasvattaa purkissa ja lähettää heidät työelämään valmiit taidot taskussaan. Heidät pitää sen sijaan opettaa oppimaan uutta kaiken aikaa.

Yliopiston pitää
opettaa oppimaan

Tampereen yliopistossa on ensimmäistä kertaa käynnissä käännösteknologian opetusmoduuli, jossa voi erikoistua konekääntämiseen, käännösmuistiohjelmiin ja terminhallintaan. Opetuskokonaisuutta tarjottiin kaikille uuden yliopiston opiskelijoille teekkareista humanisteihin, mutta toistaiseksi mukaan ovat lähteneet vain kielten ja käännöstieteen opiskelijat.

Vuoden päästä alkavaksi on suunnitteilla digikurssi, jossa voisi etäopiskella, miten neuroverkkokääntäminen toimii ja miten sitä arvioidaan.

Uusien käännösohjelmien opettaminen on vaativa tehtävä, sillä ohjelmat päivittyvät ja kehittyvät kaiken aikaa. Enää yliopistossa ei voi opettaa yhtä ohjelmaa, jota valmistuneet käyttäisivät seuraavat 20 vuotta.

– Ei kannata opettaa valikoita ja funktioita, vaan pitää opettaa ymmärtämään niiden käyttöfilosofia ja niiden käyttöä omassa työssä. Se on eri asia kuin 10 vuotta sitten, kun ajateltiin, että kasvatetaan ammattilaisia purkissa ja lähetetään ne sitten työelämään, Mikhailov sanoo.

Sirkku Latomaa täydentää, että yliopiston pitää opettaa epävarmuuden sietokykyä. Opiskelijoiden pitää oppia ratkaisemaan ongelmia, koska niitä tulee koko ajan.

– Pitää oppia oppimaan ja oppia tietämään, mistä saa oppia silloin, kun tulee uusia työkaluja, Mary Nurminen sanoo.

Teksti: Heikki Laurinolli
Kuvat: Jonne Renvall

Konekäännin ja ihmiskääntäjä – Translating Europe Workshop 31.1.2020