Koulun tiloihin asennetaan erilaisia sensoreita, joilla pystytään tarkkailemaan koulun tilojen ilmanlaatua ja melutasoa . . . [toinen] datan lähteistä on kännykkäsovellus, jolla oppilaat ja koulun henkilökunta arvioivat päiväänsä ja fiilistään . . . Data kerätään suoraan helppoon käyttöliittymään analysoitavaksi ja vertailtavaksi pidemmän aikavälin tietoihin

Datafikaation perusajatus on, että yhä suurempi osa ihmisten toiminnasta ja ympäristön ilmiöistä on muutettavissa ja kategorisoitavissa tietokoneen käsiteltävissä olevaksi dataksi. Alustukseni aloittanut ote IT-palvelutalo Atean Smart School-konseptin palveluista tiivistääkin hyvin datafikaation kaksi päämuotoa: 1) ihmisten teknologiavälitteisen toiminnan ja 2) verkottuneiden esineiden tuottaman määrällisen datan reaaliaikaisen seurannan ja ennakoivan analyysin.

Tässä alustuksessa keskityn nimenomaisesti inhimillisen toiminnan datafikaatioon ja esitän, että datafikaatio on tuonut kouluihin kaksi ongelmallista piilo-opetussuunnitelmallista sisältöä: datan tarkkuuden yliarvioimisen sekä jatkuvan datankeruun luonnollistumisen. Ennen näiden teemojen tarkempaa käsittelyä on kuitenkin syytä käydä läpi miten ja miksi datafikaatiosta on ylipäätään tullut institutionaalista kasvatusta määrittävä ilmiö.

Koulutuksen datafikaation taustoista

Koulutuksen datafikaatio ei ole historiaton ilmiö ja oppilaiden läsnäoloa ja suoriutumista on seurattu ja tilastoitu kautta institutionaalisen kasvatuksen historian. Datankeruun kaikkiaallisuus, huomaamattomuus sekä datapisteiden määrän räjähdysmäinen kasvu tekevät nykyhetkestä poikkeuksellisen.

Kansainvälisessä mittakaavassa syyt datafikaation eksponentiaaliselle kasvulle koulutuksen kontekstissa voidaan paikantaa kolmeen yhteenkietoutuneeseen ilmiöön: digitalisaatioon (digitalization; Mertala 2020) oppimiskeskeisyyteen (learninfication; Biesta 2012), sekä tulosvastuullisuuteen (accountability; Williamson 2017).

Digitalisaatiolla tarkoitan sekä teknologista kehitystä että perinteisten välineiden ja menetelmien korvaamista digitaalisilla versioilla. Oppimiskeskeisyydellä viitaan koulun, kasvatuksen ja kasvatustieteiden sanastoa uudistavaan kielelliseen käänteeseen, jossa opettamisen sijaan puhutaan oppimisesta ja oppilaiden sijaan oppijoista. Tulosvastuullisuus puolestaan viittaa ylikansalliseen koulutuspoliittiseen trendiin, jossa kokeiden ja testien avulla arvioidaan ja vertaillaan oppilaiden, opettajien ja oppilaitosten suoriutumista.

Digitalisaatio mahdollistaa laajan datankeruun, tulosvastuullisuus oikeuttaa datankeruun ja oppimiskeskeisyys käsitteellistää opetuksen ja kasvatuksen ilmiöt mitattavaan muotoon.

Näiden kolmen tekijän rooli opetuksen digitaalisessa datafikaatiossa voidaan hahmottaa kehämäisenä suhteena: digitalisaatio mahdollistaa laajan datankeruun, tulosvastuullisuus oikeuttaa datankeruun ja oppimiskeskeisyys käsitteellistää opetuksen ja kasvatuksen ilmiöt mitattavaan muotoon. Esimerkiksi nyt pinnalla olevan oppimisanalytiikan (learning analytics) perusajatus ja suhde digitalisaatioon (D), oppimiskeskeisyyteen (O) ja tulosvastuullisuuteen (T) voidaan tiivistää seuraavasti: sovellukset keräävät digitaalista dataa (D) oppimisprosessien mallintamiseen ja analysointiin (O) ja nämä analyysit luovat pohjan oppilasta koskevien pedagogisten päätösten tekemiselle (T).

Toisin sanoen se, kuinka nopeasti ja tarkasti oppilas suoriutuu sovelluksen tarjoamista tehtävistä määrittää sitä, millaiseksi hänen osaamisensa tulkitaan ja millaisia harjoitteita hänelle jatkossa tarjotaan. Ajatus oppimisanalytiikan ynnä muiden datateknologioiden mahdollisesta hyödyllisyydestä perustuu siihen, että kerätty data on tarkkaa ja todistusvoimaista ja kertoo juuri siitä ilmiöstä ja / tai prosessista, jota sovelluksen tai laitteen väitetään taltioivan. Jos tämä periaate ei toteudu, on hienoinkin sovellus vain savijaloilla seisova jättiläinen. Valitettavasti asia on usein juuri näin.

Data ja “data”: Datan tarkkuuden yliarvioiminen

Evgeni Morozovin (2013) mukaan internetillä teknisenä järjestelmänä ei ole juurikaan tekemistä sen myyttisen ja kaikkivoivan internetin kanssa, josta julkisessa keskustellussa puhutaan. Jälkimmäistä Morozov kutsuukin ”internetiksi” vain lainausmerkkien sisällä. Saman logiikan mukaisesti on olemassa myös dataa ja “dataa”. Data ilman lainausmerkkejä viittaa datan realistisiin ominaisuuksiin; siihen, että data on parhaimmillaankin vain vihjeitä ja indikaattoreita siitä ilmiöstä, joka sen avulla yritetään tavoittaa. “Data” puolestaan viittaa siihen, millaisena data diskursiivisesti tuotetaan: tarkkana, erehtymättömänä ja todistusvoimaisena (ks.esim. Battista & Conte 2016; Špiranec ym. 2019).

Esimerkiksi suosittuja liikunta- ja hyvinvointiteknologioita markkinoidaan kuluttajille korostamalla niiden ominaisuuksia sanamuodoin, joissa vaietaan sensoridatan summittaisuudesta: ihmisessä ei ole USB-porttia, vaan sensoridata on erilaisiin indikaattoreihin perustuvia tilastollisia arvioita. Edustava esimerkki tästä “data”-diskurssista ovat yksityisen päiväkotiketju Touhulan esittämät perustelut aktiivisuusmittareiden käytölle. Yhtiön tiedotteen mukaan “aktiivisuusmittari kertoo helposti ja selkeästi kuinka paljon päivän aikana on istuttu, seisoskeltu tai liikuttu. Mitatun tiedon avulla toiminnan laatua on helppo seurata”. Tiedotteessa ei puhuta datasta tai edes informaatiosta, vaan mitatusta tiedosta, jonka sovellus vieläpä visualisoi käyttäjälleen helposti omaksuttavassa muodossa.

Lainauksessa esitettyihin väitteisiin liittyy ainakin kaksi keskeistä ongelmaa. Ensiksikin kiihtyvyysanturiteknologiaa hyödyntävät aktiivisuusrannekkeet ovat epätarkkoja ja valikoivia ja ne eivät huomioi liikkumismuotoja, joissa kädet ovat staattisia. Neljävuotias kuopukseni esimerkiksi viihtyy päiväkotinsa pihalla erityisesti kolmipyörällä polkien ja isoa muovista kuorma-autoa juoksemalla pukaten. Kumpaakaan näistä liikkumismuodoista aktiivisuusranneke ei kykenisi kunnolla taltioimaan käsien staattisuuden vuoksi. Toiseksi, liikkeen määrän mittaaminen ei riitä kertomaan liikuntakasvatuksen laadusta: Olennainen osa varhaiskasvatuksen ja esi- ja alkuopetuksen liikuntakasvatuksen sisältöjä on staattisten tasapainotaitojen harjoittelu, jossa kehon painopiste mukautetaan paikallaan olevaan tukeen (esimerkkinä yhdellä jalalla seisominen). Näiden tavoitteiden saavuttamista ei aktiivisuusmittarilla voi seurata.

Myös mitattavien ilmiöiden “tuottaja”, eli lapsi tai nuori, on kompleksinen olento, jonka maailmaa on mahdotonta mallintaa koneen sisään. Tätä kirjoittaessa esikoiseni on peruskoulun toisella luokalla. Hänen koulussaan on käytössä lasten matemaattista suoriutumista monitoroiva ja arvioiva matematiikkasovellus, josta oppilaille tulee viikoittaisia tehtäviä. Yksi perustehtävätyyppi ovat aikarajoitteiset laskutehtävät. Niissä oppilaan tulee ratkaista mahdollisimman monta tehtävää annetun ajan puitteissa. Näistä tehtävistä esikoiseni suoriutuu todellista osaamistaan heikommin, koska aikaraja saa hänet jännittyneeksi ja hermostuneeksi. Tämä näkyy esimerkiksi virheiden lisääntyneenä määränä sekä kognitiivisesta ja emotionaalisesta kuormituksesta johtuvana laskunopeuden hidastumisena. Näitä tekijöitä sovellus ei kuitenkaan kykene tavoittamaan eikä analyysissaan huomioimaan.

Kritiikittömät ja epärealistiset “data”-diskurssit ovat luonnollistuneet myös osaksi luokkahuonekäytäntöjä.

Empiiristä tutkimusta ”datan” diskursiivisesta tuottamisesta luokkahuoneissa ei ole toistaiseksi tehty. Aihetta sivunneet tutkimukset (esim. Harris ym. 2020; Manolev ym. 2019) antavat kuitenkin viitteitä siitä, ettei datan rajoituksia ja sokeita pisteitä tehtäisi oppilaille näkyväksi. Tämän havainnon voi tulkita kertovan ainakin osin siitä, että kritiikittömät ja epärealistiset “data”-diskurssit ovat luonnollistuneet myös osaksi luokkahuonekäytäntöjä. Toinen luonnollistunut käytänne on jatkuva datankeruu, jota käsittelen seuraavassa kappaleessa.

Jatkuvan datankeruun luonnollistuminen

Mitä dataintensiivisempiä koulun käytänteet ovat, sitä luonnollisempana ja hyväksyttävämpänä jatkuva datankeruu näyttäytyy lapsille ja nuorille. Tarkkaa tietoa erilaisten datateknologioiden käytön laajuudesta Suomessa ei ole saatavilla, mutta osviittaa niiden yleistymisestä antaa kuitenkin tieto, että pelkästään Turun yliopiston kehittämää ja ylläpitämää ViLLE-oppimisanalytiikkajärjestelmää käytetään noin 45 prosentissa suomalaiskouluista. Sen rinnalla käytössä voi olla useita muitakin dataa kerääviä sovelluksia.

Marraskuussa 2019 Yleisradion verkkosivuilla julkaistiin artikkeli, jossa kuopiolaisen 3-luokkalaisen oppilaan huoltaja kertoi lapsensa luokassa otetun käyttöön erilaisia sovelluksia kysymättä lupaa huoltajilta. Sovelluksia oli tarkoitus käyttää oppilaiden omilla puhelimilla. Haastatellun huoltajan mukaan

Sovellusten ja niiden taustalla olleiden pelimoottoreiden tietosuojalausekkeista kävi ilmi, että ainakin yksi koulun käyttämistä sovelluksista käytti puhelimen mikrofonia, äänitti lapsen puhetta ja kodin ääniä. Lisäksi sovellus varasi oikeuden käyttää keräämiään tietoja kaupallisiin tarkoituksiin ja luovuttaa niitä eteenpäin.

Tulkitsen näiden esimerkkien kertovan datankeruun luonnollistumisesta: “Kyllä”-vaihtoehdon valitseminen kysymykseen “saako sovellus käyttää puhelimen kameraa ja mikrofonia” lähtee jo likipitäen selkärangasta, eikä valinnan merkityksiä pysähdytä pohtimaan. Ylen uutisoiman tapauksen kaltaisten tilanteiden kohdalla huoltajan –ja sitä myöten lapsen– on vielä suhteellisen helppo kieltäytyä käyttämästä sovellusta. Asia on kuitenkin täysin toinen, mikäli palveluntarjoaja on lähtökohtaisesti luotettava ja datankeruu kytketään elimelliseksi osaksi kansallista koulutuspolitiikkaa ja -järjestelmää. Tarkoitan tällä sitä, että visiot, joissa datafikaatio yhdistetään elinikäisen oppimisen tukemiseen ja mahdollistamiseen ovat yleisiä ajankohtaisessa koulutuskeskustelussa (ks. Selwyn 2019b). Tämä ajatusmalli kiteytyy hyvin Timo Kasken ja Kari Silpiön (2019) ajatukseen siitä, kuinka

Tekoälyn avulla verkko-oppimisympäristöistä voidaan tehdä adaptiivisia ja oppijaa henkilökohtaisesti ohjaavia. Koneen täytyy kuitenkin tietää oppijasta ja hänen opiskelustaan riittävästi. Opiskelijan historia oppijana voi kertoa koneelle, millainen oppija on kyseessä. Millaisia taipumuksia hänellä on oppimistehtävien suorittamisessa? Millaisia ovat hänen vahvuutensa ja heikkoutensa opiskelussa?

Edellä kuvatun kaltainen oppimisympäristö edellyttää kahta asiaa: ensiksi sitä ihmisistä kerätään säännöllisesti dataa heidän koko opinpolkunsa ajalta ja toiseksi sitä, että data voi liikkua jouhevasti palvelusta ja instituutiosta toiseen. Askelia tämän skenaarion toteuttamiseen ollaan jo ottamassa: Opetushallituksen syksyn 2020 valtionavustusjaon kärkinä olivat oppimisanalytiikan sekä oppimiseen liittyvän datan hyödyntämiseen sekä oppimisen digitaalisten palveluiden ja tuotteiden yhteentoimivuuden lisääminen.

Lopuksi

Tässä kirjoituksessa olen tarkastellut koulutuksen datafikaation taustoja, sekä nostanut esiin kaksi datafikaatioon liittyvää ongelmaa: datan tarkkuuden yliarvioimisen sekä jatkuvan datankeruun luonnollistamisen.

Ongelmallisina pidän niitä erityisesti siksi, että ne toisintavat taloudellisen hyödyn maksimointiin tähtäävän datafikaation toimintalogiikkaa ja diskursseja. Käyttäjälle enimmäkseen näkymättöminä pysyttelevien datapisteiden on toistuvasti sanottu olevan uusi öljy tai kulta, jolla viitataan datan arvoon modernissa yritystoiminnassa.  Datankeruu ei täten ole summittaista tai sattumanvaraista, vaan datan avulla pyritään vaikuttamaan ihmisten toimintaan ja valintoihin. Tässä myös usein onnistutaan: yli 80 prosenttia Netflixistä katsotusta sisällöstä perustuu palvelun dataperustaiseen suosittelualgoritimiin.

Datankeruu ei täten ole summittaista tai sattumanvaraista, vaan datan avulla pyritään vaikuttamaan ihmisten toimintaan ja valintoihin. Tässä myös usein onnistutaan: yli 80 prosenttia Netflixistä katsotusta sisällöstä perustuu palvelun dataperustaiseen suosittelualgoritimiin.

Vaikka alustuksen pohjavire on kriittinen, en ole kannustamassa oppilaita, opettajia ja huoltajia repimään tietokoneista virtajohtoja tai heittämään aktiivisuusrannekkeita järvenpohjaan. Vallitsevan kritiikittömyyden korvaaminen yksiulotteisella vastustamisella ei tarjoa lapsille ja nuorille sen parempia eväitä kriittiseen toimijuuteen datafikoituneessa yhteiskunnassa ja kulttuurissa. Se, mitä peräänkuulutan, on koulun avoin itsekriittisyys datakäytänteitään kohtaan. Käytännössä tämä tarkoittaa sitä, että oppilaiden kanssa käsitellään koulussa käytettävien datateknologioiden rajoituksia ja vääristymiä ja tehdään “datasta” dataa.

 

Kirjallisuus

Battista, A, & Conte, J. (2016). Teaching with data: Visualization and  information as a critical process. In N. Pagowsky & K. McElroy (toim),  Critical library pedagogy handbook. Vol 2: Lesson plans (147–154). Amer Library Association.

Biesta, G. J. (2012). Giving teaching back to education: Responding to the  disappearance of the teacher. Phenomenology & Practice, 6(2), 35–49.

Harris, L., Wyatt-Smith, C., & Adie, L. (2020). Using data walls to display assessment results: a review of their affective impacts on teachers and students. Teachers and Teaching, 26(1), 50–66. https://doi.org/10.1080/13540602.2020.1739018

Heikkilä, T. (2018). Datan kerääminen uhkaa vapautta, ellemme ole valppaita. Alusta! Yhteiskunta- ja kulttuuritieteiden verkkolehti. https://www.tuni.fi/alustalehti/2018/09/13/datan-keraaminen-uhkaa-vapautta-ellemme-ole-valppaita/

Kaski, T. & Silpiö, K. (2019). Education AI auttaa onnistumaan jatkuvassa oppimisessa. https://esignals.fi/teemat/trendit/education-ai-auttaa-onnistumaan-jatkuvassa-oppimisessa/#f43cf108

Manolev, J., Sullivan, A., & Slee, R. (2019). The datafication of discipline: ClassDojo, surveillance and a performative classroom culture. Learning, Media and Technology, 44(1), 36–51. https://doi.org/10.1080/17439884.2018.1558237

Mertala, P. (2020). Paradoxes of participation in the digitalization of education: a narrative account. Learning, Media and Technology, 45(2), 179–192. https://doi.org/10.1080/17439884.2020.1696362

Morozov, E. (2013). To save everything, click here: The folly of technological solutionism. Public Affairs.

Selwyn, N. (2019a). Should robots replace teachers? AI and the future of education. Polity.

Špiranec, S., Kos, D., & George, M. (2019). Searching for critical in data literacy. Information Research, 24(4). http://informationr.net/ir/24-4/colis/colis1922.html

Williamson, B. (2017). Big data in education: The digital future of learning, policy and practice. Sage.