Hyppää pääsisältöön

DIGIKÄKI - Digitaalinen historia ja käsinkirjoitetut aineistot

Tampereen yliopisto
Projektin kesto1.1.2020–30.6.2023
KärkialueYhteiskunta, Tekniikka

Historiantutkimus, joka hyödyntää digitaaliseksi tekstiksi muutettuja historiallisia aineistoja, on herättänyt laajaa kiinnostusta viime vuosina. Digitaalinen luenta on ollut mahdollista jo jonkin aikaa painetuille teksteille, mutta heikommin käsinkirjoitetuille aineistoille. Tilanne on kuitenkin parhaillaan muuttumassa. Yleiseurooppalainen READ-hanke, jossa Suomesta on ollut mukana Kansallisarkisto, on kehittänyt Transkribus-ohjelman, joka pystyy tunnistamaan nyt jopa yli 90 % käsinkirjoitetusta tekstistä. Käsinkirjoitettujen aineistojen digitoiminen suuressa mittakaavassa on nyt ensimmäistä kertaa järkevää ja hyödyllistä.

Hankkeessamme "Digitaalinen historia ja käsinkirjoitetut aineistot: Sota-ajan kirjekokoelman digitalisointi, koneluku ja historiallinen analyysi" (DIGIKÄKI) teemme digitaalista tutkimusta tavallisten ihmisten käsinkirjoitetuilla teksteillä. Aineistonamme on Suomen suurin yksittäinen henkilökohtaisten kirjoitusten kokoelma, Tampereen yliopiston Kansanperinteen arkiston sota-ajan kirjekokoelma. Se sisältää noin 60 000 kirjettä toisen maailmansodan Suomesta: kirjoituksia noin 3000 suomalaiselta mieheltä ja naiselta joka puolelta maata ja jokaisesta yhteiskuntaluokasta.

Hankkeellamme on kaksi päätavoitetta:

(1) Sota-ajan kirjekokoelman digitointi: Kuvaamme suuren osan arkiston kirjeistä, muutamme kuvatut kirjeet Transkribus-ohjelmalla digitaaliseksi tekstiksi ja rakennamme kirjeiden metatietokannan. Lopputuloksena on digitaalinen kirjeaineisto, joka on poikkeuksellinen laajuudessaan niin Suomessa kuin kansainvälisesti. Sota-ajan kirjekokoelman digitointi parantaa lisäksi huomattavasti tämän ainutlaatuisen kokoelman käytettävyyttä, mikä tulee edistämään sen tutkimusta historianalalla sekä monissa muissa tieteissä.

(2) Tutkimus: Analysoimme kirjeitä uusilla digitaalisen ihmistieteen tutkimusmenetelmillä. Digitoidun kirjeaineiston avulla voidaan ensimmäisen kerran tarkastella tilastollisesti, miten suomalaisten kielellinen ja tunneilmaisu muuttui sotavuosien 1939-1945 aikana. Aineisto avaa myös merkittäviä mahdollisuuksia tarkastella yleisempiä digitaalisen historiantutkimuksen sekä sosiaali- ja kulttuurihistorian kysymyksiä.

DIGIKÄKI toimii Jalmari Finnen säätiön rahoituksella osana Kokemuksen historian huippuyksikköä (HEX). Hanketta johtaa dos. Ville Kivimäki.

Vaikuttavuus

Hankkeen julkaisut:

Risto Turunen, Ilari Taskinen, Lauri Uusitalo & Ville Kivimäki (2022), "Mining Emotions from the Finnish War Letter Collection, 1939–1944," Proceedings of the 6th Digital Humanities in the Nordic and Baltic Countries Conference (DHNB 2022). Toim. Karl Berglund, Matti Le Mela & Inge Zwart. Uppsala: DHNB, 135–44. Open Access -artikkeli osoitteessa: https://ceur-ws.org/Vol-3232/paper10.pdf

Ilari Taskinen, Risto Turunen, Lauri Uusitalo & Ville Kivimäki (2022), "Religion, Patriotism and War Experience in Digitized Wartime Letters in Finland, 1939–44," Journal of Contemporary History 57:3, Open Access -artikkeli osoitteessa https://doi.org/10.1177/00220094211066006.

Ilari Taskinen, Risto Turunen, Lauri Uusitalo & Ville Kivimäki (2021), "Digitalisoituva menneisyys: Käsinkirjoitettujen aineistojen konelukemisesta," Alusta! Yhteiskunta- ja kulttuuritieteiden verkkolehti, verkkojulkaisu: https://www.tuni.fi/alustalehti/2021/10/08/digitalisoituva-menneisyys-kasinkirjoitettujen-aineistojen-konelukemisesta/, julkaistu 8.10.2021.

Kirjeaineiston pohjalta luotu ja vapaasti käytettävä Transkribus-malli 1940-luvun suomalaisen käsinkirjoituksen konelukua varten: https://readcoop.eu/model/finnish_world_war_ii_letters_and_diaries/ 

Projektiin kuuluvat henkilöt