Hyppää pääsisältöön

Frank Emmert-Streib: Oppi datasta, “2000-luvun öljystä”

Julkaistu 8.6.2023
Tampereen yliopisto
Henkilökuva Frank Emmert-Streibista
Frank Emmert-Streib on datatieteen professori Tampereen yliopistossa, jossa hän johtaa Predictive Society and Data Analytics Lab -tutkimusryhmää. Dataa on kaikkialla, ja jokainen tieteen ja teollisuuden ala tuottaa dataa näennäisen vaivattomasti. Esimerkkeinä voidaan mainita potilaiden genomimittaukset, osakemarkkinoiden tapahtumat ja viestintä sosiaalisessa mediassa. Tästä syystä dataa onkin kutsuttu “2000-luvun öljyksi”. Datatulvan käsittelemiseksi on perustettu uusi tieteenala, datatiede.

Käsite ”data science”, eli ”datatiede”, esiintyi ensimmäisen kerran vuonna 1970, mutta vasta vuonna 2007 perustettiin alan ensimmäinen tutkimuskeskus, Research Center for Dataology and Data Science, Shanghaihin. Sana "dataology" keskuksen nimessä tarkoittaa ”oppia datasta”.

Datatieteessä yhdistellään useiden eri alojen osaamista ja asiantuntemusta, kuten koneoppimista, tekoälyä, verkostotiedettä ja tilastotiedettä. Tämä tekee alasta luonteeltaan poikkitieteellisen, koska jokaisella näistä tutkimusaloista on oma historiansa.  

Datan saatavuus tarjoaa kaikille tieteenaloille mahdollisuuksia hankkia uutta tietoa ja ratkaista vaikeita ongelmia. Data itsessään ei kuitenkaan tarjoa tietoa, vaan sitä on ensin analysoitava. Tätä kutsutaan datasta oppimiseksi ja se on datatieteessä keskeistä. 

Emmert-Streib käsittelee luennossaan kolmea kysymystä, jotka tarjoavat näkemyksiä datatieteeseen: 

  • Mitä dataa datatiede tutkii? 

  • Datatieteen ajankohtaiset haasteet? 

  • Miten datatutkijaksi tullaan? 

Frank Emmert-Streibin yhteystiedot