Frank Emmert-Streib: Oppi datasta, “2000-luvun öljystä”

Käsite ”data science”, eli ”datatiede”, esiintyi ensimmäisen kerran vuonna 1970, mutta vasta vuonna 2007 perustettiin alan ensimmäinen tutkimuskeskus, Research Center for Dataology and Data Science, Shanghaihin. Sana "dataology" keskuksen nimessä tarkoittaa ”oppia datasta”.
Datatieteessä yhdistellään useiden eri alojen osaamista ja asiantuntemusta, kuten koneoppimista, tekoälyä, verkostotiedettä ja tilastotiedettä. Tämä tekee alasta luonteeltaan poikkitieteellisen, koska jokaisella näistä tutkimusaloista on oma historiansa.
Datan saatavuus tarjoaa kaikille tieteenaloille mahdollisuuksia hankkia uutta tietoa ja ratkaista vaikeita ongelmia. Data itsessään ei kuitenkaan tarjoa tietoa, vaan sitä on ensin analysoitava. Tätä kutsutaan datasta oppimiseksi ja se on datatieteessä keskeistä.
Emmert-Streib käsittelee luennossaan kolmea kysymystä, jotka tarjoavat näkemyksiä datatieteeseen:
-
Mitä dataa datatiede tutkii?
-
Datatieteen ajankohtaiset haasteet?
-
Miten datatutkijaksi tullaan?