Hyppää pääsisältöön
Opintojakso, lukuvuosi 2023–2024
DATA.STAT.840

Statistical Methods for Text Data Analysis, 5 op

Tampereen yliopisto
Opetusperiodit
Aktiivinen periodissa 1 (1.8.2023–22.10.2023)
Aktiivinen periodissa 2 (23.10.2023–31.12.2023)
Koodi
DATA.STAT.840
Opetuskieli
englanti
Lukuvuodet
2021–2022, 2022–2023, 2023–2024
Opintojakson taso
Syventävät opinnot
Arvosteluasteikko
Yleinen asteikko, 0-5
Vastuuhenkilö
Vastuuopettaja:
Jaakko Peltonen
Vastuuorganisaatio
Informaatioteknologian ja viestinnän tiedekunta 100 %
Järjestävä organisaatio
Tietotekniikan opetus 100 %

This course teaches various statistical methods for modeling and analysing text data. Contents are planned to include models for representing text including vector space models and neural embedding models; document content processing stages such as lemmatization and keyphrase extraction; probabilistic models of content variation including n-grams and topic models; and methods for various text analysis tasks. The course is in development and detailed contents will be updated.

Osaamistavoitteet
Esitietovaatimukset
Oppimateriaalit
Kokonaisuudet, joihin opintojakso kuuluu
Suoritustapa 1
Exercise sets and exam must both be completed to pass the course
Kaikkien osuuksien suorittaminen on pakollista.

Tentti

01.12.2023 31.12.2023
Aktiivinen periodissa 2 (23.10.2023–31.12.2023)

Osallistuminen opetukseen

29.08.2023 12.12.2023
Aktiivinen periodissa 1 (1.8.2023–22.10.2023)
Aktiivinen periodissa 2 (23.10.2023–31.12.2023)