õppeaine eesmärgid eesti k
Õppeaine eesmärk on:
- selgitada, kuidas suhestuvad omavahel statistika, ökonomeetria, masinõpe ja majandusteadus;
- süvendada ja laiendada teadmisi erinevate masinõppe seisukohast oluliste statistiliste meetodite kohta, nende eelduste ja piirangute kohta;
- anda oskus kasutada R keelt andmete ettevalmistamiseks, kirjeldamiseks, visualiseerimiseks ning statistiliste meetodite rakendamiseks.
õppeaine eesmärgid inglise k
The aim of this course is to:
- explain how statistics, econometrics, machine learning and economics are related;
- deepen and broaden knowledge about various statistical methods relevant for machine learning, their assumptions and limitations;
- show how R can be used for data preparation, description, visualisation, and the application of statistical methods.
õppeaine õpiväljundid eesti k.
Õppeaine läbinud üliõpilane:
- suhestab statistika, ökonomeetria, masinõppe ja majandusteaduse olemust, meetodeid ning eesmärke;
- eristab laia valikut statistilisi meetodeid ning nende rakendusvõimalusi;
- hindab kriitiliselt erinevate statistiliste meetodite kasutamise eelduseid ja piiranguid;
- oskab iseseisvalt välja pakkuda uurimisprobleemi (eelistatult majandusteadusliku), mida mõne õpitud statistilise meetodi abil uurida;
- tõlgendab uurimistulemusi pädevalt;
- kasutab oskuslikult R keelt andmete analüüsimiseks.
õppeaine õpiväljundid ingl k.
After completing this course, the student:
- analyses the interrelations between statistics, econometrics, machine learning and economics;
- differentiates between a wide variety of statistical methods and their possible applications;
- critically assesses the assumptions and limitations that come with different statistical methods;
- can independently propose a research problem (preferably economics-related), that could be investigated using the methods covered in the course;
- adeptly interprets the research results;
- skilfully uses the R language for data analysis.
õppeaine sisu lühikirjeldus eesti k
Kursuse alguses arutletakse, kuidas suhestuvad omavahel statistika, ökonomeetria, masinõpe ja andmeteadus ning kuhu paigutub see kursus tudengi seniste ja tulevaste majandusõpingute kontekstis. Siis tehakse pikem kõrvalepõige programmeerimiskeelde R, kus antakse tudengitele oskus R keelt ja RStudio keskkonda kasutades andmeid analüüsimiseks ette valmistada, kirjeldada ning visualiseerida. Seejärel vaadeldakse erinevaid statistilisi / masinõppe meetodeid ja tehnikaid: lineaarne regressioon, logistiline regressioon, diskriminantanalüüs, lineaarse mudeli valik ja seaduspärasuse algoritmid, peakomponentide analüüs, klasteranalüüs, otsustuspuul põhinevad meetodid. Näidatakse, kuidas neid meetodeid R-is rakendada ning kuidas analüüsitulemusi tõlgendada. Kõigi meetodite puhul arutletakse, millised on nende kasutamise eeldused ja piirangud. Lineaarset regressiooni käsitlevas osas tuletatakse lühidalt meelde ka statistika põhitõed. Kursus lõpeb rühmaprojektiga, kus tudengid püstitavad iseseisvalt uurimisprobleemi, eelistatult majandusteemalise, ning rakendavad selle lahendamiseks õpitud meetodeid.
õppeaine sisu lühikirjeldus ingl k
The course starts with a discussion on how statistics, econometrics, machine learning and data science are interrelated and how this course relates to the student's prior and subsequent studies of economics. Then follows a longer detour to the R programming language, where the student learns how to use the R language and the RStudio environment for data preparation, description, and visualisation. Subsequently, different statistical / machine learning methods and techniques are considered, namely linear regression, logistic regression, discriminant analysis, linear model selection and regularisation algorithms, principal components analysis, cluster analysis, and tree-based methods. It is shown how these methods can be applied in R and how the analysis results could be interpreted. The assumptions and limitations of different methods are discussed. In the part concerning linear regression, basic concepts in statistics are briefly revised. The course ends with a group project, where students independently propose a research problem, preferably in economics, and apply methods covered in this course to address it.
iseseisev töö eesti k
Õpiku ja teiste õppematerjalidega tutvumine, kodutööde lahendamine.
iseseisev töö ingl k
Reading the textbook and other study materials, solving home assignments.
õppekirjandus
James, G., Witten, D., Hastie, T. & Tibshirani, R. (2021). An Introduction to Statistical Learning with Applications in R. Second Edition. Springer.
õppevormid ja mahud
päevaõpe: nädalatunnid
4.0
sessioonõppe töömahud (semestris):
vastutav õppejõud
Heili Hein-Sula, lektor (ME - majandusanalüüsi ja rahanduse instituut)