Andmekaeve suurandmetest (IDN1605)
PÕHIANDMED
õppeaine register
A - põhiregister
õppeaine kood
IDN1605
õppeaine nimetus eesti k
Andmekaeve suurandmetest
õppeaine nimetus inglise k
Mining Big Data
õppeaine maht AP
-
õppeaine maht EAP
6.00
deklareeritav
jah
kontrollivorm
eksam
õpetamise semester
kevad
õppekeel
eesti keel
inglise keel
Eeldusaine(d)
Eeldusaine 1
Sissejuhatus programmeerimisse Pythoni baasil (YFX0500)
Aine on eelduseks
Toitumisteaduste erikursus (LKT9040)
Õppekavad, millesse aine kuulub
kavaversiooni kood
aine kohustuslik
IABM02/25
ei
KATM02/18
ei
KATM02/25
ei
LAAB17/25
ei
TAAM02/25
ei
YAFB02/25
jah
kuva rohkem
Ainet õpetavad struktuuriüksused
EV - Virumaa Kolledž
IT - tarkvarateaduse instituut
Ainekaardi link
Tunniplaani link
Vaata tunniplaani
Versioon:
VERSIOONIPÕHISED ANDMED
õppeaine eesmärgid eesti k
Õppeaine eesmärgiks on õpetada andmekaeve problemaatikat ja efektiivseid viise suurandmete analüüsiks.
õppeaine eesmärgid inglise k
To teach students about data mining and effective techniques for analyzing big data.
õppeaine õpiväljundid eesti k.
Kursuse lõpetanu:
Oskab määratleda ja sõnastada andmekaeve probleeme.
Tunneb klassifikatsiooni, regressioonianalüüsi, klasterdamise ja dimensionaalsuse vähendamise meetodeid.
Oskab valida probleemi jaoks sobiva meetodi.
Oskab hinnata andmekaeve mudeli (tulemi) kvaliteeti.
Oskab teisendada andmeid analüüsiks sobivale kujule.
Oskab kasutada andmekaeve tarkvara.
Tunneb erinevaid andmekaeve näiteprobleeme äri- ja füüsiliste süsteemide vallast.
Tunneb suurte andmemahtude haldamise problemaatikat ja tarkvara.
õppeaine õpiväljundid ingl k.
After completing the course, student:
Can define data mining problems.
Knows the methods of classification, regression, clustering and dimensionality reduction.
Can choose appropriate method for a problem.
Can evaluate the quality of the model.
Can transform data into the form appropriate for data mining.
Can use data mining software.
Is familiar with example problems from the fields of business- and physical systems.
Is familiar with the problems and tools for analyzing big data.
õppeaine sisu lühikirjeldus eesti k
Klassifitseerivad mudelid, mis ennustavad objekti klassi. Regressiooni mudelid, mis ennustavad pidevat väärtust. Sarnaste objektide klasterdamine. Dimensionaalsuse vähendamine andmetes. Mudelite valimine ja hindamine. Andmete eeltöötlus. Näiteprobleemid äri- ja füüsiliste süsteemide vallast. Suurte andmemahtude haldamine. Teadusliku Pythoni (SciPy stack) kasutamine andmekaeves.
õppeaine sisu lühikirjeldus ingl k
Classification models predicting the class of an object. Regression models for predicting a continuous-valued variable. Clustering similar objects. Dimensionality reduction for multi-variate data. Choosing and evaluating models. Data pre-processing. Example problems from the fields of business- and physical systems. Managing big data. Using Scientific Python stack for data mining.
hindamisviis eesti k
Hinne pannakse semestri töö (50%) ja iseseisva andmekaeve projekti (50%) alusel.
hindamisviis ingl k
Points for the final grade come from semesters work (50%) and independent data mining project (50%).
iseseisev töö eesti k
Iseseisev töö hõlmab omavalitud andmestiku analüüsi. Tulemused tuleb esitada IPythoni märkmikuna (notebook).
iseseisev töö ingl k
Independent project is a data mining project for a data chosen by the student. Results are presented as IPython notebook.
õppekirjandus
Aine koduleht: https://moodle.taltech.ee/course/view.php?id=30058

Raschka, Sebastian. Python machine learning. Birmingham, UK: Packt Publishing, 2015.

Hauck, T. Scikit-learn Cookbook. Birmingham, U.K.: Packt Publishing, 2014.

Witten, Ian H.; Frank, Eibe; Hall, Mark A. Data Mining: Practical Machine Learning Tools and Techniques (3 ed.). Elsevier, 2011.
õppevormid ja mahud
päevaõpe: nädalatunnid
4.0
sessioonõppe töömahud (semestris):
loenguid
2.0
loenguid
-
praktikume
2.0
praktikume
-
harjutusi
0.0
harjutusi
-
vastutav õppejõud
-
ÕPPEJÕU AINEKAVA INFO
õppetöö semester
õpetav õppejõud / üksus
õppetöö keel
Laiendatud ainekava või link Moodle või kodulehele
2024/2025 kevad
Ants Torim, IT - tarkvarateaduse instituut
eesti keel
    hindamiskriteeriumid_IDN1605.pdf 
    Avar Pentel, EV - Virumaa Kolledž
    eesti keel
      hindamiskriteeriumid_IDN1605.pdf 
      kuva rohkem
      2023/2024 kevad
      Ants Torim, IT - tarkvarateaduse instituut
      eesti keel
        hindamiskriteeriumid_est.pdf 
        2022/2023 kevad
        Ants Torim, IT - tarkvarateaduse instituut
        eesti keel
          Avar Pentel, EV - Virumaa Kolledž
          eesti keel
            2021/2022 kevad
            Avar Pentel, EV - Virumaa Kolledž
            eesti keel
              hindamiskriteeriumid_IDN1605.pdf 
              Ants Torim, IT - tarkvarateaduse instituut
              eesti keel
                hindamiskriteeriumid_IDN1605.pdf 
                2020/2021 kevad
                Avar Pentel, EV - Virumaa Kolledž
                eesti keel
                  hindamiskriteeriumid_IDN1605.pdf 
                  Ants Torim, IT - tarkvarateaduse instituut
                  eesti keel
                    hindamiskriteeriumid_IDN1605.pdf 
                    Ainekaart eesti keeles
                    Ainekaart inglise keeles