Andmekaeve ja suurandmete rakendused (EVM0520)
PÕHIANDMED
õppeaine register
A - põhiregister
õppeaine kood
EVM0520
õppeaine nimetus eesti k
Andmekaeve ja suurandmete rakendused
õppeaine nimetus inglise k
Data Mining and Big Data Applications
õppeaine maht AP
-
õppeaine maht EAP
6.00
deklareeritav
jah
õppeaine täies mahus läbitav e-õppes
ei
kontrollivorm
hindeline arvestus
õpetamise semester
sügis-kevad
õppekeel
eesti keel
inglise keel
Õppekavad, millesse aine kuulub
kavaversiooni kood
aine kohustuslik
RATM24/25
ei
Ainet õpetavad struktuuriüksused
EV - Virumaa Kolledž
Ainekaardi link
Tunniplaani link
Vaata tunniplaani
Versioon:
VERSIOONIPÕHISED ANDMED
õppeaine eesmärgid eesti k
Õppeaine eesmärk on:
- luua eeldused tööks suurte andmehulkadega;
- anda ülevaade kesksete masinõppe algoritmide tööpõhimõtetest;
- valmistada ette masinõppe mudelite rakendamiseks reaalses tööstuses;
õppeaine eesmärgid inglise k
The aim of this course is to:
- create prerequisites for working with big data;
- provide an overview of the working principles of central machine learning algorithms;
- prepare for the implementation of machine learning models in real Industry.
õppeaine õpiväljundid eesti k.
Õppeaine läbinud üliõpilane:
- lahendab tööstuse kompleksseid probleeme masinõppe ja andmekaeve meetoditega ning demonstreerib erinevate faktorite mõju pakutud lahendusele;
- rakendab tööstuse ja muid andmeid uudse ressursina, mille abil optimeerida tootmisprotsesse või ressursside juhtimist;
- hindab enda ja teiste arenguvajadusi tööstusandmete kasutamisel ning toetab teiste õppimist õpetades, juhendades ja/või muul viisil.
õppeaine õpiväljundid ingl k.
After completing this course the student:
- solves complex industrial problems using machine learning and data mining methods and demonstrates the impact of various factors on the proposed solution;
- applies industrial and other data as a novel resource to optimize production processes or resource management;
- assesses own and others' development needs in the use of industrial data and supports the learning of others by teaching, mentoring and/or otherwise.
õppeaine sisu lühikirjeldus eesti k
Kursus keskendub erinevate masinõppe ja andmekaeve algoritmide teoreetilisele tutvustusele ning praktilisele rakendamisele.
Käsitletakse:
- CRISP-DM: CRoss Industry Standard Process for Data Mining
- ennustamist ajaseeriate abil, ajaseeriate andmete ettevalmistamisest kuni mudelite genereerimiseni ja testimiseni;
- pildilise informatsiooni ettevalmistamist masinõppeks ja ennustamiseks, sealhulgas materjalide tuvastamisel levinud pildi filtrite kasutamist kui ka objektide tuvastamist;
- soovituste süsteemide loomist ja kasutaja profileerimise tehnikaid;
- suurte keelemudelite tööpõhimõtet ja sõnavektorite treenimist;
- erinevate masinõppe algoritmide optimeerimise viise;
- ansambelõpet;
- levinud probleeme andmete ettevalmistamisel ja ennustustulemuste tõlgendamisel.
õppeaine sisu lühikirjeldus ingl k
The course focuses on the theoretical introduction and practical application of various machine learning and data mining algorithms.
It covers:
- CRISP-DM: CRoss Industry Standard Process for Data Mining
- forecasting using time series, from preparing time series data to generating and testing models;
- preparing image information for machine learning and forecasting, including the use of common image filters for material recognition as well as object recognition;
- creating recommendation systems and user profiling techniques;
- the working principle of large language models and training word vectors;
- ways of optimizing various machine learning algorithms;
- ensemble learning;
- common problems in data preparation and interpreting forecast results.
hindamisviis eesti k
Kursusel tehakse praktilised harjutused peamiste teemade kohta, mis annavad kokku kuni 50% lõpphindest ning lõpuprojekt (kuni 50%) ühel vabalt valitud teemal, mis sisaldab enda valitud või kogutud andmete eeltöötlust, treenimist, valideerimist ja rakendust ning selle protsessi raportit teadusartikli formaadis ning ettekannet viimasel kohtumisel toimuval lõpuseminaris.
hindamisviis ingl k
The course includes practical exercises on the main topics, which together account for up to 50% of the final grade, and a final project (up to 50%) on a freely chosen topic, which includes preprocessing, training, validation and application of self-selected or collected data, a report of this process in the format of a scientific article, and a presentation at the final seminar held at the last meeting.
iseseisev töö eesti k
-
iseseisev töö ingl k
-
õppekirjandus
Raschka, Sebastian. Python machine learning. Birmingham, UK: Packt Publishing, 2015.
Hauck, T. Scikit-learn Cookbook. Birmingham, U.K.: Packt Publishing, 2014.
Witten, Ian H.; Frank, Eibe; Hall, Mark A. Data Mining: Practical Machine Learning Tools and Techniques (3 ed.). Elsevier, 2011.
Lisamaterjal avaldatakse kursuse jooksul Moodle vahendusel.
õppevormid ja mahud
päevaõpe: nädalatunnid
4.0
sessioonõppe töömahud (semestris):
loenguid
2.0
loenguid
16.0
praktikume
2.0
praktikume
16.0
harjutusi
0.0
harjutusi
0.0
vastutav õppejõud
-
ÕPPEJÕU AINEKAVA INFO
õppetöö semester
õpetav õppejõud / üksus
õppetöö keel
Laiendatud ainekava
2025/2026 sügis
Avar Pentel, EV - Virumaa Kolledž
eesti keel
    Ainekaart eesti keeles
    Ainekaart inglise keeles