Įvadas į mašininį mokymą
Dalyko anotacija lietuvių kalba
Kursas pristato dažniausiai naudojamus mokymo su instruktoriumi (supervised learning), mokymo pastiprinimu (reinforcement learning) ir klasterizacijos (unsupervised learning) algoritmus. Analizuojamas mašininio mokymo algoritmų efektyvumas ir tinkamumas spręsti realius industrinius atpažinimo uždavinius bei šių algoritmų savybės, kurios leidžia juos laikyti įdomiais intelekto modeliais. Iliustracijai naudojami šnekos ir teksto atpažinimo uždaviniai, kuriems spręsti reikia pritaikyti, adaptuoti ir integruoti skirtingus mašininio mokymo metodus. Laboratorinių darbų metu studentai realizuoja nedidelius programinės įrangos kūrimo projektus, kad įgytų praktinės mašininio mokymo metodų taikymo patirties.
Dalyko anotacija užsienio kalba
This course presents the most popular unsupervised learning, reinforcement learning, and supervised learning concepts and techniques and their possible applications. The algorithms are discussed from two perspectives: as useful data mining tools for solving real-world recognition tasks as well as interesting computational models of intelligence. The real-world tasks from the fields of speech and natural language processing are used to illustrate the ways to fit and to combine many machine learning techniques together. Students will complete small software projects to gain practical experience with the techniques covered in this course.
Būtinas pasirengimas dalyko studijoms
Programavimo pagrindai, Aukštoji matematika 1, Aukštoji matematika 2,
Dalyko studijų rezultatai
1. Paaiškinti pagrindines mašininio mokymo srities sąvokas ir jų tarpusavio sąsajas;
2. Mokėti pritaikyti svarbiausius požymių atrankos metodus;
3. Mokėti taikyti skaitmeninius, loginius, mokymo pastiprinimu, klasterizacijos ir sekų atpažinimo algoritmus neurotechnologinės kilmės duomenų analizei;
4. Išugdyti gebėjimą programiškai realizuoti mašininio mokymo algoritmus aukšto lygio programavimo kalba;
5. Palyginti skirtingų klasifikatorių tikslumą ir įvertinti jų skaičiavimo laiką;
6. Rekomenduoti tinkamiausią mašininio mokymo algoritmą neurotechnologinės kilmės duomenų analizei;
7. Integruoti kelių klasifikatorių sprendimus, siekiant padidinti bendrą atpažinimo sistemos veikimo tikslumą.
Dalyko turinys
1. Indukcija, apibendrinimas, regresija ir klasifikacija, mokymas ir atpažinimas, atpažinimo tikslumo įvertinimas;
2. Kompaktiškumo hipotezė, permokymas (overfitting) ir duomenų retumo (data sparsity) problema, Occam‘o skustuvo principas, Minimalaus aprašymo ilgio (MDL) principas;
3. Požymių atrinkimo svarba ir požymių atrankos metodai;
4. k artimiausių kaimynų (k-NN) metodas;
5. Skaitmeninis ir biologinis neuronas, daugiasluoksnis neuronų tinklas, daugiasluoksnio neuronų tinklo svorių mokymas klaidos atasklidos (error backpropagation) būdu;
6. Bayes’o klasifikatorius, mišinių modeliai, tikimybės tankio įvertinimas;
7. Atraminių vektorių klasifikatorius (SVM)
8. „Skaldyk ir valdyk“ strategija, sprendimo medžių indukcija, logikos taisyklių indukcija, hierarchinis klasifikatorius;
9. Nuoseklaus mokymo problema, versijų erdvės formalizmas;
10. Induktyvus loginis programavimas, FOIL algoritmas;
11. Hierarchinės klastericacijos metodai, centroidinės klasterizacijos metodai, klasterizacija, taikant tikėtinumo maksimizavimo (EM) metodą;
12. Pasyvūs ir aktyvūs mokymo pastiprinimu algoritmai, laiko skirtumų (TD) metodas, ADP metodas, Q-learning, SARSA, eksploracinė vs. eksplotacinė elgsena, mokymo pastiprinimu metodai robotikoje
13. Adaptyvios elgsenos modeliavimas, aplinkos modelis, baigtinių deterministinių automatų (DFA) indukcija
14. Dinaminio programavimo metodas;
15. Markovo modeliai, paslėptieji Markovo modeliai (HMM)
16. Forward-backward, Viterbi ir Baum-Welch algoritmai, jų taikymo iliustracija šnekos atpažinimo sistemose;
17. Klasifikatorių ir klasifikavimo sprendimų apjungimo metodai
Dalyko studijos valandomis
Paskaitos (P) 45 val.
Seminarai (S) 15 val.
Laboratoriniai darbai (L) 15 val.
Savarankiškas darbas 85 val.
Iš viso 160 val.
Studijų rezultatų vertinimas
Tarpinis atsiskaitymas – 17%, laboratoriniai darbai – 33%, baigiamasis egzaminas – 50%.
Literatūra
1. 2011 Witten, I.H., E. Frank. Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.). Elsevier
2. 2006 Theodoridis S., K. Koutroumbas. Pattern Recognition Prentice-Hall
3. 2007 Raškinis, G. Intelektika: Uždaviniai ir jų sprendimo būdai Vytautas Magnus University
4. 2016 Wikipedia: The Free Encyclopedia Wikimedia Foundation,
Papildoma literatūra
1. 2000 Jurafsky, D., J. H. Martin. Speech and Language Processing Prentice-Hall
2. 2010 De la Higuera, C. Grammatical Inference: Learning Automata and Grammars Cambridge University Press
3. 2002 Russel, S., P. Norvig Artificial Intelligence: A Modern Approach (2nd ed.) Prentice-Hall
4. 1998 Sutton, R. S., A. G. Barto. Reinforcement Learning: An Introduction The MIT Press e-knyga pasiekiama internetu http://webdocs.cs.ualberta.ca/~sutton/book/ebook/the-book.html