Mašininis mokymas
Dalyko anotacija lietuvių kalba
Kurso tikslas - pristatyti didelę mašininio mokymo srities algoritmų įvairovę ir jų taikymo galimybes. Kurso metu pristatomi dažniausiai naudojami mokymo su instruktoriumi (supervised learning), mokymo pastiprinimu (reinforcement learning) ir klasterizacijos (unsupervised learning) sąvokos ir metodai. Mašininio mokymo algoritmai analizuojami iš dviejų perspektyvų: koks jų efektyvumas ir tinkamumas spręsti realius industrinius atpažinimo uždavinius ir kokios šių algoritmų savybės leidžia juos laikyti įdomiais intelekto modeliais. Iliustracijai naudojami šnekos atpažinimo ir teksto atpažinimo sričių uždaviniai, kuriems spręsti reikia pritaikyti, adaptuoti ir integruoti skirtingus mašininio mokymo metodus. Laboratorinių darbų metu studentai realizuoja nedidelius programinės įrangos kūrimo projektus, kad įgytų praktinės mašininio mokymo metodų taikymo patirties.
Dalyko anotacija užsienio kalba
The goal of this course is to introduce students to the broad landscape of existing machine learning techniques and their possible applications. This course presents the most popular unsupervised learning, reinforcement learning, and supervised learning concepts and techniques. The algorithms are discussed from two perspectives: as useful data mining tools for solving real-world recognition tasks as well as interesting computational models of intelligence. The real-world tasks from the fields of speech and natural language processing are used to illustrate the ways to fit and to combine many machine learning techniques together. Students will complete small software projects to gain practical experience with the techniques covered in this course.
Būtinas pasirengimas dalyko studijoms
Studentas turi būti išklausęs [bakalauro programos] kursus „Programavimo pagrindai“, „Matematika 1, 2“ „Tikimybių teorija ir matematinė statistika“.
Dalyko studijų rezultatai
Detalus tiesioginio mokymo, mokymo pastiprinimu ir klasterizacijos mašininio mokymo metodų supratimas.
Detalus supratimas, kaip apjungti skirtingų klasifikatorių rezultatus, kad padidinti bendrą sistemos veikimo efektyvumą.
Sugebėjimas įvertinti ir palyginti skirtingo tipo klasifikatorių tikslumą, sprendžiant įvairias praktines užduotis.
Sugebėjimas įvertinti mašininio mokymo metodų skaičiavimo laiko ir atminties resursų sąnaudas įvairiems praktiniams uždaviniams.
Sugebėjimas efektyviai realizuoti pasirinktus mašininio mokymo metodus aukšto lygio programavimo kalba.
Sugebėjimas pasirinkti tinkamiausius mašininio mokymo metodus įvairaus pobūdžio duomenims analizuoti, atsižvelgiant į duomenų charakteristikas.
Sugebėjimas naudoti požymių atrinkimo metodus įvairaus pobūdžio duomenims.
Įgūdžiai naudotis populiariausiais atviro kodo duomenų analizės programiniais paketais ir interpretuoti jais gaunamus rezultatus.
Dalyko turinys
1. Pagrindinės mašininio mokymo sąvokos: Indukcija, regresija, klasifikacija, mokymo imtis, kryžminis patikrinimas, požymiai, požymiu atrinkimas, permokymas (overfitting), minimalaus aprašymo ilgio principas;
2. Skaitmeniniai deterministiniai mašininio mokymo metodai: artimiausio kaimyno metodas, tiesin4 regresija, dirbtinis neuronas, daugiasluoksnis neuronų tinklas, klaidos atasklidos mokymo algoritmas, atraminių vektorių klasifikatoriai;
3. Skaitmeniniai tikimybiniai mašininio mokymo metodai: Bayes’o klasifikatorius, tikimybės tankio mišinių modeliai, tikimybės tankio įvertinimas;
4. Loginiai mašininio mokymo metodai, sprendimo medžių ir taisyklių indukcija;
5. Nuoseklaus mokymo problema, versijų erdvės formalizmas;
6. Induktyvus loginis programavimas;
7. Klasterizacijos algoritmai: hierarchinė klasterizacija, k-vidurkių klasterizacija, EM klasterizacija;
8. Keleto klasifikatorių apjungimo metodai: Bagging, Boosting, Stacking ir AdaBoost algoritmai;
9. Mažininio mokymo metodai signalų atpažinimui: dinaminio programavimo metodas, Markovo modeliai, paslėptieji Markovo modeliai (HMM), Viterbi algoritmas;
10. Mašininio mokymo metodai teksto apdorojimui: statistinis kalbos modeliavimas, tekstų kategorizavimas;
11. Mokymo pastiprinimu mašininio mokymo metodai: Q-mokymo metodas, laiko skirtumų (TD) metodas, ADP metodas, adaptyvios elgsenos modeliavimas, mokymo pastiprinimu metodų taikymas robotikoje.
Dalyko studijos valandomis
Paskaitos (P) 45 val.
Laboratoriniai darbai (L) 15 val.
Savarankiškas darbas 100 val.
Iš viso 160 val.
Studijų rezultatų vertinimas
Kolokviumas – 17%, laboratoriniai darbai –33%, baigiamasis egzaminas – 50% galutinio pažymio.
Literatūra
1. 2011 Witten, I.H., E. Frank. Data Mining: Practical Machine Learning Tools and Techniques (3rd ed.). Elsevier neribotas kiekis, pasiekiamas internetu per ScienceDirect
2. 2006 Theodoridis S., K. Koutroumbas. Pattern Recognition Prentice-Hall neribotas kiekis, pasiekiamas internetu per ScienceDirect
3. 2007 Raškinis, G. Intelektika: Uždaviniai ir jų sprendimo būdai Vytauto Didžiojo universitetas neribotas kiekis, pasiekiamas internetu VDU Moodle studijų aplinkoje
4. Present Wikipedia: The Free Encyclopedia Wikimedia Foundation, neribotas kiekis, pasiekiamas internetu
Papildoma literatūra
1. 2000 Jurafsky, D., J. H. Martin. Speech and Language Processing Prentice-Hall
2. 2010 De la Higuera, C. Grammatical Inference: Learning Automata and Grammars Cambridge University Press
3. 2002 Russel, S., P. Norvig Artificial Intelligence: A Modern Approach (2nd ed.) Prentice-Hall
1998 Sutton, R. S., A. G. Barto. Reinforcement Learning: An Introduction The MIT Press. neribotas kiekis, el. knyga pasiekiama internetu http://webdocs.cs.ualberta.ca/~sutton/book/ebook/the-book.html