Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/36417
Type of publication: Magistro darbas / Master thesis
Field of Science: Informatika / Informatics
Author(s): Veržukauskas, Laurynas
Title: Dainų tekstų anglų kalba analizė ir klasifikavimas
Other Title: Analysis and classification of song lyrics in English
Extent: 51 p.
Date: 22-May-2018
Event: Vytauto Didžiojo universitetas. Informatikos fakultetas. Taikomosios informatikos katedra
Keywords: Autorystės nustatymas;Authorship attribution;Stylometry
Abstract: Darbo tikslas – atlikti dainų tekstų autorystės nustatymo tyrimus panaudojant įvairius mašininio mokymo algoritmus. Darbe apžvelgti natūralios kalbos apdorojimo metodai, mašininio mokymo metodai ir tyrimų planas. Siekiant tyrimams atlikti greitai buvo sukurta tyrimų vykdymo platforma (naudojantis Apache Spark ir Deep Learning for Java). Tyrimai su pasirinktais duomenų rinkiniais ir mašininio mokymo algoritmais buvo atliekami perrenkant algoritmų paramterus. Darbo metu nustatyta, kad mažesnį klasių kiekį geriau klasifikuoja atraminių vektorių klasifikatorius, o dirbant su 30 klasių – k artimiausių kaimynų klasifikatorius.
Aim of this work - perform research on lyrics authorship attribution problem using machine learning methods. In order to aid in running experiments rapidly an experimentation platform has been developed (using Apache Spark and Deep Learning for Java). An author has analyzed methods natural language processing and machine learning algorithms. Experiments have been performed with datasets and machine learning algorithms by running grid search. Author has found that Support Vector Machine classifier works best with small number of classes, while with large number of classes - k Nearest Neighbors outperforms the rest.
Internet: https://hdl.handle.net/20.500.12259/36417
Appears in Collections:2018 m. (IF mag.)

Files in This Item:
laurynas_verzukauskas_md.pdf1.64 MBAdobe PDF   Restricted AccessView/Open   Request a copy

Show full item record

Page view(s)

54
checked on Oct 13, 2019

Download(s)

8
checked on Oct 13, 2019

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.