Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/130179
Type of publication: master thesis
Field of Science: Informatika / Informatics (N009)
Author(s): Rong, Tianzheng
Title: Sentimentų analizė ir sarkazmo nustatymas iš tekstų taikant mašininio mokymosi metodikas
Other Title: Sentiment Analysis and Sarcasm Detection in Texts Using Machine Learning Approaches
Extent: 49 p.
Date: 27-May-2021
Keywords: sarkazmo aptikimas;Sarcasm Detection;kalbos faktorius;Language Factor;mašininis mokymasis;Machine Learning
Abstract: Ironijos ir sarkazmo nustatymas iš teksto – viena įdomiausių kalbos technologijų temų. Socialinė žiniasklaidos plėtra (ypač socialinių tinklų) skatina sarkazmo naudojimą internete. Sarkazmą tekste aptikti galima tik jį tyrinėjant semantiniu, o ne leksiniu lygiu. Ypač svarbi tampa ir tyrinėjamo teksto kalba, nes skirtingos kalbos pasižymi skirtingomis savybėmis. Sarkazmo nustatymo uždavinys – tai tam tikro tipo teksto klasifikavimo uždavinys, kuriam įprastai taikomi tiek tradiciniai mašininio mokymosi metodai (pvz., paprastasis Bejesas, atraminių vektorių mašina), tiek giliojo mokymosi metodai (ilgos trumpalaikės atminties metodas, konvoliuciniai neuroniniai tinklai), tiek transformaciniai modeliai (BERT). Magistrinio darbo metu atlikti eksperimentiniai tyrimai ir gauti rezultatai parodė kiek stipriai tikslumas yra įtakojamas modelio parametrų bei įvesties kalbos.
Detecting irony and sarcasm in social media represents an interesting topic for NLP researchers. The development of social media drives the use of sarcasm on the Internet. Sarcasm detection is based on the exploration of semantics and context, rather than the lexical level. Moreover, the language of the input texts should also be considered. Different languages have different attributes. Explore can be made from this point to achieve the purpose of improving accuracy. No matter the low-cost traditional machine learning methods (NBM, SVM), or the deep learning methods (LSTM, CNN) which are suit for the complex problems or the transfer learning methods (BERT) based on the pre-training model, each of the methods is worth trying on the sarcasm detection tasks. The results obtained showed the influence on the accuracy of the change on model parameters and input language.
Internet: https://hdl.handle.net/20.500.12259/130179
Affiliation(s): Informatikos fakultetas
Appears in Collections:2021 m. (IF mag.)

Files in This Item:
Tianzheng_Rong_md.pdf516.06 kBAdobe PDF   Restricted AccessView/Open

Show full item record
Export via OAI-PMH Interface in XML Formats
Export to Other Non-XML Formats


CORE Recommender

Page view(s)

13
checked on Jun 6, 2021

Download(s)

3
checked on Jun 6, 2021

Google ScholarTM

Check


This item is licensed under a Creative Commons License Creative Commons