Analyzing and identifying Russian disinformation in Lithuania using graph kernels
Atliekant socialinių medijų bei tradicinės žiniasklaidos stebėseną dažnai tenka susidurti su dideliu nestruktūrizuotų duomenų kiekiu. Tokiais atvejais dažnai praverčia metodai, leidžiantys išskirti tik svarbiausias informacijos dalis, taip sumažinant jos kiekį ir pateikiant tvarkingomis duomenų struktūromis. Šio tyrimo metu buvo išbandytas tokio tipo metodas, paremtas žinių grafu (angl. knowledge graphs). Naudojantis žinių grafais, kurie buvo sudaryti išskyrus SVO (angl. Subject-Verb-Object) tripletus, buvo tiriamos dezinformacijos apraiškos žinių bei susirašinėjimo platformoje Telegram. Dezinformacijos buvo ieškoma apskaičiuojant skirtingus grafų branduolius tarp žinių grafų, sudarytų iš surinktų Telegram žinučių ir grafų, sudarytų iš jau patvirtintų dezinformacijos atvejų, publikuotų EUvsDisinfo duomenų bazėje. Šis metodas buvo pritaikytas analizuojant daugiau nei 1 milijoną žinučių iš 30 ekspertiniu būdu atrinktų rusiškų ir baltarusiškų Telegram kanalų, kuriuos, kaip parodė pirminė analizė, seka ir Lietuvos piliečiai bei kuriuose neretai pasitaiko dezinformacijos apraiškų. Dezinformacijos atvejai buvo specifiškai atrinkti tik tie, kuriuose dezinformacija buvo susijusi su vykstančiu Rusijos bei Ukrainos karu. Analizės rezultatai parodė, kad visuose analizuojamuose kanaluose pasirodė tam tikras kiekis dezinformacijos, tačiau dauguma kanalų ypač akcentavo dezinformacija, susijusią su biologiniais ir branduoliniais ginklais bei okupuotų teritorijų gyventojų pažiūromis. Analizuojant metodus pasirodė, kad geriausias grafų branduolio sudarymo būdas dezinformacijos aptikimui buvo trumpiausio kelio branduolys. Šis metodas, kitaip, nei kiti, iš didelio grafų kiekio leido išskirti būtent labiausiai dezinformacija pasižyminčius grafus, kurių aptikimas ir buvo svarbiausias šio tyrimo uždavinys.
Monitoring social and traditional media means handling vast amounts of unstructured data. In such scenarios, techniques that extract only key information, reducing volume and organizing it into structured data, are often beneficial. This study examined a similar approach using knowledge graphs. It explored disinformation occurrences on the messaging app Telegram through knowledge graphs formed from extracted Subject-Verb-Object (SVO) triplets. Disinformation was identified by computing Graph Kernels between knowledge graphs from Telegram conversations and graphs based on verified disinformation cases from the EUvsDisinfo database. This method assessed over 1 million messages from 27 Russian and Belarusian Telegram channels. According to Lithuanian security agencies, these channels are popular among certain Lithuanian groups and often contain disinformation, primarily targeting the Russo-Ukrainian War. The results showed that disinformation was present in all channels, with a specific focus on biological and nuclear weapons and the political views of residents in occupied territories. The study found that the Shortest Path Graph Kernel was the most effective for detecting disinformation, uniquely identifying graphs with significant disinformation and disregarding those with minimal disinformation.