Content-based K-dramas recommendation website
Valsony, Satima |
Because of the huge amount of information and diversity of options, modern people are facing a new problem in this century - an overwhelming number of choices. Even while choosing a next movie to watch, which seemed to be an easy question, we frequently feel uncertainty and confusion which can lead to decision fatigue and frustration. Fortunately thanks to the growth of AI tools, nowadays there are various types of movie recommendation engines based on different algorithms and filtering techniques. This bachelor thesis covers the idea of building a content-based Korean drama recommendation system with our own collected dataset and developed by a new approach to model building, and finally with the state-of-the-art Python library for web app development. Korean dramas are becoming more and more popular nowadays, but it's impossible to find any AI-powered recommendation system for this specific genre of television series with a unique structure and features. The dataset of Korean dramas was scrapped from different sources, and after it was cleaned and preprocessed, the data was represented and saved as an indirected graph where each Korean drama is stored as a node in space. Each node in space is connected by an edge with another node representing the relationship between similar Korean dramas. In order to measure the distance between nodes Adamic Adar measure was used. As higher the measure, as closer the two nodes or dramas.
Dėl didžiulio kiekio informacijos ir pasirinkimo įvairovės, šiuolaikiniai žmonės susiduria su nauja problema - dideliu pasirinkimų skaičiumi. Net rinkdamiesi kokį kitą filmą žiūrėti, kas atrodo, neturėtų sukelti daug sunkumų, dažnai jaučiamės sutrikę, kas gali privesti prie nuovargio ar nusivylimo. Laimei, AI įrankių tobulėjimo dėka, dabar yra įvairių tipų kino filmams skirtų rekomendavimo sistemų, pagrįstų skirtingais filtravimo algoritmais. Šios rekomendavimo sistemos yra sukurtos, naudojant kelis žinomus modelius, apmokytus su keliomis atviros prieigos duomenų bazėmis kaip TMDB Movie, Netflix ar Movie, kas jau yra prieinama Kaggle ar kitose platformose. Šiame bakalauriniame darbe kuriama turiniu pagrįsta Korėjos dramų rekomendavimo sistema su mano pačios surinktu duomenų rinkiniu, naudojant naujo tipo modelį, bei pasitelkiant dabartines Python bibliotekas interneto aplikacijai kurti. Šiuo metu Korėjos dramos tampa vis populiaresnės, tačiau nepavyko surasti DI paremtos rekomendavimo sistemos, kuri būtų skirta šiam TV serialų žanrui, turinčiam unikalią struktūrą ir bruožus. Korėjos dramų duomenų rinkinys buvo surinktas iš skirtingų šaltinių. Rinkinys buvo išvalytas, jam atliktas išankstinis apdorojimas. Duomenys buvo atvaizduoti ir išsaugoti neorientuotame grafe, kurio viršūnės yra Korėjos dramos. Grafo lankai parodo ryšius tarp panašių Korėjos dramų. Atstumams tarp viršūnių matuoti Adamic Adar matas. Kuo šio mato reikšmė didesnė, tuo artimesnės viršūnės.