Machine learning approaches for football match outcome prediction
Chaplanov, Denys |
Šiame magistriniame darbe aptariama prognozavimo modeliavimo konkurencinėje aplinkoje problema naudojant mašininio mokymosi algoritmus ir giliąją duomenų analizę, daugiausia dėmesio skiriant prognozavimo tikslumo didinimui. Pagrindinis šio darbo tikslas - ne įdiegti iš esmės naują metodiką, o pagerinti prognozavimo tikslumą, palyginti su ankstesniais tyrimais. Kitaip nei ankstesniuose tyrimuose, kuriuose paprastai būdavo pasiekiamas 60-70 % tikslumas, šiame darbe integruojami mašininio mokymosi algoritmai kartu su kruopščia požymių inžinerija ir išankstiniu duomenų apdorojimu, siekiant pranokti ankstesnius lyginamuosius rodiklius ir pasiekti aukštesnius testų tikslumo rezultatus. Tyrimo metodika - pirmiausia ištirti naujausias tokių problemų sprendimo tendencijas, pagrįstas kai kuriais tradiciniais statistiniais metodais, o vėliau pateikti pažangesnius metodus ir algoritmus, kurie atlieka lemiamą vaidmenį gerinant prognozavimo rezultatus. Daugiausia dėmesio skiriama pirminio duomenų rinkinio daliai, požymių inžinerijai ir atitinkamiems vertinimo metodams, kurie laikomi labiausiai galinčiais užtikrinti geriausius prognozavimo rezultatus. Gauti rezultatai turi praktinę vertę, nes padeda treneriams strategiškai planuoti, analitikams tiksliau interpretuoti komandų elgseną, o lažybų tarpininkams - atlikti labiau pagrįstas prognozes.
This thesis discusses the problem of predictive modeling in competitive environments through the use of machine learning algorithms and deep data analysis, focusing on improving prediction accuracy. The primary goal of this work is not to introduce a fundamentally new methodology, but to improve prediction accuracy compared to previous research. Unlike previous studies, which typically achieved accuracies between 60% and 70%, this work integrates machine learning algorithms alongside careful feature engineering and data preprocessing to surpass prior benchmarks and achieve higher test accuracy results. The methodology of the study is first to investigate the latest trend in dealing with such problems based on some traditional statistical approaches and then to present more advanced methods and algorithms, which play a crucial role in the improvement of predictive performance. The portion of the primary dataset, the feature engineering, and respective evaluation methods that are regarded as the most capable of producing the best predictions are focused on. The results have practical value, offering support for coaches in strategic planning, helping analysts interpret team behaviors more accurately, and enabling bettors to make more informed predictions.