Naudotų automobilių kainų prognozavimas
Spūdvilaitė, Aida |
Tyrimo problema. Pasaulyje prasidėjus politiniams neramumams, sutriko naujų automobilių bei jų komponentų gamyba. Pardavėjai naudojasi šia situacija ir didina naujų transporto priemonių kainą. Todėl pirkėjams tenka žvalgytis ir į naudotas transporto priemones, o tai leidžia rinkoje augti naudotų automobilių paklausai. Darbo tikslas – taikant mašininio mokymo metodus, sudaryti naudotų automobilių kainų prognozavimo modelius ir įvertinti jų tikslumą. Tyrimo metodai. Darbe analizuotas duomenų rinkinys apie JAV naudotus automobilius, kurį sudarė 57174 stebiniai ir 24 kintamieji. Naudotų transporto priemonių kainų prognozei atlikti taikyti metodai: daugialypė tiesinė regresija, sprendimų medis, atsitiktinis miškas, atraminių vektorių regresija, ekstremalaus gradiento didinimas ir lengvojo gradiento didinimas, k-artimiausi kaimynai ir elastinio tinklo regresija. Gauti rezultatai parodė, kad tiksliausiai naudotų automobilių kainas prognozuoja modelis sudarytas lengvojo gradiento didinimo metodu.
Research problem. The outbreak of political unrest around the world has disrupted the production of new cars and their components. Sellers are taking advantage of this situation by increasing the price of new cars. Therefore, buyers are turning to used cars, which is driving up the demand for used vehicles in the market. Research target using machine learning methods, develop models for predicting used car prices and evaluate their accuracy. Research methods. The dataset on used cars in the U.S., consisting of 57174 observations and 24 variables, was analyzed. The methods used for predicting used vehicle prices included: multiple linear regression, decision tree, random forest, support vector regression, extreme gradient boosting and light gradient boosting, k– nearest neighbors and elastic network regression. The obtained results showed that the most accurate predictions of used car prices were made by the model built using the light gradient boosting method.