Please use this identifier to cite or link to this item:https://hdl.handle.net/20.500.12259/36302
Type of publication: Magistro darbas / Master thesis
Field of Science: Informatika / Informatics
Author(s): Gadirov, Huseyn
Title: Capsule architecture as a discriminator in generative adversarial networks
Other Title: Kapsulinė architektūra kaip diskriminatorius į "generative adversarial networks"
Extent: 32 p.
Date: 22-May-2018
Event: Vytauto Didžiojo universitetas. Informatikos fakultetas. Taikomosios informatikos katedra
Keywords: Deep learning;Computer vision;Image generation;Generative adversarial networks;Machine Learning
Abstract: Modernūs konvoliuciniai tinklai puikiai veikia aptinkant objektus scenose (vaizdo įrašuose ar nuotraukose), tačiau sunkiai veikia identifikuojant objekto poziciją šiam esant šalia kito objekto. Tai parodo tam tikrus šios sistemos limitus, tokius kaip erdvinių ryšių praradimas tarp jo ypatybių. Naujausias sprendimas šiai problemai yra "Capsules" - loginis vienetas, reprezentuojantis objekto būseną taip pat kaip ir sąryšį tarp objekto ir jo pozos. Tuo tarpu šis darbas sutelkia dėmesį ties "Capsule" architektūros prijungimu į gamybinį priešingojo tinklo diskriminatorių, o ne į konvencinės konvoliucijos, kuri veda į didesnį klasifikacijos praradimą ir spartesnę konvergenciją. Mes aprašome architektūrą, pagrindinius skirtumus iš originalaus darbo apie "Capsules", bei palyginame rezultatus kokybės ir kiekybės atžvilgiais. Galiausiai, siūlome galimus patobulinimus ir mintis idėjoms, kurias verta ištirti.
Modern convolutional networks are good at detecting objects in the scene but have a hard time identifying the position of one object relative to another. This exposes certain limitations to the model such as losing the spatial relationships between features. A recent solution to that problem is relying on “Capsules” - a logistic unit that represents the presence of the object as well as the relationship between that entity and the pose. Meanwhile, this paper focuses on incorporating the Capsule architecture into the Discriminator of the Generative Adversarial Networks instead of the conventional convolutions, which is able to lead to a better classification loss and faster convergence. We describe the architecture, main differences from the original paper on Capsules and evaluate the results both qualitatively and quantitatively. Finally, we suggest possible improvements and thoughts on ideas worth investigating.
Internet: https://hdl.handle.net/20.500.12259/36302
Appears in Collections:2018 m. (IF mag.)

Files in This Item:
Show full item record

Page view(s)

64
checked on Oct 13, 2019

Download(s)

64
checked on Oct 13, 2019

Google ScholarTM

Check


Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.