Strategies of selecting the basic vector set in the relative MDS
Author | Affiliation | |||
---|---|---|---|---|
olitab@ktl.mii.lt, | LT | Matematikos ir informatikos institutas | LT | |
LT | Matematikos ir informatikos institutas | LT | ||
LT | Matematikos ir informatikos institutas | LT | ||
Marcinkevičius, Virginijus |
Date | Volume | Issue |
---|---|---|
2006 | 12 | 4 |
URI | Access Rights |
---|---|
https://doi.org/10.3846/13928619.2006.9637755 | Viso teksto dokumentas (atviroji prieiga) / Full Text Document (Open Access) |
https://hdl.handle.net/20.500.12259/95004 |
Nagrinėjamas daugiamačių skalių metodas (MDS), pritaikytas didelių duomenų aibių analizei. Bendra algoritmo schema išskiriama į tris etapus: suformuojama bazinių vektorių aibė, paskui, naudojant klasikinį MDS algoritmą, baziniai vektoriai projektuojami į plokštumą, likusi duomenų aibė vizualizuojama, naudojant santykinį MDS algoritmą. Originaliame algoritme bazinių vektorių aibė formuojama, atsižvelgiant į k vidurkių klasterizavimo rezultatus. Šiame straipsnyje pasiūlytos dvi naujos bazinių vektorių parinkimo strategijos: vienoje taip pat atsižvelgiama į k vidurkių klasterizavimo rezultatus, tačiau kitu būdu, kitoje baziniais vektoriais parenkami duomenų aibės taškai. Eksperimentiniai tyrimai parodė, kad pasiūlytų strategijų naudojimas pagerina vizualizavimo kokybę, sutaupo skaičiavimo laiką.
In this paper, a method of large multidimensional data visualization that associates the multidimensional scaling (MDS) with clustering is modified and investigated. In the original algorithm, the visualization process is divided into three steps: the basis vector set is constructed using the k-means clustering method; this set is projected onto the plane using the MDS algorithm; the remaining data set is visualized using the relative MDS algorithm. We propose a modification which differs from the original algorithm in the strategy of selecting the basis vectors. In our modification, the set of basis vectors consists of vectors that are selected from k clusters in a new way. The experimental investigation showed that the modification exceeds the original algorithm in visualization quality and computational expenses.