Algorytm redukcji wymiaru i liczności próby dla celów procedur eksploracyjnej analizy danych - Cracow University of Technology Library

PL UA

Main content

Algorytm redukcji wymiaru i liczności próby dla celów procedur eksploracyjnej analizy danych

updating

Type: unpublished work

Title variant
English
Algorithm of Data Dimensionality and Sample Length Reduction for Exploratory Data Analysis Procedures
Author
Work Completion Date
2010
Publication genre
experimental research
Polish Subject Classification
Author keywords
Redukcja wymiaru
Redukcja liczności próby
Transformacja liniowa
Statystyczne estymatory jądrowe
Analiza skupień (klasteryzacja)
Klasyfikacja
Elementy nietypowe
Przetwarzanie równoległe
Dimensionality reduction
Sample length reduction
Linear transformation
Abstract
Przedmiotem niniejszej pracy jest zagadnienie redukcji wymiaru i liczności próby losowej z przeznaczeniem do procedur eksploracyjnej analizy danych, określonych przy użyciu metodyki statystycznych estymatorów jądrowych. Koncepcja opracowanego algorytmu opiera się na liniowej transformacji zbioru danych do przestrzeni o mniejszym wymiarze, z możliwie dokładnym zachowaniem odległości pomiędzy poszczególnymi elementami próby. Współczynniki macierzy transformacji wyznaczane są z zastosowaniem inspirowanej mechanizmami fizycznymi metaheurystyki równoległego symulowanego wyżarzania, ze statystycznym kryterium zakończenia pracy algorytmu. Ponadto stosuje się eliminację lub redukcję znaczenia tych elementów próby, których położenie względem pozostałych uległo w wyniku transformacji istotnej zmianie. Przedstawiona metoda została pozytywnie zweryfikowana w zagadnieniach analizy skupień (klasteryzacji), klasyfikacji oraz wykrywania elementów nietypowych (odosobnionych), zapewniając odpowiednią jakość procedur wyznaczonych z użyciem estymatorów jądrowych, przy znacznie zredukowanym wymiarze przestrzeni i zmniejszonej liczności zbioru danych.
This project deals with dimensionality and sample length reduction applied to the tasks of exploratory data mining using statistical kernel density estimation. [...]
University Unit