Przegląd formuł normalizacji wartości zmiennych oraz ich własności

Transkrypt

PRZEGLĄD STATYSTYCZNY
R. LXI – ZESZYT 4 – 2014
MAREK WALESIAK
PRZEGLĄD FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH ORAZ ICH
WàASNOĝCI W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ
1. WSTĉP
Punktem wyjĞcia zastosowania metod statystycznej analizie wielowymiarowej jest
macierz danych [xij], w której dowolny element xij (i = 1,...,n; j = 1,...,m) oznacza
obserwacjĊ j-tej zmiennej dla i-tego obiektu. NormalizacjĊ przeprowadza siĊ, gdy
zmienne opisujące obiekty badania mierzone są na skali przedziaáowej lub ilorazowej1. W odniesieniu do sáabych skal pomiaru (nominalna, porządkowa) nie zachodzi
potrzeba normalizacji, na ich wartoĞciach bowiem nie wyznacza siĊ ani relacji równoĞci róĪnic i przedziaáów, ani stosunków.
Celem normalizacji wartoĞci zmiennych jest doprowadzenie zmiennych do
porównywalnoĞci. Uzyskuje siĊ to poprzez pozbawienie mian wyników pomiaru oraz
ujednolicenie ich rzĊdów wielkoĞci. Pierwszy cel normalizacji jest jednoznaczny. Stanowi on warunek sine qua non normalizacji. Cel drugi nie jest jednoznaczny, a zatem
dopuszcza w tym zakresie róĪne rozwiązania. Ujednolicenie rzĊdów wielkoĞci dla
zmiennych uzyskuje siĊ np. poprzez ujednolicenie wartoĞci wszystkich zmiennych
pod wzglĊdem zmiennoĞci mierzonej odchyleniem standardowym (medianowym
odchyleniem bezwzglĊdnym dla miar pozycyjnych) lub przez zapewnienie staáoĞci
rozstĊpu dla znormalizowanych wartoĞci zmiennych. Ogólnie rzecz biorąc ujednolicenie rzĊdów wielkoĞci uzyskuje siĊ przez wprowadzenie jednolicie okreĞlonej
wartoĞci zerowej dla wszystkich zmiennych (parametr Aj we wzorze (1)), a nastĊpnie
przeskalowanie wartoĞci zmiennych (parametr Bj we wzorze (1)).
W artykule zaprezentowano przegląd formuá normalizacyjnych, zaproponowano
dwie nowe formuáy normalizacyjne, pokazano związki miĊdzy formuáami normalizacyjnymi oraz wskazano przypadki nieprawidáowych formuá normalizacyjnych.
1
CharakterystykĊ skal pomiaru zawarto m.in. w pracach (Stevens, 1946; Walesiak, 2011,
s. 13–16).
364
Marek Walesiak
2. FORMUàY NORMALIZACJI WARTOĝCI ZMIENNYCH
Ze wzglĊdu na to, Īe jedynymi dopuszczalnymi przeksztaáceniami na skali przedziaáowej i ilorazowej są przeksztaácenia liniowe, formuáy normalizacyjne moĪna
wyraziü ogólnym wzorem (Walesiak, 1988; Walesiak, 1990):
]LM
xLM Aj
Bj
E j xLM D j
1
Bj
xLM Aj
(E j ! 0) ,
Bj
(1)
gdzie: xij – wartoĞü j-tej zmiennej dla i-tego obiektu,
zij – znormalizowana wartoĞü j-tej zmiennej dla i-tego obiektu,
Aj – parametr przesuniĊcia do umownego zera dla j-tej zmiennej,
Bj – parametr skali dla j-tej zmiennej,
aj = – Aj/Bj, bj = 1/Bj – parametry dla j-tej zmiennej okreĞlone w tab. 1.
Szczególnymi przypadkami wzoru (1) są formuáy ujĊte w tab. 1 (por. np. Abrahamowicz, 1985; Borys, 1978; GrabiĔski, 1992, s. 35–38; Jajuga, 1981; Jajuga, Walesiak, 2000; Milligan, Cooper, 1988; Máodak, 2006; Nowak, 1990, s. 38–39; Walesiak,
1988; Walesiak, 1993, s. 40; Walesiak, 1996, s. 38–40; Walesiak, 2002, s. 19).
2
Tabela 1.
Formuáy normalizacyjne
Parametr
Typ
Nazwa formuáy
Skala pomiaru zmiennych
bj
aj
–
–
n0
Bez normalizacji
n1
Standaryzacja
1 Vj
xj V j
n2
Standaryzacja
pozycyjna2
1 PDG j
PHG j PDG j
n3
Unitaryzacja
1 Uj
xj U j
n3a
Unitaryzacja pozycyjna
1 Uj
PHG j U j
2
przed
normalizacją
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
po
normalizacji
–
przedziaáowa
przedziaáowa
przedziaáowa
przedziaáowa
Autorzy pracy Lira, Wagner, Wysocki (2002, s. 91) proponują przemnoĪenie mianownika przez
staáą 1,4826. Uzasadnienie wprowadzenia staáej zawarto w pracy Máodak (2009, s. 18).
Przegląd formuá normalizacji wartoĞci zmiennych oraz ich wáasnoĞci w statystycznej analizie...
n4
Unitaryzacja zerowana
n5
Normalizacja3
w przedziale [–1; 1]
Normalizacja pozycyjna w przedziale
[–1; 1]
1 Uj
PLQ{xLM } U j
1
xj
PD[ xLM x j
PD[ xLM x j
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
ilorazowa i
(lub) przedziaáowa
L
L
L
365
przedziaáowa
przedziaáowa
1
PHG j
PD[ xLM PHG j
PD[ xLM PHG j
n6
1 Vj
0
ilorazowa
ilorazowa
n6a
1 PDG j
0
ilorazowa
ilorazowa
n7
1 Uj
0
ilorazowa
ilorazowa
1 PD[{xLM }
0
ilorazowa
ilorazowa
1 xj
0
ilorazowa
ilorazowa
1 PHG j
0
ilorazowa
ilorazowa
x
0
ilorazowa
ilorazowa
2
1 LM
0
ilorazowa
ilorazowa
ilorazowa i
(lub) przedziaáowa
przedziaáowa
ilorazowa i
(lub) przedziaáowa
przedziaáowa
ilorazowa i
(lub) przedziaáowa
przedziaáowa
n5a
n8
n9
L
L
L
Przeksztaácenia
ilorazowe
n9a
1
n10
n11
n
¦L
1 LM
n
¦L
1
x
xj
1
n12
Normalizacja
n
¦L
1
( xLM x j )
2
n
¦L
n
( xLM PHG j)
¦
L
1
n13
Normalizacja z zerem usytuowanym
centralnie4
1
Uj 2
( xLM x j ) 2
PHG j
1
Normalizacja
n12a
pozycyjna
1
2
n
( xLM PHG j)
¦
L
1
mj
Uj 2
2
przedziaáowa
zij – wartoĞü j-tej zmiennej dla i-tego obiektu, zij – znormalizowana wartoĞü j-tej zmiennej dla i-tego
obiektu, x j – Ğrednia dla j-tej zmiennej, sj – odchylenie standardowe dla j-tej zmiennej, rj – rozstĊp dla
j-tej zmiennej, m j
j-tej zmiennej, PDG j
PD[{xLM } PLQ{xLM }
L
– Ğrodek rozstĊpu (mid-range), PHG j PHG ( xLM ) – mediana dla
L
2
PDG ( xLM ) – medianowe odchylenie bezwzglĊdne dla j-tej zmiennej.
L
L
ħródáo: opracowanie wáasne.34
3
4
Zob. Rybaczuk (2002, s. 147).
http://www.benetzkorn.com/2011/11/data-normalization-and-standardization/ (dostĊp 1.06.2014).
366
Marek Walesiak
W tab. 1 oprócz znanych formuá normalizacyjnych przedstawiono dwie nowe
propozycje okreĞlone jako n12 oraz n12a. Punktem wyjĞcia konstrukcji formuá
normalizacyjnych n12 i n12a jest formuáa normalizacyjna n11. Od wartoĞci xij
odejmuje siĊ w liczniku i mianowniku wartoĞü Ğrednią x j (formuáa n12) lub medianĊ
PHG j PHG ( xLM ) (formuáa n12a). Dla formuáy normalizacyjnej n12 odchylenie stanL
dardowe maleje wraz ze wzrostem liczebnoĞci obserwacji (obiektów) w macierzy
danych. Nie stanowi to wady tej formuáy normalizacyjnej w statystycznej analizie
wielowymiarowej, poniewaĪ normalizacjĊ przeprowadza siĊ dla kaĪdej zmiennej ze
zbioru zmiennych dla ustalonej (jednakowej) liczby obserwacji (obiektów).
NormalizacjĊ wartoĞci zmiennych naleĪy odróĪniü od róĪnych formuá przeksztaácających dane, które nie muszą byü wyraĪone w postaci funkcji liniowej okreĞlonej
wzorem (1). Np. w porządkowaniu liniowym przy konstrukcji syntetycznego miernika rozwoju zachodzi niekiedy potrzeba ujednolicenia charakteru zmiennych w celu
zapewnienia jednolitej preferencji zmiennych. Zmienne destymulanty oraz nominanty
przeksztaáca siĊ w stymulanty z wykorzystaniem funkcji liniowych i nieliniowych
(zob. np. Walesiak, 2011, s. 10).
NormalizacjĊ wartoĞci zmiennych przeprowadza siĊ w pakiecie clusterSim (zob. Walesiak, Dudek, 2014) programu R (R Development Core Team, 2014)
z wykorzystaniem funkcji:
data.Normalization(x,type=”n0”,normalization=”column”)
gdzie:
x – macierz danych,
type – typ formuáy normalizacyjnej z tab. 1,
normalization – rodzaj normalizacji: ”column” – normalizacja wedáug
zmiennych (kolumny w macierzy danych), ”row” – normalizacja wedáug obiektów
(wiersze w macierzy danych).
W tab. 1 przedstawiono wzory na normalizacjĊ wedáug zmiennych. Analogiczne
wzory moĪna przedstawiü dla normalizacji wedáug obiektów. Normalizacja wedáug
obiektów ma sens w przypadku, gdy wszystkie zmienne wyraĪone są w tej samej
jednostce miary. Taki przypadek ma miejsce np. w badaniach strukturalnych. Dalsze
rozwaĪania dotyczyü bĊdą normalizacji wedáug zmiennych, choü analogiczne spostrzeĪenia odnoszą siĊ do normalizacji wedáug obiektów.
Ujednolicenie rzĊdów wielkoĞci jest moĪliwe tylko w razie jednolitego okreĞlenia
wartoĞci zerowej dla wszystkich zmiennych (zob. Walesiak, 1988). Przeksztaácenia
ilorazowe moĪna stosowaü tylko wtedy, gdy zmienne są mierzone na skali ilorazowej
(istnieje dla niej absolutny punkt zerowy). Gdy zbiór zawiera zmienne mierzone na
skali przedziaáowej lub przedziaáowej i ilorazowej, wówczas do normalizacji moĪna
stosowaü pozostaáe formuáy normalizacyjne, wprowadzające jednolicie okreĞloną wartoĞü zerową (umowną) dla wszystkich zmiennych. Standaryzacja klasyczna (standaryzacja pozycyjna), normalizacja (normalizacja pozycyjna), unitaryzacja (unitaryzacja
pozycyjna), normalizacja w przedziale [–1; 1] (normalizacja pozycyjna w przedziale
[–1; 1]) okreĞlają umowną wartoĞü zerową na poziomie Ğredniej wartoĞci zmiennej
367
(mediany dla formuá pozycyjnych), unitaryzacja zerowana – na poziomie wartoĞci
minimalnej, a normalizacja z zerem usytuowanym centralnie – na poziomie Ğrodka
rozstĊpu. Zastosowanie tych formuá normalizacyjnych do zmiennych mierzonych
na skali ilorazowej, aczkolwiek formalnie poprawne, spowoduje stratĊ informacji
wskutek „przejĞcia” wszystkich zmiennych na skalĊ przedziaáową. Strata informacji przejawia siĊ m.in. ograniczeniem zastosowania róĪnych technik statystycznych
i ekonometrycznych.
3. WàASNOĝCI FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH
Przy wyborze formuáy normalizacyjnej naleĪy braü pod uwagĊ nie tylko skale
pomiaru zmiennych, ale równieĪ takie charakterystyki rozkáadu zmiennych, jak:
Ğrednia arytmetyczna (mediana), odchylenie standardowe (medianowe odchylenie
bezwzglĊdne) i rozstĊp wyznaczony dla znormalizowanych wartoĞci zmiennych (por.
tab. 2).
Tabela 2.
Charakterystyki rozkáadu wartoĞci zmiennych po normalizacji
Typ
Formuáa
n1
( xLM x j ) V j
Odchylenie
ĝrednia arytmetyczstandardowe / medianowe
na / mediana*
odchylenie bezwzglĊdne*
RozstĊp
0
1
rj / sj
PHG j PDG j
0
1
rj / madj
n3
( xLM x j ) U j
0
sj / rj
1
n3a
( xLM PHG j ) U j
0
madj / rj
1
n4
ª
º
{xLM }» U j
«¬ xLM PLQ
L
¼
º
ª
{xLM }» U j
«¬ x j PLQ
L
¼
sj / rj
1
n5
x
0
V j PD[ xLM x j
U j PD[ xLM x j
0
PDG j PD[ xLM PHG j
U j PD[ xLM PHG j
x
n2
n5a
LM
LM
x
LM
x j PD[ xLM x j
L
PHG j PD[ xLM PHG j
L
L
L
L
L
n6
xLM V j
xj V j
1
rj / sj
n6a
xLM PDG j
x j PDG j
1
rj / madj
n7
xij rj
xj U j
sj / rj
1
n8
xLM PD[{xLM }
x j PD[{xLM }
V j PD[{xLM }
U j PD[{xLM }
n9
xLM x j
1
V j xj
U j xj
n9a
xLM PHG j
1
madj / medj
rj / medj
L
L
L
L
368
Marek Walesiak
n10
n11
n
¦L 1 xLM
xLM
n
¦L 1 xLM2
xLM
Vj
1/n
xj
n
¦L
2
1 LM
x
n
¦L 1 ( xLM x j )
2
n
n13
x
n
¦L
Uj
¦L 1 ( xLM PHG j ) 2
xLM m j
Uj 2
xj mj
Uj 2
n
¦L
1
( xLM PHG j ) 2
Vj
Uj 2
x
1 LM
n
¦L
Uj
2
1 LM
x
Uj
n
¦L
1
( xLM x j ) 2
Uj
PDG j
0
n
2
1 LM
1
n 1
0
xLM PHG j
n12a
x
1 LM
¦L
Vj
xLM x j
n12
n
¦L
n
¦L
1
( xLM PHG j ) 2
2
* mediana i medianowe odchylenie bezwzglĊdne dla n2, n3a, n5a, n6a, n9a, n12a.
ħródáo: opracowanie wáasne z wykorzystaniem prac: Jajuga (1981, s. 33), Walesiak (1996, s. 39), Walesiak (2011, s. 20), Jajuga, Walesiak (2000, s. 109), Lira, Wagner, Wysocki (2002, s. 91), Máodak (2006,
s. 39–40).
a)
b)
c)
d)
Analiza tab. 2 pozwala sformuáowaü nastĊpujące wnioski5:
formuáy normalizacyjne (unitaryzacja, unitaryzacja pozycyjna, unitaryzacja
zerowana, przeksztaácenie ilorazowe z podstawą normalizacji równą rozstĊpowi,
normalizacja z zerem usytuowanym centralnie) są cenne, poniewaĪ zapewniają
znormalizowanym wartoĞciom zmiennych zróĪnicowaną zmiennoĞü (mierzoną
odchyleniem standardowym a dla normalizacji pozycyjnych medianowym odchyleniem bezwzglĊdnym) i jednoczeĞnie staáy rozstĊp dla wszystkich zmiennych;
standaryzacja klasyczna, standaryzacja pozycyjna, normalizacja oraz przeksztaácenie ilorazowe z podstawą normalizacji równą odchyleniu standardowemu i medianowemu odchyleniu bezwzglĊdnemu powodują ujednolicenie wartoĞci wszystkich
zmiennych pod wzglĊdem zmiennoĞci mierzonej odchyleniem standardowym
(medianowym odchyleniem bezwzglĊdnym dla miar pozycyjnych); oznacza to
wyeliminowanie zmiennoĞci jako podstawy róĪnicowania obiektów;
przeksztaácenia ilorazowe z podstawą normalizacji równą maksimum oraz pierwiastkowi z sumy kwadratów obserwacji zapewniają znormalizowanym wartoĞciom zmiennych zróĪnicowaną zmiennoĞü, Ğrednią arytmetyczną i rozstĊp;
przeksztaácenia ilorazowe z podstawą normalizacji równą sumie, Ğredniej arytmetycznej i medianie, normalizacja pozycyjna, normalizacja w przedziale [–1; 1]
oraz normalizacja pozycyjna w przedziale [–1; 1] zapewniają znormalizowanym
wartoĞciom zmiennych zróĪnicowaną zmiennoĞü i rozstĊp oraz staáą dla wszystkich zmiennych Ğrednią arytmetyczną (medianĊ dla miar pozycyjnych); pierwsza
formuáa stanowi podstawĊ normalizacji w badaniach strukturalnych (stosuje siĊ
tutaj normalizacjĊ wedáug obiektów);
5
Opracowanie wáasne z wykorzystaniem prac: Jajuga, Walesiak (2000, s. 110–111), Walesiak
(2002, s. 20).
369
e) wszystkie formuáy normalizacyjne, bĊdące przeksztaáceniami liniowymi obserwacji na kaĪdej zmiennej, zachowują skoĞnoĞü i kurtozĊ rozkáadu zmiennych6;
f) dla kaĪdej pary zmiennych wszystkie formuáy normalizacyjne nie zmieniają wartoĞci wspóáczynnika korelacji liniowej Pearsona.
4. NORMALIZACJA WARTOĝCI ZMIENNYCH – ZWIĄZKI MIĉDZY FORMUàAMI
NORMALIZACYJNYMI I INNE SPOSTRZEĩENIA
W wyniku zastosowania wybranych formuá normalizacyjnych w dwóch nastĊpujących po sobie krokach otrzymuje siĊ wyniki toĪsame z zastosowaniem jednej z formuá
normalizacyjnych (zob. tab. 3).
Tabela 3.
Formuáy normalizacyjne odpowiadające normalizacji dwukrokowej
Zastosowana formuáa normalizacyjna
Krok 1
Krok 2
n1
n7
Implikacja
Formuáa normalizacyjna

n3
n2
n7

n3a
n5
n7

n3
n5a
n7

n3a
n3
n6

n1
n3a
n6a

n2
ħródáo: opracowanie wáasne.
W literaturze (por. np. ZeliaĞ, 2002, s. 794; Máodak, 2006, s. 40) proponowane są
nastĊpujące formuáy normalizacyjne:
n
¦L
2
1 LM
]LM
xLM
x ,
(2)
]LM
xLM PHG ( xLM2 ) .
(3)
L
Formuáy te są báĊdne, poniewaĪ jednym z celów normalizacji jest pozbawienie
mian wyników pomiaru. W tym przypadku nie nastąpi pozbawienie mian wyników
pomiaru.
6
Obliczenia sprawdzające wykonano w pakiecie e1071 (Meyer i in., 2014) programu R wykorzystując trzy wzory na skoĞnoĞü i kurtozĊ zaprezentowane w pracy Joanes, Gill (1998).
370
Marek Walesiak
W literaturze (zob. GrabiĔski, 1988, s. 245; GrabiĔski, 1992, s. 35; Paweáek,
2008, s. 57) dyskutowana jest ogólna formuáa normalizacyjna o postaci:
]LM
§ xLM Aj
¨
¨ B
j
©
Sj
·
¸ ,
¸
¹
(4)
gdzie: Aj – parametr przesuniĊcia do umownego zera dla j-tej zmiennej,
Bj – parametr skali dla j-tej zmiennej,
Pj – dodatnia liczba na ogóá równa 1/2, 1, 2, ... .
Tylko j S j
1 formuáa ta jest identyczna z normalizacyjnym przeksztaáceniem
liniowym o postaci (1). Zastosowanie innych wartoĞci w potĊdze spowoduje, Īe
otrzyma siĊ znormalizowane wartoĞci zmiennych, które nie zachowają dwóch podstawowych wáasnoĞci formuá normalizacyjnych:
a) skoĞnoĞü i kurtoza rozkáadu zmiennych przed i po normalizacji bĊdzie inna,
b) wspóáczynniki korelacji liniowej Pearsona dla kaĪdej pary zmiennych przed i po
normalizacji bĊdą miaáy inne wartoĞci.
5. PODSUMOWANIE
W artykule zaprezentowano przegląd formuá normalizacyjnych wartoĞci zmiennych wyraĪonych ogólną formuáą liniową o postaci (1). Szczególne przypadki tej
formuáy ujĊto w tab. 1.
WáasnoĞci zaprezentowanych formuá normalizacyjnych przedstawiono w tab.
2. Przy wyborze formuáy normalizacyjnej naleĪy braü pod uwagĊ nie tylko skale
pomiaru zmiennych, ale równieĪ takie charakterystyki rozkáadu zmiennych, jak:
Ğrednia arytmetyczna (mediana dla formuá pozycyjnych), odchylenie standardowe
(medianowe odchylenie bezwzglĊdne dla formuá pozycyjnych) i rozstĊp wyznaczony
dla znormalizowanych wartoĞci zmiennych.
Ponadto zaproponowano dwie nowe formuáy normalizacyjne (n12 i n12a),
pokazano związki miĊdzy formuáami normalizacyjnymi oraz wskazano przypadki
nieprawidáowych formuá normalizacyjnych.
Uniwersytet Ekonomiczny we Wrocáawiu
371
LITERATURA
Abrahamowicz M., (1985), Konstrukcja syntetycznych mierników rozwoju w Ğwietle twierdzenia
Arrowa, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 311, 5–25.
Borys T., (1978), Metody normowania cech w statystycznych badaniach porównawczych, Przegląd
Statystyczny, 25 (2), 227–239.
GrabiĔski T., (1988), Metody statystycznej analizy porównawczej, w: ZeliaĞ A., (red.), Metody statystyki
miĊdzynarodowej, PWE, Warszawa, 235–260.
GrabiĔski T., (1992), Metody taksonometrii, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków.
Jajuga K., (1981), Metody analizy wielowymiarowej w iloĞciowych badaniach przestrzennych, Akademia
Ekonomiczna we Wrocáawiu, Wrocáaw (praca doktorska).
Jajuga K., Walesiak M., (2000), Standardisation of data set under different measurement scales, w:
Decker R., Gaul W., (red.), Classi¿cation and information processing at the turn of the millennium,
Springer-Verlag, Berlin, Heidelberg, 105–112.
Joanes D. N., Gill C. A., (1998), Comparing Measures of Sample Skewness and Kurtosis, The Statistician, 47, 183–189.
Lira J., Wagner W., Wysocki F., (2002), Mediana w zagadnieniach porządkowania liniowego obiektów
wielocechowych, w: Paradysz J. (red.), Statystyka regionalna w sáuĪbie samorządu lokalnego i biznesu, Internetowa O¿cyna Wydawnicza, Centrum Statystyki Regionalnej, Akademia Ekonomiczna
w Poznaniu, PoznaĔ, 87–99.
Meyer D., Dimitriadou E., Hornik K., Weingessel A., Leisch F., Chang C., Lin C., (2014), e1071 pakkage, URL http://www.R-project.org.
Milligan G. W., Cooper M. C., (1988), A Study of Standardization of Variables in Cluster Analysis,
Journal of Classi¿cation, 5 (2), 181–204.
Máodak A., (2006), Analiza taksonomiczna w statystyce regionalnej, Di¿n, Warszawa.
Máodak A., (2009), Historia problemu Webera, Matematyka Stosowana, 37 (1), tom 10/51, 3–21.
Nowak E., (1990), Metody taksonomiczne w klasy¿kacji obiektów spoáeczno-gospodarczych, PWE,
Warszawa.
Paweáek B., (2008), Metody normalizacji zmiennych w badaniach porównawczych záoĪonych zjawisk
ekonomicznych, Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie, Kraków.
R Development Core Team, (2014), R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, URL http://www.R-project.org.
Rybaczuk M., (2002), Gra¿czna prezentacja struktury danych wielowymiarowych, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 942, 146–153.
Stevens S.S., (1946), On the Theory of Scales of Measurement, Science, 103 (2684), 677–680.
Walesiak M., (1988), Skale pomiaru cech (w ujĊciu zwĊĪonym) a zagadnienie wyboru postaci analitycznej syntetycznych mierników rozwoju, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu,
nr 447, 63–71.
Walesiak M., (1990), Syntetyczne badania porównawcze w Ğwietle teorii pomiaru, Przegląd Statystyczny,
37 (1–2), 37–46.
Walesiak M., (1993), Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace
Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 654, Seria: Monogra¿e i Opracowania nr 101.
Walesiak M., (1996), Metody analizy danych marketingowych, PWN, Warszawa.
Walesiak M., (2002), Uogólniona miara odlegáoĞci w statystycznej analizie wielowymiarowej, Wydawnictwo Akademii Ekonomicznej we Wrocáawiu, Wrocáaw.
Walesiak M., (2011), Uogólniona miara odlegáoĞci GDM w statystycznej analizie wielowymiarowej
z wykorzystaniem programu R, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocáawiu, Wrocáaw.
372
Marek Walesiak
Walesiak M., Dudek A., (2014), clusterSim Package, URL http://www.R-project.org.
ZeliaĞ A., (2002), Some Notes on the Selection of Normalisation of Diagnostic Variables, Statistics in
Transition, 5 (5), 787–802.
PRZEGLĄD FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH ORAZ ICH WàASNOĝCI
W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ
Streszczenie
Celem normalizacji wartoĞci zmiennych jest doprowadzenie zmiennych do porównywalnoĞci
poprzez pozbawienie mian wyników pomiaru oraz ujednolicenie ich rzĊdów wielkoĞci. W artykule
zaprezentowano przegląd formuá normalizacyjnych wartoĞci zmiennych oraz ich wáasnoĞci. Zaproponowano dwie nowe formuáy normalizacyjne, pokazano związki miĊdzy formuáami normalizacyjnymi oraz
wskazano nieprawidáowe formuáy normalizacyjne.
Sáowa kluczowe: normalizacja, standaryzacja, unitaryzacja, przeksztaácenia ilorazowe, wáasnoĞci
formuá normalizacyjnych
DATA NORMALIZATION IN MULTIVARIATE DATA ANALYSIS.
AN OVERVIEW AND PROPERTIES
Abstract
The purpose of normalization is to adjust the size (magnitude) and the relative weighting of the input
variables. The article presents an overview of the normalization formulas and their properties. Moreover
a new formulas of normalization of the values of variables are proposed. The article discusses connection
among normalization formulas and indicates incorrect normalization formulas.
Keywords: normalization, standardization, unitarization, quotient transformation, normalization
formulas properties

Przegląd formuł normalizacji wartości zmiennych oraz ich własności

Transkrypt

Podobne dokumenty

Przegląd formuł normalizacji wartości zmiennych oraz ich własności

normalizacja dlaczego uczeń musi o niej wiedzieć?

Uogólniona miara odległości dla obiektów opisanych zmiennymi z

AY = BAY •= BAY += BAY •=

Jednostka normalizacyjna w systemie normalizacji

W2: WinCC flexible. Wstęp do systemów HMI - EMT