Przegląd formuł normalizacji wartości zmiennych oraz ich własności
Transkrypt
Przegląd formuł normalizacji wartości zmiennych oraz ich własności
PRZEGLĄD STATYSTYCZNY R. LXI – ZESZYT 4 – 2014 MAREK WALESIAK PRZEGLĄD FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH ORAZ ICH WàASNOĝCI W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ 1. WSTĉP Punktem wyjĞcia zastosowania metod statystycznej analizie wielowymiarowej jest macierz danych [xij], w której dowolny element xij (i = 1,...,n; j = 1,...,m) oznacza obserwacjĊ j-tej zmiennej dla i-tego obiektu. NormalizacjĊ przeprowadza siĊ, gdy zmienne opisujące obiekty badania mierzone są na skali przedziaáowej lub ilorazowej1. W odniesieniu do sáabych skal pomiaru (nominalna, porządkowa) nie zachodzi potrzeba normalizacji, na ich wartoĞciach bowiem nie wyznacza siĊ ani relacji równoĞci róĪnic i przedziaáów, ani stosunków. Celem normalizacji wartoĞci zmiennych jest doprowadzenie zmiennych do porównywalnoĞci. Uzyskuje siĊ to poprzez pozbawienie mian wyników pomiaru oraz ujednolicenie ich rzĊdów wielkoĞci. Pierwszy cel normalizacji jest jednoznaczny. Stanowi on warunek sine qua non normalizacji. Cel drugi nie jest jednoznaczny, a zatem dopuszcza w tym zakresie róĪne rozwiązania. Ujednolicenie rzĊdów wielkoĞci dla zmiennych uzyskuje siĊ np. poprzez ujednolicenie wartoĞci wszystkich zmiennych pod wzglĊdem zmiennoĞci mierzonej odchyleniem standardowym (medianowym odchyleniem bezwzglĊdnym dla miar pozycyjnych) lub przez zapewnienie staáoĞci rozstĊpu dla znormalizowanych wartoĞci zmiennych. Ogólnie rzecz biorąc ujednolicenie rzĊdów wielkoĞci uzyskuje siĊ przez wprowadzenie jednolicie okreĞlonej wartoĞci zerowej dla wszystkich zmiennych (parametr Aj we wzorze (1)), a nastĊpnie przeskalowanie wartoĞci zmiennych (parametr Bj we wzorze (1)). W artykule zaprezentowano przegląd formuá normalizacyjnych, zaproponowano dwie nowe formuáy normalizacyjne, pokazano związki miĊdzy formuáami normalizacyjnymi oraz wskazano przypadki nieprawidáowych formuá normalizacyjnych. 1 CharakterystykĊ skal pomiaru zawarto m.in. w pracach (Stevens, 1946; Walesiak, 2011, s. 13–16). 364 Marek Walesiak 2. FORMUàY NORMALIZACJI WARTOĝCI ZMIENNYCH Ze wzglĊdu na to, Īe jedynymi dopuszczalnymi przeksztaáceniami na skali przedziaáowej i ilorazowej są przeksztaácenia liniowe, formuáy normalizacyjne moĪna wyraziü ogólnym wzorem (Walesiak, 1988; Walesiak, 1990): ]LM xLM Aj Bj E j xLM D j 1 Bj xLM Aj (E j ! 0) , Bj (1) gdzie: xij – wartoĞü j-tej zmiennej dla i-tego obiektu, zij – znormalizowana wartoĞü j-tej zmiennej dla i-tego obiektu, Aj – parametr przesuniĊcia do umownego zera dla j-tej zmiennej, Bj – parametr skali dla j-tej zmiennej, aj = – Aj/Bj, bj = 1/Bj – parametry dla j-tej zmiennej okreĞlone w tab. 1. Szczególnymi przypadkami wzoru (1) są formuáy ujĊte w tab. 1 (por. np. Abrahamowicz, 1985; Borys, 1978; GrabiĔski, 1992, s. 35–38; Jajuga, 1981; Jajuga, Walesiak, 2000; Milligan, Cooper, 1988; Máodak, 2006; Nowak, 1990, s. 38–39; Walesiak, 1988; Walesiak, 1993, s. 40; Walesiak, 1996, s. 38–40; Walesiak, 2002, s. 19). 2 Tabela 1. Formuáy normalizacyjne Parametr Typ Nazwa formuáy Skala pomiaru zmiennych bj aj – – n0 Bez normalizacji n1 Standaryzacja 1 Vj xj V j n2 Standaryzacja pozycyjna2 1 PDG j PHG j PDG j n3 Unitaryzacja 1 Uj xj U j n3a Unitaryzacja pozycyjna 1 Uj PHG j U j 2 przed normalizacją ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa po normalizacji – przedziaáowa przedziaáowa przedziaáowa przedziaáowa Autorzy pracy Lira, Wagner, Wysocki (2002, s. 91) proponują przemnoĪenie mianownika przez staáą 1,4826. Uzasadnienie wprowadzenia staáej zawarto w pracy Máodak (2009, s. 18). Przegląd formuá normalizacji wartoĞci zmiennych oraz ich wáasnoĞci w statystycznej analizie... n4 Unitaryzacja zerowana n5 Normalizacja3 w przedziale [–1; 1] Normalizacja pozycyjna w przedziale [–1; 1] 1 Uj PLQ{xLM } U j 1 xj PD[ xLM x j PD[ xLM x j ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa ilorazowa i (lub) przedziaáowa L L L 365 przedziaáowa przedziaáowa 1 PHG j PD[ xLM PHG j PD[ xLM PHG j n6 1 Vj 0 ilorazowa ilorazowa n6a 1 PDG j 0 ilorazowa ilorazowa n7 1 Uj 0 ilorazowa ilorazowa 1 PD[{xLM } 0 ilorazowa ilorazowa 1 xj 0 ilorazowa ilorazowa 1 PHG j 0 ilorazowa ilorazowa x 0 ilorazowa ilorazowa 2 1 LM 0 ilorazowa ilorazowa ilorazowa i (lub) przedziaáowa przedziaáowa ilorazowa i (lub) przedziaáowa przedziaáowa ilorazowa i (lub) przedziaáowa przedziaáowa n5a n8 n9 L L L Przeksztaácenia ilorazowe n9a 1 n10 n11 n ¦L 1 LM n ¦L 1 x xj 1 n12 Normalizacja n ¦L 1 ( xLM x j ) 2 n ¦L n ( xLM PHG j) ¦ L 1 n13 Normalizacja z zerem usytuowanym centralnie4 1 Uj 2 ( xLM x j ) 2 PHG j 1 Normalizacja n12a pozycyjna 1 2 n ( xLM PHG j) ¦ L 1 mj Uj 2 2 przedziaáowa zij – wartoĞü j-tej zmiennej dla i-tego obiektu, zij – znormalizowana wartoĞü j-tej zmiennej dla i-tego obiektu, x j – Ğrednia dla j-tej zmiennej, sj – odchylenie standardowe dla j-tej zmiennej, rj – rozstĊp dla j-tej zmiennej, m j j-tej zmiennej, PDG j PD[{xLM } PLQ{xLM } L – Ğrodek rozstĊpu (mid-range), PHG j PHG ( xLM ) – mediana dla L 2 PDG ( xLM ) – medianowe odchylenie bezwzglĊdne dla j-tej zmiennej. L L ħródáo: opracowanie wáasne.34 3 4 Zob. Rybaczuk (2002, s. 147). http://www.benetzkorn.com/2011/11/data-normalization-and-standardization/ (dostĊp 1.06.2014). 366 Marek Walesiak W tab. 1 oprócz znanych formuá normalizacyjnych przedstawiono dwie nowe propozycje okreĞlone jako n12 oraz n12a. Punktem wyjĞcia konstrukcji formuá normalizacyjnych n12 i n12a jest formuáa normalizacyjna n11. Od wartoĞci xij odejmuje siĊ w liczniku i mianowniku wartoĞü Ğrednią x j (formuáa n12) lub medianĊ PHG j PHG ( xLM ) (formuáa n12a). Dla formuáy normalizacyjnej n12 odchylenie stanL dardowe maleje wraz ze wzrostem liczebnoĞci obserwacji (obiektów) w macierzy danych. Nie stanowi to wady tej formuáy normalizacyjnej w statystycznej analizie wielowymiarowej, poniewaĪ normalizacjĊ przeprowadza siĊ dla kaĪdej zmiennej ze zbioru zmiennych dla ustalonej (jednakowej) liczby obserwacji (obiektów). NormalizacjĊ wartoĞci zmiennych naleĪy odróĪniü od róĪnych formuá przeksztaácających dane, które nie muszą byü wyraĪone w postaci funkcji liniowej okreĞlonej wzorem (1). Np. w porządkowaniu liniowym przy konstrukcji syntetycznego miernika rozwoju zachodzi niekiedy potrzeba ujednolicenia charakteru zmiennych w celu zapewnienia jednolitej preferencji zmiennych. Zmienne destymulanty oraz nominanty przeksztaáca siĊ w stymulanty z wykorzystaniem funkcji liniowych i nieliniowych (zob. np. Walesiak, 2011, s. 10). NormalizacjĊ wartoĞci zmiennych przeprowadza siĊ w pakiecie clusterSim (zob. Walesiak, Dudek, 2014) programu R (R Development Core Team, 2014) z wykorzystaniem funkcji: data.Normalization(x,type=”n0”,normalization=”column”) gdzie: x – macierz danych, type – typ formuáy normalizacyjnej z tab. 1, normalization – rodzaj normalizacji: ”column” – normalizacja wedáug zmiennych (kolumny w macierzy danych), ”row” – normalizacja wedáug obiektów (wiersze w macierzy danych). W tab. 1 przedstawiono wzory na normalizacjĊ wedáug zmiennych. Analogiczne wzory moĪna przedstawiü dla normalizacji wedáug obiektów. Normalizacja wedáug obiektów ma sens w przypadku, gdy wszystkie zmienne wyraĪone są w tej samej jednostce miary. Taki przypadek ma miejsce np. w badaniach strukturalnych. Dalsze rozwaĪania dotyczyü bĊdą normalizacji wedáug zmiennych, choü analogiczne spostrzeĪenia odnoszą siĊ do normalizacji wedáug obiektów. Ujednolicenie rzĊdów wielkoĞci jest moĪliwe tylko w razie jednolitego okreĞlenia wartoĞci zerowej dla wszystkich zmiennych (zob. Walesiak, 1988). Przeksztaácenia ilorazowe moĪna stosowaü tylko wtedy, gdy zmienne są mierzone na skali ilorazowej (istnieje dla niej absolutny punkt zerowy). Gdy zbiór zawiera zmienne mierzone na skali przedziaáowej lub przedziaáowej i ilorazowej, wówczas do normalizacji moĪna stosowaü pozostaáe formuáy normalizacyjne, wprowadzające jednolicie okreĞloną wartoĞü zerową (umowną) dla wszystkich zmiennych. Standaryzacja klasyczna (standaryzacja pozycyjna), normalizacja (normalizacja pozycyjna), unitaryzacja (unitaryzacja pozycyjna), normalizacja w przedziale [–1; 1] (normalizacja pozycyjna w przedziale [–1; 1]) okreĞlają umowną wartoĞü zerową na poziomie Ğredniej wartoĞci zmiennej 367 Przegląd formuá normalizacji wartoĞci zmiennych oraz ich wáasnoĞci w statystycznej analizie... (mediany dla formuá pozycyjnych), unitaryzacja zerowana – na poziomie wartoĞci minimalnej, a normalizacja z zerem usytuowanym centralnie – na poziomie Ğrodka rozstĊpu. Zastosowanie tych formuá normalizacyjnych do zmiennych mierzonych na skali ilorazowej, aczkolwiek formalnie poprawne, spowoduje stratĊ informacji wskutek „przejĞcia” wszystkich zmiennych na skalĊ przedziaáową. Strata informacji przejawia siĊ m.in. ograniczeniem zastosowania róĪnych technik statystycznych i ekonometrycznych. 3. WàASNOĝCI FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH Przy wyborze formuáy normalizacyjnej naleĪy braü pod uwagĊ nie tylko skale pomiaru zmiennych, ale równieĪ takie charakterystyki rozkáadu zmiennych, jak: Ğrednia arytmetyczna (mediana), odchylenie standardowe (medianowe odchylenie bezwzglĊdne) i rozstĊp wyznaczony dla znormalizowanych wartoĞci zmiennych (por. tab. 2). Tabela 2. Charakterystyki rozkáadu wartoĞci zmiennych po normalizacji Typ Formuáa n1 ( xLM x j ) V j Odchylenie ĝrednia arytmetyczstandardowe / medianowe na / mediana* odchylenie bezwzglĊdne* RozstĊp 0 1 rj / sj PHG j PDG j 0 1 rj / madj n3 ( xLM x j ) U j 0 sj / rj 1 n3a ( xLM PHG j ) U j 0 madj / rj 1 n4 ª º {xLM }» U j «¬ xLM PLQ L ¼ º ª {xLM }» U j «¬ x j PLQ L ¼ sj / rj 1 n5 x 0 V j PD[ xLM x j U j PD[ xLM x j 0 PDG j PD[ xLM PHG j U j PD[ xLM PHG j x n2 n5a LM LM x LM x j PD[ xLM x j L PHG j PD[ xLM PHG j L L L L L n6 xLM V j xj V j 1 rj / sj n6a xLM PDG j x j PDG j 1 rj / madj n7 xij rj xj U j sj / rj 1 n8 xLM PD[{xLM } x j PD[{xLM } V j PD[{xLM } U j PD[{xLM } n9 xLM x j 1 V j xj U j xj n9a xLM PHG j 1 madj / medj rj / medj L L L L 368 Marek Walesiak n10 n11 n ¦L 1 xLM xLM n ¦L 1 xLM2 xLM Vj 1/n xj n ¦L 2 1 LM x n ¦L 1 ( xLM x j ) 2 n n13 x n ¦L Uj ¦L 1 ( xLM PHG j ) 2 xLM m j Uj 2 xj mj Uj 2 n ¦L 1 ( xLM PHG j ) 2 Vj Uj 2 x 1 LM n ¦L Uj 2 1 LM x Uj n ¦L 1 ( xLM x j ) 2 Uj PDG j 0 n 2 1 LM 1 n 1 0 xLM PHG j n12a x 1 LM ¦L Vj xLM x j n12 n ¦L n ¦L 1 ( xLM PHG j ) 2 2 * mediana i medianowe odchylenie bezwzglĊdne dla n2, n3a, n5a, n6a, n9a, n12a. ħródáo: opracowanie wáasne z wykorzystaniem prac: Jajuga (1981, s. 33), Walesiak (1996, s. 39), Walesiak (2011, s. 20), Jajuga, Walesiak (2000, s. 109), Lira, Wagner, Wysocki (2002, s. 91), Máodak (2006, s. 39–40). a) b) c) d) Analiza tab. 2 pozwala sformuáowaü nastĊpujące wnioski5: formuáy normalizacyjne (unitaryzacja, unitaryzacja pozycyjna, unitaryzacja zerowana, przeksztaácenie ilorazowe z podstawą normalizacji równą rozstĊpowi, normalizacja z zerem usytuowanym centralnie) są cenne, poniewaĪ zapewniają znormalizowanym wartoĞciom zmiennych zróĪnicowaną zmiennoĞü (mierzoną odchyleniem standardowym a dla normalizacji pozycyjnych medianowym odchyleniem bezwzglĊdnym) i jednoczeĞnie staáy rozstĊp dla wszystkich zmiennych; standaryzacja klasyczna, standaryzacja pozycyjna, normalizacja oraz przeksztaácenie ilorazowe z podstawą normalizacji równą odchyleniu standardowemu i medianowemu odchyleniu bezwzglĊdnemu powodują ujednolicenie wartoĞci wszystkich zmiennych pod wzglĊdem zmiennoĞci mierzonej odchyleniem standardowym (medianowym odchyleniem bezwzglĊdnym dla miar pozycyjnych); oznacza to wyeliminowanie zmiennoĞci jako podstawy róĪnicowania obiektów; przeksztaácenia ilorazowe z podstawą normalizacji równą maksimum oraz pierwiastkowi z sumy kwadratów obserwacji zapewniają znormalizowanym wartoĞciom zmiennych zróĪnicowaną zmiennoĞü, Ğrednią arytmetyczną i rozstĊp; przeksztaácenia ilorazowe z podstawą normalizacji równą sumie, Ğredniej arytmetycznej i medianie, normalizacja pozycyjna, normalizacja w przedziale [–1; 1] oraz normalizacja pozycyjna w przedziale [–1; 1] zapewniają znormalizowanym wartoĞciom zmiennych zróĪnicowaną zmiennoĞü i rozstĊp oraz staáą dla wszystkich zmiennych Ğrednią arytmetyczną (medianĊ dla miar pozycyjnych); pierwsza formuáa stanowi podstawĊ normalizacji w badaniach strukturalnych (stosuje siĊ tutaj normalizacjĊ wedáug obiektów); 5 Opracowanie wáasne z wykorzystaniem prac: Jajuga, Walesiak (2000, s. 110–111), Walesiak (2002, s. 20). 369 Przegląd formuá normalizacji wartoĞci zmiennych oraz ich wáasnoĞci w statystycznej analizie... e) wszystkie formuáy normalizacyjne, bĊdące przeksztaáceniami liniowymi obserwacji na kaĪdej zmiennej, zachowują skoĞnoĞü i kurtozĊ rozkáadu zmiennych6; f) dla kaĪdej pary zmiennych wszystkie formuáy normalizacyjne nie zmieniają wartoĞci wspóáczynnika korelacji liniowej Pearsona. 4. NORMALIZACJA WARTOĝCI ZMIENNYCH – ZWIĄZKI MIĉDZY FORMUàAMI NORMALIZACYJNYMI I INNE SPOSTRZEĩENIA W wyniku zastosowania wybranych formuá normalizacyjnych w dwóch nastĊpujących po sobie krokach otrzymuje siĊ wyniki toĪsame z zastosowaniem jednej z formuá normalizacyjnych (zob. tab. 3). Tabela 3. Formuáy normalizacyjne odpowiadające normalizacji dwukrokowej Zastosowana formuáa normalizacyjna Krok 1 Krok 2 n1 n7 Implikacja Formuáa normalizacyjna n3 n2 n7 n3a n5 n7 n3 n5a n7 n3a n3 n6 n1 n3a n6a n2 ħródáo: opracowanie wáasne. W literaturze (por. np. ZeliaĞ, 2002, s. 794; Máodak, 2006, s. 40) proponowane są nastĊpujące formuáy normalizacyjne: n ¦L 2 1 LM ]LM xLM x , (2) ]LM xLM PHG ( xLM2 ) . (3) L Formuáy te są báĊdne, poniewaĪ jednym z celów normalizacji jest pozbawienie mian wyników pomiaru. W tym przypadku nie nastąpi pozbawienie mian wyników pomiaru. 6 Obliczenia sprawdzające wykonano w pakiecie e1071 (Meyer i in., 2014) programu R wykorzystując trzy wzory na skoĞnoĞü i kurtozĊ zaprezentowane w pracy Joanes, Gill (1998). 370 Marek Walesiak W literaturze (zob. GrabiĔski, 1988, s. 245; GrabiĔski, 1992, s. 35; Paweáek, 2008, s. 57) dyskutowana jest ogólna formuáa normalizacyjna o postaci: ]LM § xLM Aj ¨ ¨ B j © Sj · ¸ , ¸ ¹ (4) gdzie: Aj – parametr przesuniĊcia do umownego zera dla j-tej zmiennej, Bj – parametr skali dla j-tej zmiennej, Pj – dodatnia liczba na ogóá równa 1/2, 1, 2, ... . Tylko j S j 1 formuáa ta jest identyczna z normalizacyjnym przeksztaáceniem liniowym o postaci (1). Zastosowanie innych wartoĞci w potĊdze spowoduje, Īe otrzyma siĊ znormalizowane wartoĞci zmiennych, które nie zachowają dwóch podstawowych wáasnoĞci formuá normalizacyjnych: a) skoĞnoĞü i kurtoza rozkáadu zmiennych przed i po normalizacji bĊdzie inna, b) wspóáczynniki korelacji liniowej Pearsona dla kaĪdej pary zmiennych przed i po normalizacji bĊdą miaáy inne wartoĞci. 5. PODSUMOWANIE W artykule zaprezentowano przegląd formuá normalizacyjnych wartoĞci zmiennych wyraĪonych ogólną formuáą liniową o postaci (1). Szczególne przypadki tej formuáy ujĊto w tab. 1. WáasnoĞci zaprezentowanych formuá normalizacyjnych przedstawiono w tab. 2. Przy wyborze formuáy normalizacyjnej naleĪy braü pod uwagĊ nie tylko skale pomiaru zmiennych, ale równieĪ takie charakterystyki rozkáadu zmiennych, jak: Ğrednia arytmetyczna (mediana dla formuá pozycyjnych), odchylenie standardowe (medianowe odchylenie bezwzglĊdne dla formuá pozycyjnych) i rozstĊp wyznaczony dla znormalizowanych wartoĞci zmiennych. Ponadto zaproponowano dwie nowe formuáy normalizacyjne (n12 i n12a), pokazano związki miĊdzy formuáami normalizacyjnymi oraz wskazano przypadki nieprawidáowych formuá normalizacyjnych. Uniwersytet Ekonomiczny we Wrocáawiu Przegląd formuá normalizacji wartoĞci zmiennych oraz ich wáasnoĞci w statystycznej analizie... 371 LITERATURA Abrahamowicz M., (1985), Konstrukcja syntetycznych mierników rozwoju w Ğwietle twierdzenia Arrowa, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 311, 5–25. Borys T., (1978), Metody normowania cech w statystycznych badaniach porównawczych, Przegląd Statystyczny, 25 (2), 227–239. GrabiĔski T., (1988), Metody statystycznej analizy porównawczej, w: ZeliaĞ A., (red.), Metody statystyki miĊdzynarodowej, PWE, Warszawa, 235–260. GrabiĔski T., (1992), Metody taksonometrii, Wydawnictwo Akademii Ekonomicznej w Krakowie, Kraków. Jajuga K., (1981), Metody analizy wielowymiarowej w iloĞciowych badaniach przestrzennych, Akademia Ekonomiczna we Wrocáawiu, Wrocáaw (praca doktorska). Jajuga K., Walesiak M., (2000), Standardisation of data set under different measurement scales, w: Decker R., Gaul W., (red.), Classi¿cation and information processing at the turn of the millennium, Springer-Verlag, Berlin, Heidelberg, 105–112. Joanes D. N., Gill C. A., (1998), Comparing Measures of Sample Skewness and Kurtosis, The Statistician, 47, 183–189. Lira J., Wagner W., Wysocki F., (2002), Mediana w zagadnieniach porządkowania liniowego obiektów wielocechowych, w: Paradysz J. (red.), Statystyka regionalna w sáuĪbie samorządu lokalnego i biznesu, Internetowa O¿cyna Wydawnicza, Centrum Statystyki Regionalnej, Akademia Ekonomiczna w Poznaniu, PoznaĔ, 87–99. Meyer D., Dimitriadou E., Hornik K., Weingessel A., Leisch F., Chang C., Lin C., (2014), e1071 pakkage, URL http://www.R-project.org. Milligan G. W., Cooper M. C., (1988), A Study of Standardization of Variables in Cluster Analysis, Journal of Classi¿cation, 5 (2), 181–204. Máodak A., (2006), Analiza taksonomiczna w statystyce regionalnej, Di¿n, Warszawa. Máodak A., (2009), Historia problemu Webera, Matematyka Stosowana, 37 (1), tom 10/51, 3–21. Nowak E., (1990), Metody taksonomiczne w klasy¿kacji obiektów spoáeczno-gospodarczych, PWE, Warszawa. Paweáek B., (2008), Metody normalizacji zmiennych w badaniach porównawczych záoĪonych zjawisk ekonomicznych, Wydawnictwo Uniwersytetu Ekonomicznego w Krakowie, Kraków. R Development Core Team, (2014), R: A language and environment for statistical computing, R Foundation for Statistical Computing, Vienna, URL http://www.R-project.org. Rybaczuk M., (2002), Gra¿czna prezentacja struktury danych wielowymiarowych, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 942, 146–153. Stevens S.S., (1946), On the Theory of Scales of Measurement, Science, 103 (2684), 677–680. Walesiak M., (1988), Skale pomiaru cech (w ujĊciu zwĊĪonym) a zagadnienie wyboru postaci analitycznej syntetycznych mierników rozwoju, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 447, 63–71. Walesiak M., (1990), Syntetyczne badania porównawcze w Ğwietle teorii pomiaru, Przegląd Statystyczny, 37 (1–2), 37–46. Walesiak M., (1993), Statystyczna analiza wielowymiarowa w badaniach marketingowych, Prace Naukowe Akademii Ekonomicznej we Wrocáawiu, nr 654, Seria: Monogra¿e i Opracowania nr 101. Walesiak M., (1996), Metody analizy danych marketingowych, PWN, Warszawa. Walesiak M., (2002), Uogólniona miara odlegáoĞci w statystycznej analizie wielowymiarowej, Wydawnictwo Akademii Ekonomicznej we Wrocáawiu, Wrocáaw. Walesiak M., (2011), Uogólniona miara odlegáoĞci GDM w statystycznej analizie wielowymiarowej z wykorzystaniem programu R, Wydawnictwo Uniwersytetu Ekonomicznego we Wrocáawiu, Wrocáaw. 372 Marek Walesiak Walesiak M., Dudek A., (2014), clusterSim Package, URL http://www.R-project.org. ZeliaĞ A., (2002), Some Notes on the Selection of Normalisation of Diagnostic Variables, Statistics in Transition, 5 (5), 787–802. PRZEGLĄD FORMUà NORMALIZACJI WARTOĝCI ZMIENNYCH ORAZ ICH WàASNOĝCI W STATYSTYCZNEJ ANALIZIE WIELOWYMIAROWEJ Streszczenie Celem normalizacji wartoĞci zmiennych jest doprowadzenie zmiennych do porównywalnoĞci poprzez pozbawienie mian wyników pomiaru oraz ujednolicenie ich rzĊdów wielkoĞci. W artykule zaprezentowano przegląd formuá normalizacyjnych wartoĞci zmiennych oraz ich wáasnoĞci. Zaproponowano dwie nowe formuáy normalizacyjne, pokazano związki miĊdzy formuáami normalizacyjnymi oraz wskazano nieprawidáowe formuáy normalizacyjne. Sáowa kluczowe: normalizacja, standaryzacja, unitaryzacja, przeksztaácenia ilorazowe, wáasnoĞci formuá normalizacyjnych DATA NORMALIZATION IN MULTIVARIATE DATA ANALYSIS. AN OVERVIEW AND PROPERTIES Abstract The purpose of normalization is to adjust the size (magnitude) and the relative weighting of the input variables. The article presents an overview of the normalization formulas and their properties. Moreover a new formulas of normalization of the values of variables are proposed. The article discusses connection among normalization formulas and indicates incorrect normalization formulas. Keywords: normalization, standardization, unitarization, quotient transformation, normalization formulas properties