dr Anna Wolińska-Welcz - Gradacyjna eksploracja danych klinicznych
Transkrypt
dr Anna Wolińska-Welcz - Gradacyjna eksploracja danych klinicznych
POLSKA GRUPA NARODOWA MIĘDZYNARODOWEGO TOWARZYSTWA BIOSTATYSTYKI KLINICZNEJ Gradacyjna eksploracja danych klinicznych Grade Eksploration of Clinical Data dr Anna Wolińska – Welcz (Lublin) Kraków, 4.XII.2009 1 CZYM JEST EKSPLORACJA DANYCH? „Nauka zajmująca się wydobywaniem informacji z dużych zbiorów danych lub baz danych” (D. Hand, H. Mannila, P. Smyt: Principles of Data Mining, Cambridge, 2001) data mining, zgłębianie danych, drążenie danych, wydobywanie cennej wiedzy z danych analiza danych pochodzących z obserwacji w celu znalezienia nieoczekiwanych związków i oryginalne podsumowanie danych w sposób przydatny dla ich właściciela (globalne modele, lokalne wzorce) Anna Wolińska-Welcz 2 Eksploracja danych a stereotypy w tradycyjnym wnioskowaniu statystycznym – dane traktuje się jako próbę otrzymaną z domniemywanej populacji, na podstawie której to próby wnioskuje się o owej populacji (pomimo trudności ze spełnieniem warunków nakładanych na sposób losowania próby oraz ze sprecyzowaniem o jaką populację chodzi) stereotyp traktujący dane jako takie lub inne próby modele i metody eksploracji danych – nie są ukierunkowane na poszukiwanie informacji o populacji, a na poszukiwanie ukrytej struktury danych Anna Wolińska-Welcz 3 Gradacyjna analiza danych • nowa gałąź szybko rozwijającego się obecnie data-mining • istotny krok na drodze do integracji teorii pomiaru, analizy danych, statystyki i taksonomii • metoda ukierunkowana na bardzo dobrą wizualizację danych, w celu lepszego zrozumienia ich ogólnej struktury • wykorzystywana przy poszukiwaniu: ukrytych struktur danych, trendów, bardziej jednorodnych podpopulacji, elementów odstających (outlierów) oraz uporządkowanych skupień. 4 • Cel użycia metod gradacyjnych - zrozumieć dane, odkryć prawdziwe, ukryte struktury w danych • rozkłady wielowymiarowe są reprezentowane przez dwuwymiarowe macierze danych, które przy pewnych założeniach można potraktować jako tablice prawdopodobieństw • gradacyjna eksploracja pozwala wyłonić zmienne objawowe wywierające silny wpływ na pozostałe • chociaż w praktyce trudno jest idealnie spełnić wymagane założenia metody gradacyjne okazują się zwykle odporne, by wykryć strukturę (model) danych 5 Dane kliniczne wielowymiarowe ze skal i kwestionariuszy psychologicznych głównym celem ich eksploracji jest znalezienie zależności między analizowanymi zmiennymi (cechami, skalowanymi wartościami) a obserwowanymi obiektami (pacjentami, przypadkami) ważna jest też ich klarowna wizualizacja rzadko można traktować je jako próbę losową (a nie próbę możliwą, dostępną, dogodną) pochodzącą z dobrze określonej populacji (a nie populacji domniemywanej) Anna Wolińska-Welcz 6 Tablica analizowanych danych klinicznych cechy pierwszoplanowe nr pacjenta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 KWESTIONARIUSZ OBJAWOWY "O" ALEKSANDROWICZA lęk depresja niepokój 9 4 35 61 38 66 29 18 8 25 8 63 18 19 75 72 79 68 39 24 34 24 22 25 28 25 16 58 15 47 22 8 36 37 49 36 34 12 25 39 10 13 13 5 35 15 28 23 31 31 23 8 42 22 17 13 13 32 22 42 32 15 32 28 33 55 22 22 29 20 16 38 26 18 41 10 27 32 35 23 30 21 23 23 30 18 28 33 29 35 zab. neura zab. derealisomaty histeria natręt. społ. hipoch. psych. snu stenia sex zacja czne 5 20 24 0 0 0 12 4 21 58 4 15 0 0 16 4 11 8 5 32 16 30 46 7 13 17 26 17 33 129 27 24 53 11 12 56 28 18 36 106 28 30 46 0 24 7 24 5 33 48 30 34 56 20 27 41 26 38 34 167 17 23 21 5 5 25 19 9 25 77 20 18 34 5 14 4 0 14 13 167 0 8 28 0 4 8 12 16 29 32 0 27 26 11 24 23 22 28 38 39 21 17 20 8 0 4 21 21 12 119 21 23 12 8 8 17 4 32 21 132 14 0 33 12 4 8 13 0 8 23 4 15 14 0 14 19 7 15 8 93 13 31 48 0 12 22 14 42 26 122 28 12 41 0 5 0 0 25 18 171 19 28 38 0 0 4 22 42 23 161 0 12 40 0 29 12 14 7 7 55 19 31 38 8 0 22 0 20 26 55 4 9 32 5 5 4 20 4 16 77 9 29 37 4 46 19 20 0 16 84 0 14 0 0 8 8 23 0 0 61 17 8 30 23 0 7 18 14 17 13 19 25 50 14 8 21 16 28 21 116 25 23 33 8 12 21 17 4 9 93 18 20 13 0 0 21 8 4 21 64 13 29 50 16 7 14 18 28 31 119 22 27 41 12 16 16 5 14 22 142 28 23 37 12 8 13 16 32 17 116 4 21 29 16 17 26 20 24 16 74 cechy drugoplanowe KWEST KWEST Bizonia Rottera 14 -30 15 42 12 34 22 -2 -7 7 8 16 19 -22 39 46 20 20 30 2 30 -16 20 33 20 23 23 16 23 22 2 2 3 4 5 6 7 7 7 7 8 8 8 8 9 9 9 9 9 9 9 9 9 10 10 10 10 10 10 10 suma względna poprawa "O" objawowa 207 0,34 122 -0,41 437 0,50 496 0,12 365 0,81 629 0,20 311 0,36 340 0,30 198 -0,30 323 -0,15 277 0,33 390 0,43 170 0,07 194 0,04 481 0,26 396 0,43 472 0,27 298 0,60 323 0,28 253 -0,38 351 0,31 167 0,38 234 -0,06 388 -0,24 320 0,43 226 -0,19 381 0,25 439 0,56 367 0,32 371 0,45 rozpozn. lekarskie zab_nerw lęk_depr adapt inne zab_nerw adapt inne adapt lęk_depr adapt zab_nerw inne zab_nerw neurast lęk_depr adapt adapt lęk_depr adapt adapt lęk_depr zab_nerw lęk_depr lęk_depr zab_nerw zab_nerw zab_nerw lęk_depr zab_nerw lęk_depr stan wykształ płeć wiek cywilny cenie m m k m k m m m m m k m m m m k k k k k k k m m m m k k m m 33 20 31 36 26 54 27 21 26 20 29 30 30 34 35 54 42 38 26 24 36 21 21 34 36 30 37 34 29 25 1 0 0 0 0 0 0 0 0 0 0 1 0 1 1 1 0 1 0 0 1 0 0 0 1 1 1 1 1 0 śz zz nw śz śz w śo zz śz śo p śo w zz śo śz śz śo nw zz w śo śz śo śo zz śo w śo śz Macierz danych– tablica pacjenci / zmienne Kody pacjentów Zmienne pierwszoplanowe (ze skal i kwestionariuszy) X1 X2 ... Xk Zmienne drugoplanowe (demograficzne, kategoryzujące, podsumowywujące) Xk+1 ... Xn P1 P2 . . . Pm Anna Wolińska-Welcz 8 Zmienne kwestionariuszowe pierwszoplanowe Skala I-E Rottera służy do pomiaru położenia na kontinuum od zgeneralizowanego poczucia kontroli zewnętrznej (External Locus of Control) do zgeneralizowanego poczucia kontroli wewnętrznej (Internal Locus of Control). Przyjmuje wartości od 0 do 23 (małe wartości skali wskazują na wewnętrznątrzsterowność, wysokie wyniki - na zewnątrzsterowność); Skala Bizonia metoda pomiaru poziomu neurotyczności wysoki pomiar skali oznacza nerwowość lub neurotyzm (wyniki tej skali muszą zostać przetransformowane do wymaganych wartości dodatnich) Anna Wolińska-Welcz 9 Koncepcja Rottera W naukach społecznych znana jest koncepcja podziału ludzi na wewnątrzsterownych – którzy kierują się w znacznie większym stopniu własnym systemem wartości i celami zaszczepionymi we wczesnych okresach życia (przez rodziców), zewnątrzsterownych - bardziej wrażliwych na wpływy ze strony innych osób (środki masowego przekazu, otoczenie, system szkolny, obowiązujące nakazy i zakazy, instrukcje, kary i nagrody). Osoby wewnątrzsterowne określane też jako o osoby o wewnętrznej lokalizacji ośrodka kontroli są bardziej odporne na wpływy społeczne i bardziej niezależne niż osoby zewnątrzsterowne – z zewnętrzną lokalizacją ośrodka poczucia kontroli. Anna Wolińska-Welcz 10 Zmienne kwestionariuszowe pierwszoplanowe – c.d. Podskale Kwestionariusza Objawowego Aleksandrowicza : zaburzenia lękowe i fobia depresja (zaburzenia dystymiczne) niepokój, napięcie zaburzenie hipochondryczne zaburzenia somatyczne zaburzenia histeryczne (konwersyjne) zaburzenia neurasteniczne psychastenia zaburzenia derealizacyjne natręctwa (zaburzenia obsesyjno-kompulsyjne) zaburzenia seksualne zaburzenia snu zakłócenia w relacjach społecznych 11 Zmienne kwestionariuszowe drugoplanowe o Suma „O” – suma podskal kwestionariusza Aleksandrowicza o Improvement – obserwowana względna poprawa objawowa o Zmienne demograficzne (płeć, wiek, stan cywilny, wykształcenie) o Wstępne rozpoznania lekarskie (w klasyfikacji ICD-10) a wśród nich najczęstsze: F 41 - zaburzenia depresyjne i lękowe F 43.2 - zaburzenia adaptacyjne F 48.0 - zaburzenia neurasteniczne F 48.9 - zaburzenia nerwicowe F 60.8 - zaburzenia osobowości 12 Eksploracja gradacyjna danych klinicznych Metody gradacyjne polegają na: równoczesnym przestawieniu w tablicy danych jej wierszy i kolumn w taki sposób, żeby w wynikowej tablicy cecha porządkująca wiersze była jak najsilniej dodatnio zależna od cechy porządkującej kolumny wyznaczeniu skupień wierszy i kolumn tak, żeby do tego samego należały zmienne i obiekty sąsiadujące ze sobą w uporządkowaniu gradacyjnym przedstawieniu otrzymanych danych w formie obrazu – mapy nadreprezentacji, będącej wykresem gęstości gradacyjnej (określającej rozkład gradacyjny na kwadracie jednostkowym, jego dystrybuanta bywa zwana kopułą). 13 Na czym polegają w praktyce metody gradacyjne? Metody gradacyjne polegają na: równoczesnym przestawieniu w tablicy danych jej wierszy i kolumn w taki sposób, żeby w wynikowej tablicy cecha porządkująca wiersze była jak najsilniej dodatnio zależna od cechy porządkującej kolumny wyznaczeniu skupień wierszy i kolumn tak, żeby do tego samego należały zmienne i obiekty sąsiadujące ze sobą w uporządkowaniu gradacyjnym przedstawieniu otrzymanych danych w formie obrazu – mapy nadreprezentacji, będącej wykresem gęstości gradacyjnej (określającej rozkład gradacyjny na kwadracie jednostkowym, jego dystrybuanta bywa zwana kopułą) Copula Based Models 14 Rotter I-E Rotter scale Bizoń scale depression B neurotyzm psychasthenia social difficulties fear niepokój sleep disorders sexual disorders społeczne hysteria psychastenia neurasthenia depresja anxiety neurastenia compulsions zab_snu zab_sex somatic symptoms histeria lękderealization hypochondria natręctwa somatyczne hipochondria derealizacja P78 P31 P57 P67 P64 P4 P54 P3 P18 P42 P5 P16 P38 P36 P17 P76 P15 P7 P70 P72 P2 P63 P26 P19 P53 P13 P55 P29 P39 P33 P47 P11 P75 P24 P44 P48 P32 P71 P1 P27 P78 P31 P74 P57 P67 P22 P73 P4 P14 P59 P5 P36 P16 P76 P69 P17 P51 P7 P2 P72 P70 P9 P46 P50 P66 P53 P55 P25 P39 P33 P47 P37 P12 P49 P44 P48 P77 P65 P1 P27 Mapa dla 80 leczonych pacjentów ρ*= 0,165 τ max = 0,110 regularność 0,44 P58 P68 P54 P52 P64 P6 P80 P3 P43 P42 P18 P23 P28 P38 P56 P41 P79 P60 P21 P15 P63 P20 P26 P19 P40 P62 P13 P29 P8 P30 P45 P10 P11 P75 P24 P34 P32 P61 P71 P35 P68 P58 P74 P52 P6 P73 P80 P22 P43 P14 P59 P23 P28 P56 P41 P69 P21 P51 P60 P79 P20 P46 P9 P62 P50 P40 P66 P25 P8 P30 P45 P10 P37 P12 P49 P34 P77 P61 P65 P35 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 15 Korelacja gradacyjna (grade correlation) Metody gradacyjne wiążą się z przekształcaniem jednej zmiennej przez odpowiednio wybraną dystrybuantę innej zmiennej Wskaźnik ρ* Spearmana zwanym korelacją gradacyjną mierzy siłę zależności monotonicznej pary zmiennych losowych (X, Y) w przypadku ciągłych zmiennych X i Y równy jest współczynnikowi korelacji corr ( FX(X), FY(Y ) ) dla zmiennych X i Y przekształconych przez swoje dystrybuanty innym (pokrewnym) gradacyjnym wskaźnikiem monotonicznej zależności jest τ Kendalla 16 I-E Rotter neurotyzm B depresja społeczne psychastenia niepokój neurastenia zab.snu zab.sex histeria lęk somatyczne derealizacja hipochondria natręctwa 80 rekordów pacjentów, 15 zmiennych ρ*max = 0,165 τ = 0,110 regularność 0,44 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 17 I-E Rotter neurotyzm B I-E Rotter zab.snu scale Bizoń niepokój histeria neurastenia społeczne depresja psychastenia zab.sex lęk depression somatyczne psychasthenia derealizacja social difficulties natręctwa hysteria anxiety fear sexual disord sleep disord neurasthenia compulsions somatic symptoms derealization hypochondria Mapa FIT 55×15 z podziałem na skupienia ρ*= 0,18 τmax= 0,12 regularność= 0,54 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 18 somatic symptoms I-E Rotter fear hypochondria Bizoń scale sleep disorders neurasthenia hysteria anxiety social difficulties compulsions sexual disorders psychasthenia depression derealization Mapa OUT 25×15 z podziałem na skupienia ρ*=0,21 τmax = 0,14 regularność = 0,45 Anna Wolińska-Welcz 19 FIT55-tau10kolor_Aggreg - 2008-11-10 numbers of patients %F60.8 %F48.9 %F48.0 %F43.2 %F41 education age % women % married % improvement sum of "O" I-E Rotter Bizoń scale depression psychasthenia social difficlties hysteria anxiety neurasthenia sleep disord sexual disord fear compulsions somatic symptoms hypochondria derealization Skupienia pacjentów w zbiorze FIT cluster1 19 28 171 23 62 12 21 39 39 30 20 28 31 77 10 520 27 47 47 35 3.5 20 47 20 0 33 15 cluster2 13 23 122 19 38 16 22 43 34 27 19 27 28 76 12.2431 10 55 64 34 3.9 36 0 18 27 45 11 cluster3 12 13 106 20 36 9 18 35 35 23 19 27 32 74 12.3385 11 64 50 30 3.6 14 21 7 50 36 14 cluster4 3 10 67 8 29 6 12 25 24 21 15 23 23 70 14.5267 16 67 80 33 3.5 27 7 FIT • • • • 2 40 13 15 12 18 116 17 42 10 18 35 33 25 18 26 28 74 12.2399 16 58 60 33 3.6 24 20 16 29 31 55 Skupienie1: pacjenci z najwyższą średnią sumą objawów nerwicowych, najwyższą derealizacją, hipochondrią, natręctwami, objawami somatycznymi, lękiem, raczej wewnątrzsterowni, najstarsi, dobrze rokujący w psychoterapii; Skupienie2: pacjenci z najwyższą średnią wartością zaburzeń seksualnych i neurastenii, ze zdiagnozowanymi zaburzeniami osobowości i zaburzeniami lękowo-depresyjnymi, najlepiej wykształceni; Skupienie3: pacjenci ze zdiagnozowanymi zaburzeniami nerwicowymi i osobowości, z najwyższymi średnimi objawami depresyjnymi; Skupienie4: zewnątrzsterowne kobiety, raczej zamężne, o niskim średnim poziomie objawów nerwicowych, ze zdiagnozowanymi najczęściej zaburze20 niami nerwicowymi (a także lękowymi i depresyjnymi?) Skupienia pacjentów w zbiorze OUT number of patients %F60.8 %F48.9 %F48.0 %F43.2 %F41 education age % married % women %improvement sum of "O" somatic symptoms I-E Rotter fear hypochondria Bizoń scale sleep disorders neurasthenia hysteria anxiety sexual disorders compulsions social psychasthenia depression derealization średnie dla wszystkich zmiennych pierwszo- i drugoplanowych w zagregowanych 3 skupieniach pacjentów odstających od trendu cluster1 11 32 26 18 15 6 26 19 30 12 58 13 24 5 47 278 5 14 14 26 3 43 14 0 29 29 7 cluster2 22 33 22 19 19 14 34 26 38 15 69 9 39 11 80 369 39 67 22 31 4.2 33 22 0 44 11 9 cluster3 5 17 17 14 10 7 20 21 27 14 66 17 46 12 119 331 19 89 44 35 3.3 33 11 11 33 44 9 OUT 13 27 21 17 15 9 26 22 32 13.5 65 13 37 9.7 85 330 22 60 28 31 3.6 36 16 4 36 28 25 • Skupienie1: młodzi, nieżonaci mężczyźni, silnie wewnątrzsterowni, z zaburzenia depresyjnymi i psychastenią, najgorzej rokujący w psychoterapii; • Skupienie2: pacjenci stanu wolnego, neurotyczni, ze zdiagnozowanymi zaburzeniami nerwicowymi, ze średnio najwyższą derealizacją, depresją i zaburzeniami seksualnymi, wykształceni, z najwyższą średnią poprawą; • Skupienie3: kobiety z zaburzeniami osobowości, wysokim lękiem oraz objawami somatycznymi. Anna Wolińska-Welcz 21 Gradacyjna analiza skupień i poszukiwanie głównego trendu w danych uzyskanych z diagnostycznych kwestionariuszy i skal stosowanych w praktyce klinicznej pozwala wyłonić ważne zmienne ukryte, wywierające silny wpływ na pozostałe. W przypadku pacjentów leczonych na oddziale nerwic psychoterapią kompleksową okazały się to: derealizacja, depresja, objawy somatyczne wartości skali I-E Rottera. W zbiorze FIT (zgodnym z zauważonym trendem), wartości skali Rottera są dodatnio zależne z depresją, a ujemnie z derealizacją i zaburzeniami somatycznymi. W zbiorze OUT wartości skali Rottera i nasilenia objawów somatycznych łączy zależność dodatnia, zaś Rottera z objawami derealizacyjnymi i depresyjnymi – ujemna. Anna Wolińska-Welcz 22 Wyniki przeprowadzonej eksploracji gradacyjnej zebranych danych wskazują na tendencję do: zewnątrzsterowności u kobiet mężatek z zaburzeniami nerwicowymi wewnątrzsterowności u osób samotnych z objawami depresyjnymi. Na przedstawionych mapach położenie zaburzeń lękowych i zaburzeń depresyjnych jest wzajemnie odległe, a kierunek zmian przeciwstawny, co wskazuje na ich niepodobieństwo pomimo ich łączenia w kategoriach ICD-10: F.41.2 zaburzenie depresyjne i lękowe - mieszane Anna Wolińska-Welcz 23 Wnioski płynące z analizy jednorodnych i regularnie uporządkowanych skupień pacjentów mogą być użyteczne: porównywaniu obrazu klinicznego pacjentów, uściślaniu rozpoznania kwalifikacji na określony rodzaj terapii, prognozowaniu jej skuteczności. w Analiza ta rzuca też nowe światło na powiązanie zaburzeń nerwicowych z zewnątrzsterownością i wewnątrzsterownością Anna Wolińska-Welcz 24 Korelacje rangowe skali Rottera i objawów nerwicowych zmienne drugoplanowe zmienne pierwszoplanowe objawy nerwicowe korelacje rangowe ze skalą Rottera Total 80 Fit 55 Out 25 objawy somatyczne 0,19 -0,15 0,59 lek i fobia 0,24 0,03 0,58 zaburzenia seksualne 0,28 0,15 0,51 histeria 0,28 0,04 0,46 neurastenia 0,13 0,00 0,35 niepokój 0,23 0,09 0,33 neurotyzm Bizonia 0,26 0,19 0,32 natręctwa 0,12 -0,05 0,31 depresja 0,18 0,11 0,28 zaburzenia snu 0,08 -0,14 0,25 % kobiet 0,30 0,19 0,58 wykształcenie względna poprawa objawowa 0,05 0,01 0,26 0,03 -0,04 0,31 sum of “O” subscales 0,27 -0,02 0.61 Anna Wolińska-Welcz 25 ρ*= 0,18 τ max = 0,12 regularność = 0,50 I-E Rotter social psychasthenia depression Bizoń scale neurasthenia anxiety sleep disorders sexual disorders derealization compulsions hysteria fear hypochondria somatic symptoms Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA dla 32 mężczyzn przed terapią (tylko 4 zewnątrzsterownych) 68 78 57 58 67 64 73 80 3 54 74 59 5 56 70 62 9 69 63 55 79 72 2 60 66 12 75 71 76 61 77 65 Anna Wolińska-Welcz 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 26 17 7 40 52 22 38 46 50 29 51 14 30 13 41 6 18 47 48 10 39 37 35 32 24 I-E Rotter hypochondria Bizoń scale fear somatic symptoms anxiety sleep disorders neurasthenia social psychasthenia derealization compulsions sexual disorders depression hysteria Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA dla 48 kobiet przed terapią ρ*= 0,15 τ max = 0,10 regularność = 0,41 31 36 26 42 28 43 23 16 45 15 19 33 25 20 44 53 8 4 21 49 34 27 11 1 Anna Wolińska-Welcz 1.61 1.55 1.48 1.42 1.37 1.31 1.26 1.21 1.16 1.11 1.07 1.03 0.98 0.95 0.91 0.87 0.84 0.8 0.77 0.74 0.71 0.68 0.65 0.63 0.6 27 Rozkład binormalny - regularny 28 Typowy schemat gradacyjnej analizy danych (realizowany w programie GradeStat) 1. Macierz danych 2. GCA 3. Regularność 4.GCCA • wartości nieujemne • brakujące dane usunięte lub uzupełnione • wybór zmiennych pierwszoplanowych • przekształcenie na rozkład gradacyjny • Gradacyjna Analiza Odpowiedniości uporządkowanie maksymalizujące kontrast między skrajnymi rekordami pacjentów oraz skrajnymi zmiennymi pierwszoplanowym • ocena regularności danych (pod kątem zależności monotonicznej) • rekordy zgodne z trendem: podpopulacja FIT • rekordy odstające: • Gradacyjna Analiza Skupień- podpopulacja • elementy FIT po GCA rozdzielane do zadanej liczby skupień • elementy OUT ponownie porządkowane przez GCA i analizowane OUT 29 Metody gradacyjne wykorzystywane są do: zlokalizowania i bezpośredniego poprawienia błędnych danych oraz uzupełnienia brakujących danych; dekompozycji zbioru danych na bardziej jednorodne podzbiory wyznaczenia głównych trendów i cech ukrytych struktury danych ; wyszukania elementów odstających (outlierów); dokonania uporządkowanej analizy skupień. http://gradestat.ipipan.waw.pl Kowalczyk, T., Pleszczyńska, E., Ruland, F. (red.). (2004). Grade Models and Methods for Data Analysis. With Applications for the Analysis of Data Populations. Seria: Studies in Fuzziness and Soft Computing, Vol. 151. Springer Verlag: Berlin Heidelberg New York. Książyk J., Matyja O., Pleszczyńska E., Wiech M. (2005). Analiza danych medycznych i demograficznych przy użyciu programu GradeStat. Instytut Podstaw Informatyki PAN, Instytut „Pomnik – Centrum Zdrowia Dziecka”, Warszawa. W przygotowaniu monografia: Recent Developments Concerning Models And Methods of Grade Data Analysis Elżbieta Pleszczyńska, Teresa Kowalczyk, Wiesław Szczesny, Marek Wiech, Aldona Sokołowska-Dunicz, Anna Wolińska-Welcz Zapraszamy na stronę programu: http://gradestat.ipipan.waw.pl o GradeStat do pobrania o Samouczek programu 33 Anna Wolińska-Welcz, Henryk Welcz: „Grade Approach to the Analysis of Questionnaires and Clinical Scales Data”, "Biocybernetics and Biomedical Engineering", Vol.29, No.2, 2009 Anna Wolińska-Welcz, Henryk Welcz: Grade approach to the analysis of questionnaires and clinical scales data, VII International Seminar on Statistics and Clinical Practice International Centre of Biocybernetics Warsaw 2008 . Anna Wolińska-Welcz: Zastosowanie gradacyjnej analizy skupień do danych uzyskanych z kwestionariuszy i skal klinicznych, Prace IPI PAN 1007, 2008 H.Welcz, Wewnątrzsterowność i zewnątrzsterowność a objawy nerwicowe, nieopublikowana rozprawa doktorska, Lublin 2002 34 Dziękuję za uwagę 35