dr Anna Wolińska-Welcz - Gradacyjna eksploracja danych klinicznych

Transkrypt

dr Anna Wolińska-Welcz - Gradacyjna eksploracja danych klinicznych
POLSKA GRUPA NARODOWA
MIĘDZYNARODOWEGO TOWARZYSTWA BIOSTATYSTYKI KLINICZNEJ
Gradacyjna eksploracja danych klinicznych
Grade Eksploration of Clinical Data
dr Anna Wolińska – Welcz (Lublin)
Kraków, 4.XII.2009
1
CZYM JEST EKSPLORACJA DANYCH?

„Nauka zajmująca się wydobywaniem informacji z
dużych zbiorów danych lub baz danych”
(D. Hand, H. Mannila, P. Smyt: Principles of Data Mining,
Cambridge, 2001)



data mining, zgłębianie danych, drążenie danych,
wydobywanie cennej wiedzy z danych
analiza danych pochodzących z obserwacji w celu
znalezienia nieoczekiwanych związków i oryginalne
podsumowanie danych w sposób przydatny dla ich
właściciela (globalne modele, lokalne wzorce)
Anna Wolińska-Welcz
2
Eksploracja danych a stereotypy



w tradycyjnym wnioskowaniu statystycznym –
dane traktuje się jako próbę otrzymaną z
domniemywanej populacji, na podstawie której to
próby wnioskuje się o owej populacji
(pomimo trudności ze spełnieniem warunków
nakładanych na sposób losowania próby oraz ze
sprecyzowaniem o jaką populację chodzi)
stereotyp traktujący dane jako takie lub inne próby
modele i metody eksploracji danych –
nie są ukierunkowane na poszukiwanie informacji
o populacji, a na poszukiwanie ukrytej struktury
danych
Anna Wolińska-Welcz
3
Gradacyjna analiza danych
• nowa gałąź szybko rozwijającego się obecnie
data-mining
• istotny krok na drodze do integracji teorii pomiaru,
analizy danych, statystyki i taksonomii
• metoda ukierunkowana na bardzo dobrą
wizualizację danych, w celu lepszego zrozumienia
ich ogólnej struktury
• wykorzystywana przy poszukiwaniu: ukrytych
struktur danych, trendów, bardziej jednorodnych
podpopulacji, elementów odstających (outlierów)
oraz uporządkowanych skupień.
4
•
Cel użycia metod gradacyjnych - zrozumieć dane,
odkryć prawdziwe, ukryte struktury w danych
•
rozkłady wielowymiarowe są reprezentowane
przez dwuwymiarowe macierze danych, które przy
pewnych założeniach można potraktować jako
tablice prawdopodobieństw
•
gradacyjna eksploracja pozwala wyłonić zmienne
objawowe wywierające silny wpływ na pozostałe
•
chociaż w praktyce trudno jest idealnie spełnić
wymagane założenia metody gradacyjne okazują
się zwykle odporne, by wykryć strukturę (model)
danych
5
Dane kliniczne wielowymiarowe
ze skal i kwestionariuszy psychologicznych

głównym celem ich eksploracji jest znalezienie
zależności między analizowanymi zmiennymi
(cechami, skalowanymi wartościami) a obserwowanymi
obiektami (pacjentami, przypadkami)

ważna jest też ich klarowna wizualizacja

rzadko można traktować je jako próbę losową
(a nie próbę możliwą, dostępną, dogodną)
pochodzącą z dobrze określonej populacji
(a nie populacji domniemywanej)
Anna Wolińska-Welcz
6
Tablica analizowanych danych klinicznych
cechy pierwszoplanowe
nr
pacjenta
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
KWESTIONARIUSZ OBJAWOWY "O" ALEKSANDROWICZA
lęk depresja niepokój
9
4
35
61
38
66
29
18
8
25
8
63
18
19
75
72
79
68
39
24
34
24
22
25
28
25
16
58
15
47
22
8
36
37
49
36
34
12
25
39
10
13
13
5
35
15
28
23
31
31
23
8
42
22
17
13
13
32
22
42
32
15
32
28
33
55
22
22
29
20
16
38
26
18
41
10
27
32
35
23
30
21
23
23
30
18
28
33
29
35
zab.
neura zab. derealisomaty
histeria
natręt. społ. hipoch. psych.
snu
stenia sex zacja
czne
5
20
24
0
0
0
12
4
21
58
4
15
0
0
16
4
11
8
5
32
16
30
46
7
13
17
26
17
33
129
27
24
53
11
12
56
28
18
36
106
28
30
46
0
24
7
24
5
33
48
30
34
56
20
27
41
26
38
34
167
17
23
21
5
5
25
19
9
25
77
20
18
34
5
14
4
0
14
13
167
0
8
28
0
4
8
12
16
29
32
0
27
26
11
24
23
22
28
38
39
21
17
20
8
0
4
21
21
12
119
21
23
12
8
8
17
4
32
21
132
14
0
33
12
4
8
13
0
8
23
4
15
14
0
14
19
7
15
8
93
13
31
48
0
12
22
14
42
26
122
28
12
41
0
5
0
0
25
18
171
19
28
38
0
0
4
22
42
23
161
0
12
40
0
29
12
14
7
7
55
19
31
38
8
0
22
0
20
26
55
4
9
32
5
5
4
20
4
16
77
9
29
37
4
46
19
20
0
16
84
0
14
0
0
8
8
23
0
0
61
17
8
30
23
0
7
18
14
17
13
19
25
50
14
8
21
16
28
21
116
25
23
33
8
12
21
17
4
9
93
18
20
13
0
0
21
8
4
21
64
13
29
50
16
7
14
18
28
31
119
22
27
41
12
16
16
5
14
22
142
28
23
37
12
8
13
16
32
17
116
4
21
29
16
17
26
20
24
16
74
cechy drugoplanowe
KWEST
KWEST
Bizonia
Rottera
14
-30
15
42
12
34
22
-2
-7
7
8
16
19
-22
39
46
20
20
30
2
30
-16
20
33
20
23
23
16
23
22
2
2
3
4
5
6
7
7
7
7
8
8
8
8
9
9
9
9
9
9
9
9
9
10
10
10
10
10
10
10
suma względna
poprawa
"O"
objawowa
207
0,34
122
-0,41
437
0,50
496
0,12
365
0,81
629
0,20
311
0,36
340
0,30
198
-0,30
323
-0,15
277
0,33
390
0,43
170
0,07
194
0,04
481
0,26
396
0,43
472
0,27
298
0,60
323
0,28
253
-0,38
351
0,31
167
0,38
234
-0,06
388
-0,24
320
0,43
226
-0,19
381
0,25
439
0,56
367
0,32
371
0,45
rozpozn.
lekarskie
zab_nerw
lęk_depr
adapt
inne
zab_nerw
adapt
inne
adapt
lęk_depr
adapt
zab_nerw
inne
zab_nerw
neurast
lęk_depr
adapt
adapt
lęk_depr
adapt
adapt
lęk_depr
zab_nerw
lęk_depr
lęk_depr
zab_nerw
zab_nerw
zab_nerw
lęk_depr
zab_nerw
lęk_depr
stan wykształ
płeć wiek cywilny cenie
m
m
k
m
k
m
m
m
m
m
k
m
m
m
m
k
k
k
k
k
k
k
m
m
m
m
k
k
m
m
33
20
31
36
26
54
27
21
26
20
29
30
30
34
35
54
42
38
26
24
36
21
21
34
36
30
37
34
29
25
1
0
0
0
0
0
0
0
0
0
0
1
0
1
1
1
0
1
0
0
1
0
0
0
1
1
1
1
1
0
śz
zz
nw
śz
śz
w
śo
zz
śz
śo
p
śo
w
zz
śo
śz
śz
śo
nw
zz
w
śo
śz
śo
śo
zz
śo
w
śo
śz
Macierz danych– tablica pacjenci / zmienne
Kody
pacjentów
Zmienne pierwszoplanowe
(ze skal i kwestionariuszy)
X1
X2
...
Xk
Zmienne drugoplanowe
(demograficzne,
kategoryzujące,
podsumowywujące)
Xk+1
...
Xn
P1
P2
.
.
.
Pm
Anna Wolińska-Welcz
8
Zmienne kwestionariuszowe pierwszoplanowe

Skala I-E Rottera służy do pomiaru położenia na kontinuum
od zgeneralizowanego poczucia kontroli zewnętrznej
(External Locus of Control) do zgeneralizowanego poczucia
kontroli wewnętrznej (Internal Locus of Control).
Przyjmuje wartości od 0 do 23 (małe wartości skali wskazują
na wewnętrznątrzsterowność, wysokie wyniki - na zewnątrzsterowność);

Skala Bizonia metoda pomiaru poziomu neurotyczności
wysoki pomiar skali oznacza nerwowość lub neurotyzm
(wyniki tej skali muszą zostać przetransformowane do
wymaganych wartości dodatnich)
Anna Wolińska-Welcz
9
Koncepcja Rottera
W naukach społecznych znana jest koncepcja podziału ludzi na
wewnątrzsterownych – którzy kierują się w znacznie
większym stopniu własnym systemem wartości i celami
zaszczepionymi we wczesnych okresach życia (przez rodziców),

zewnątrzsterownych - bardziej wrażliwych na wpływy
ze strony innych osób (środki masowego przekazu, otoczenie,
system szkolny, obowiązujące nakazy i zakazy, instrukcje,
kary i nagrody).

Osoby wewnątrzsterowne określane też jako o osoby
o wewnętrznej lokalizacji ośrodka kontroli są bardziej odporne
na wpływy społeczne i bardziej niezależne niż osoby zewnątrzsterowne – z zewnętrzną lokalizacją ośrodka poczucia kontroli.
Anna Wolińska-Welcz
10
Zmienne kwestionariuszowe pierwszoplanowe – c.d.

Podskale Kwestionariusza Objawowego Aleksandrowicza :

zaburzenia lękowe i fobia

depresja (zaburzenia dystymiczne)

niepokój, napięcie

zaburzenie hipochondryczne

zaburzenia somatyczne

zaburzenia histeryczne (konwersyjne)

zaburzenia neurasteniczne

psychastenia

zaburzenia derealizacyjne

natręctwa (zaburzenia obsesyjno-kompulsyjne)

zaburzenia seksualne

zaburzenia snu

zakłócenia w relacjach społecznych
11
Zmienne kwestionariuszowe drugoplanowe
o
Suma „O” – suma podskal kwestionariusza Aleksandrowicza
o
Improvement – obserwowana względna poprawa objawowa
o
Zmienne demograficzne (płeć, wiek, stan cywilny, wykształcenie)
o
Wstępne rozpoznania lekarskie (w klasyfikacji ICD-10)
a wśród nich najczęstsze:

F 41 - zaburzenia depresyjne i lękowe

F 43.2 - zaburzenia adaptacyjne

F 48.0 - zaburzenia neurasteniczne

F 48.9 - zaburzenia nerwicowe

F 60.8 - zaburzenia osobowości
12
Eksploracja gradacyjna danych klinicznych
Metody gradacyjne polegają na:
 równoczesnym przestawieniu w tablicy danych jej wierszy
i kolumn w taki sposób, żeby w wynikowej tablicy cecha
porządkująca wiersze była jak najsilniej dodatnio zależna
od cechy porządkującej kolumny
 wyznaczeniu skupień wierszy i kolumn tak, żeby do tego
samego należały zmienne i obiekty sąsiadujące ze sobą
w uporządkowaniu gradacyjnym
 przedstawieniu otrzymanych danych w formie obrazu –
mapy nadreprezentacji, będącej wykresem gęstości
gradacyjnej (określającej rozkład gradacyjny na kwadracie
jednostkowym, jego dystrybuanta bywa zwana kopułą).
13
Na czym polegają w praktyce metody gradacyjne?
Metody gradacyjne polegają na:

równoczesnym przestawieniu w tablicy danych jej wierszy
i kolumn w taki sposób, żeby w wynikowej tablicy cecha
porządkująca wiersze była jak najsilniej dodatnio zależna
od cechy porządkującej kolumny

wyznaczeniu skupień wierszy i kolumn tak, żeby do tego
samego należały zmienne i obiekty sąsiadujące ze sobą
w uporządkowaniu gradacyjnym

przedstawieniu otrzymanych danych w formie obrazu –
mapy nadreprezentacji, będącej wykresem gęstości
gradacyjnej (określającej rozkład gradacyjny na kwadracie
jednostkowym, jego dystrybuanta bywa zwana kopułą)
Copula Based Models
14
Rotter
I-E Rotter scale
Bizoń scale
depression
B
neurotyzm
psychasthenia
social difficulties
fear
niepokój
sleep disorders
sexual disorders
społeczne
hysteria
psychastenia
neurasthenia
depresja
anxiety
neurastenia
compulsions
zab_snu
zab_sex
somatic symptoms
histeria
lękderealization
hypochondria
natręctwa
somatyczne
hipochondria
derealizacja
P78
P31
P57
P67
P64
P4
P54
P3
P18
P42
P5
P16
P38
P36
P17
P76
P15
P7
P70
P72
P2
P63
P26
P19
P53
P13
P55
P29
P39
P33
P47
P11
P75
P24
P44
P48
P32
P71
P1
P27
P78
P31
P74
P57
P67
P22
P73
P4
P14
P59
P5
P36
P16
P76
P69
P17
P51
P7
P2
P72
P70
P9
P46
P50
P66
P53
P55
P25
P39
P33
P47
P37
P12
P49
P44
P48
P77
P65
P1
P27
Mapa dla 80 leczonych pacjentów
ρ*= 0,165
τ max = 0,110
regularność 0,44
P58
P68
P54
P52
P64
P6
P80
P3
P43
P42
P18
P23
P28
P38
P56
P41
P79
P60
P21
P15
P63
P20
P26
P19
P40
P62
P13
P29
P8
P30
P45
P10
P11
P75
P24
P34
P32
P61
P71
P35
P68
P58
P74
P52
P6
P73
P80
P22
P43
P14
P59
P23
P28
P56
P41
P69
P21
P51
P60
P79
P20
P46
P9
P62
P50
P40
P66
P25
P8
P30
P45
P10
P37
P12
P49
P34
P77
P61
P65
P35
1.61
1.55
1.48
1.42
1.37
1.31
1.26
1.21
1.16
1.11
1.07
1.03
0.98
0.95
0.91
0.87
0.84
0.8
0.77
0.74
0.71
0.68
0.65
0.63
0.6 15
Korelacja gradacyjna (grade correlation)
Metody gradacyjne wiążą się z przekształcaniem jednej
zmiennej przez odpowiednio wybraną dystrybuantę innej
zmiennej

Wskaźnik ρ* Spearmana zwanym korelacją gradacyjną
mierzy siłę zależności monotonicznej pary zmiennych
losowych (X, Y)

w przypadku ciągłych zmiennych X i Y równy jest
współczynnikowi korelacji corr ( FX(X), FY(Y ) )
dla zmiennych X i Y przekształconych przez swoje dystrybuanty

innym (pokrewnym) gradacyjnym wskaźnikiem monotonicznej
zależności jest τ Kendalla

16
I-E Rotter
neurotyzm B
depresja
społeczne
psychastenia
niepokój
neurastenia
zab.snu
zab.sex
histeria
lęk
somatyczne
derealizacja
hipochondria
natręctwa
80 rekordów pacjentów, 15 zmiennych
ρ*max = 0,165
τ = 0,110
regularność 0,44
1.61
1.55
1.48
1.42
1.37
1.31
1.26
1.21
1.16
1.11
1.07
1.03
0.98
0.95
0.91
0.87
0.84
0.8
0.77
0.74
0.71
0.68
0.65
0.63
0.6
17
I-E Rotter
neurotyzm B
I-E Rotter
zab.snu
scale
Bizoń
niepokój
histeria
neurastenia
społeczne
depresja
psychastenia
zab.sex
lęk
depression
somatyczne
psychasthenia
derealizacja
social difficulties
natręctwa
hysteria
anxiety
fear
sexual disord
sleep disord
neurasthenia
compulsions
somatic symptoms
derealization
hypochondria
Mapa FIT 55×15 z podziałem na skupienia
ρ*= 0,18
τmax= 0,12
regularność= 0,54
1.61
1.55
1.48
1.42
1.37
1.31
1.26
1.21
1.16
1.11
1.07
1.03
0.98
0.95
0.91
0.87
0.84
0.8
0.77
0.74
0.71
0.68
0.65
0.63
0.6 18
somatic symptoms
I-E Rotter
fear
hypochondria
Bizoń scale
sleep disorders
neurasthenia
hysteria
anxiety
social difficulties
compulsions
sexual disorders
psychasthenia
depression
derealization
Mapa OUT 25×15 z podziałem na skupienia
ρ*=0,21
τmax = 0,14
regularność = 0,45
Anna Wolińska-Welcz
19
FIT55-tau10kolor_Aggreg - 2008-11-10
numbers of patients
%F60.8
%F48.9
%F48.0
%F43.2
%F41
education
age
% women
% married
% improvement
sum of "O"
I-E Rotter
Bizoń scale
depression
psychasthenia
social difficlties
hysteria
anxiety
neurasthenia
sleep disord
sexual disord
fear
compulsions
somatic symptoms
hypochondria
derealization
Skupienia pacjentów w zbiorze FIT
cluster1
19 28 171 23 62 12 21 39 39 30 20 28 31 77 10 520 27 47 47 35 3.5 20 47 20 0 33 15
cluster2
13 23 122 19 38 16 22 43 34 27 19 27 28 76 12.2431 10 55 64 34 3.9 36 0 18 27 45 11
cluster3
12 13 106 20 36 9 18 35 35 23 19 27 32 74 12.3385 11 64 50 30 3.6 14 21 7 50 36 14
cluster4
3 10 67 8 29 6 12 25 24 21 15 23 23 70 14.5267 16 67 80 33 3.5 27 7
FIT
•
•
•
•
2 40 13 15
12 18 116 17 42 10 18 35 33 25 18 26 28 74 12.2399 16 58 60 33 3.6 24 20 16 29 31 55
Skupienie1: pacjenci z najwyższą średnią sumą objawów nerwicowych,
najwyższą derealizacją, hipochondrią, natręctwami, objawami somatycznymi,
lękiem, raczej wewnątrzsterowni, najstarsi, dobrze rokujący w psychoterapii;
Skupienie2: pacjenci z najwyższą średnią wartością zaburzeń seksualnych
i neurastenii, ze zdiagnozowanymi zaburzeniami osobowości i zaburzeniami
lękowo-depresyjnymi, najlepiej wykształceni;
Skupienie3: pacjenci ze zdiagnozowanymi zaburzeniami nerwicowymi
i osobowości, z najwyższymi średnimi objawami depresyjnymi;
Skupienie4: zewnątrzsterowne kobiety, raczej zamężne, o niskim średnim
poziomie objawów nerwicowych, ze zdiagnozowanymi najczęściej zaburze20
niami nerwicowymi (a także lękowymi i depresyjnymi?)
Skupienia pacjentów w zbiorze OUT
number of patients
%F60.8
%F48.9
%F48.0
%F43.2
%F41
education
age
% married
% women
%improvement
sum of "O"
somatic symptoms
I-E Rotter
fear
hypochondria
Bizoń scale
sleep disorders
neurasthenia
hysteria
anxiety
sexual disorders
compulsions
social
psychasthenia
depression
derealization
średnie dla wszystkich zmiennych pierwszo- i drugoplanowych
w zagregowanych 3 skupieniach pacjentów odstających od trendu
cluster1
11 32 26 18 15 6 26 19 30 12 58 13 24 5 47 278 5 14 14 26 3 43 14 0 29 29 7
cluster2
22 33 22 19 19 14 34 26 38 15 69 9 39 11 80 369 39 67 22 31 4.2 33 22 0 44 11 9
cluster3
5 17 17 14 10 7 20 21 27 14 66 17 46 12 119 331 19 89 44 35 3.3 33 11 11 33 44 9
OUT
13 27 21 17 15 9 26 22 32 13.5 65 13 37 9.7 85 330 22 60 28 31 3.6 36 16 4 36 28 25
•
Skupienie1: młodzi, nieżonaci mężczyźni, silnie wewnątrzsterowni,
z zaburzenia depresyjnymi i psychastenią, najgorzej rokujący w psychoterapii;
•
Skupienie2: pacjenci stanu wolnego, neurotyczni, ze zdiagnozowanymi
zaburzeniami nerwicowymi, ze średnio najwyższą derealizacją, depresją
i zaburzeniami seksualnymi, wykształceni, z najwyższą średnią poprawą;
•
Skupienie3: kobiety z zaburzeniami osobowości, wysokim lękiem oraz
objawami somatycznymi.
Anna Wolińska-Welcz
21
Gradacyjna analiza skupień i poszukiwanie głównego
trendu w danych uzyskanych z diagnostycznych
kwestionariuszy i skal stosowanych w praktyce klinicznej
pozwala wyłonić ważne zmienne ukryte, wywierające silny
wpływ na pozostałe.
 W przypadku pacjentów leczonych na oddziale nerwic
psychoterapią kompleksową okazały się to:
 derealizacja,
 depresja,
 objawy somatyczne
 wartości skali I-E Rottera.

W zbiorze FIT (zgodnym z zauważonym trendem), wartości
skali Rottera są dodatnio zależne z depresją, a ujemnie z
derealizacją i zaburzeniami somatycznymi.
 W zbiorze OUT wartości skali Rottera i nasilenia objawów
somatycznych łączy zależność dodatnia, zaś Rottera z
objawami derealizacyjnymi i depresyjnymi – ujemna.
Anna Wolińska-Welcz
22
Wyniki przeprowadzonej eksploracji gradacyjnej zebranych
danych wskazują na tendencję do:

zewnątrzsterowności u kobiet mężatek
z zaburzeniami nerwicowymi

wewnątrzsterowności u osób samotnych
z objawami depresyjnymi.
Na przedstawionych mapach położenie zaburzeń lękowych
i zaburzeń depresyjnych jest wzajemnie odległe, a kierunek
zmian przeciwstawny, co wskazuje na ich niepodobieństwo
pomimo ich łączenia w kategoriach ICD-10:
F.41.2 zaburzenie depresyjne i lękowe - mieszane
Anna Wolińska-Welcz
23
Wnioski płynące z analizy jednorodnych
i regularnie uporządkowanych skupień pacjentów
mogą być użyteczne:

porównywaniu obrazu klinicznego pacjentów,
uściślaniu rozpoznania
kwalifikacji na określony rodzaj terapii,
prognozowaniu jej skuteczności.
w

Analiza ta rzuca też nowe światło na powiązanie
zaburzeń nerwicowych z zewnątrzsterownością
i wewnątrzsterownością
Anna Wolińska-Welcz
24
Korelacje rangowe skali Rottera i objawów nerwicowych
zmienne
drugoplanowe
zmienne pierwszoplanowe
objawy nerwicowe
korelacje rangowe ze skalą Rottera
Total 80
Fit 55
Out 25
objawy somatyczne
0,19
-0,15
0,59
lek i fobia
0,24
0,03
0,58
zaburzenia seksualne
0,28
0,15
0,51
histeria
0,28
0,04
0,46
neurastenia
0,13
0,00
0,35
niepokój
0,23
0,09
0,33
neurotyzm Bizonia
0,26
0,19
0,32
natręctwa
0,12
-0,05
0,31
depresja
0,18
0,11
0,28
zaburzenia snu
0,08
-0,14
0,25
% kobiet
0,30
0,19
0,58
wykształcenie
względna poprawa
objawowa
0,05
0,01
0,26
0,03
-0,04
0,31
sum of “O” subscales
0,27
-0,02
0.61
Anna Wolińska-Welcz
25
ρ*= 0,18
τ max = 0,12
regularność = 0,50
I-E Rotter
social
psychasthenia
depression
Bizoń scale
neurasthenia
anxiety
sleep disorders
sexual disorders
derealization
compulsions
hysteria
fear
hypochondria
somatic symptoms
Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA
dla 32 mężczyzn przed terapią (tylko 4 zewnątrzsterownych)
68
78
57
58
67
64
73
80
3
54
74
59
5
56
70
62
9
69
63
55
79
72
2
60
66
12
75
71
76
61
77
65
Anna Wolińska-Welcz
1.61
1.55
1.48
1.42
1.37
1.31
1.26
1.21
1.16
1.11
1.07
1.03
0.98
0.95
0.91
0.87
0.84
0.8
0.77
0.74
0.71
0.68
0.65
0.63
0.6
26
17
7
40
52
22
38
46
50
29
51
14
30
13
41
6
18
47
48
10
39
37
35
32
24
I-E Rotter
hypochondria
Bizoń scale
fear
somatic symptoms
anxiety
sleep disorders
neurasthenia
social
psychasthenia
derealization
compulsions
sexual disorders
depression
hysteria
Mapa zaburzeń nerwicowych i LOC w uporządkowaniu po GCA
dla 48 kobiet przed terapią
ρ*= 0,15
τ max = 0,10
regularność = 0,41
31
36
26
42
28
43
23
16
45
15
19
33
25
20
44
53
8
4
21
49
34
27
11
1
Anna Wolińska-Welcz
1.61
1.55
1.48
1.42
1.37
1.31
1.26
1.21
1.16
1.11
1.07
1.03
0.98
0.95
0.91
0.87
0.84
0.8
0.77
0.74
0.71
0.68
0.65
0.63
0.6 27
Rozkład binormalny
- regularny
28
Typowy schemat gradacyjnej analizy danych
(realizowany w programie GradeStat)
1. Macierz danych
2. GCA
3. Regularność
4.GCCA
• wartości nieujemne
• brakujące dane
usunięte lub
uzupełnione
• wybór zmiennych
pierwszoplanowych
• przekształcenie
na rozkład
gradacyjny
• Gradacyjna Analiza
Odpowiedniości uporządkowanie
maksymalizujące
kontrast między
skrajnymi rekordami
pacjentów oraz
skrajnymi zmiennymi
pierwszoplanowym
• ocena
regularności
danych (pod
kątem zależności
monotonicznej)
• rekordy zgodne
z trendem:
podpopulacja FIT
• rekordy
odstające:
• Gradacyjna
Analiza Skupień-
podpopulacja
• elementy FIT po
GCA rozdzielane
do zadanej liczby
skupień
• elementy OUT
ponownie
porządkowane
przez GCA
i analizowane
OUT
29
Metody gradacyjne wykorzystywane są do:
 zlokalizowania i bezpośredniego poprawienia błędnych
danych oraz uzupełnienia brakujących danych;
 dekompozycji zbioru danych na bardziej jednorodne
podzbiory
 wyznaczenia głównych trendów i cech ukrytych
struktury danych ;
 wyszukania elementów odstających (outlierów);
 dokonania uporządkowanej analizy skupień.
http://gradestat.ipipan.waw.pl
 Kowalczyk, T., Pleszczyńska, E., Ruland, F. (red.). (2004). Grade
Models and Methods for Data Analysis. With Applications for the
Analysis of Data Populations. Seria: Studies in Fuzziness and Soft
Computing, Vol. 151. Springer Verlag: Berlin Heidelberg New York.
 Książyk J., Matyja O., Pleszczyńska E., Wiech M. (2005).
Analiza danych medycznych i demograficznych przy użyciu
programu GradeStat. Instytut Podstaw Informatyki PAN,
Instytut „Pomnik – Centrum Zdrowia Dziecka”, Warszawa.
W przygotowaniu monografia:
Recent Developments
Concerning Models And Methods
of Grade Data Analysis
Elżbieta Pleszczyńska, Teresa Kowalczyk, Wiesław Szczesny,
Marek Wiech, Aldona Sokołowska-Dunicz, Anna Wolińska-Welcz
Zapraszamy na stronę programu:
http://gradestat.ipipan.waw.pl
o
GradeStat do pobrania
o
Samouczek programu
33

Anna Wolińska-Welcz, Henryk Welcz: „Grade Approach to
the Analysis of Questionnaires and Clinical Scales Data”,
"Biocybernetics and Biomedical Engineering", Vol.29, No.2,
2009

Anna Wolińska-Welcz, Henryk Welcz: Grade approach to
the analysis of questionnaires and clinical scales data,
VII International Seminar on Statistics and Clinical Practice
International Centre of Biocybernetics Warsaw 2008 .

Anna Wolińska-Welcz: Zastosowanie gradacyjnej analizy
skupień do danych uzyskanych z kwestionariuszy i skal
klinicznych, Prace IPI PAN 1007, 2008

H.Welcz, Wewnątrzsterowność i zewnątrzsterowność a
objawy nerwicowe, nieopublikowana rozprawa doktorska,
Lublin 2002
34
Dziękuję za uwagę
35

Podobne dokumenty