AdAPTACjA MOdułu jAKOŚCI żyCIA EORTC QlQ

Transkrypt

AdAPTACjA MOdułu jAKOŚCI żyCIA EORTC QlQ
POLSKI
PRZEGLĄD CHIRURGICZNY
2011, 83, 9, 924–658
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla
polskich pacjentów z rakiem odbytnicy – wstępna ocena
trafności i rzetelności*
Adaptation of quality of life module EORTC QLQ-CR29 for polish
patients with rectal cancer – initial assessment of validity and
reliability
Wojciech Nowak1, Beata Tobiasz-Adamczyk2, Piotr Brzyski2, Jerzy
Sałówka1, Dagmara Kuliś3, Piotr Richter1
Z III Katedry Chirurgii Ogólnej CM UJ w Krakowie1
(3 Department of General Surgery Collegium Medicum Jagiellonian University in Cracow)
Kierownik: prof. dr hab. W. Nowak
Z Katedry Epidemiologii i Medycyny Zapobiegawczej CM UJ w Krakowie2
(Chair of Epidemiology and Preventive Medicine Collegium Medicum Jagiellonian University in
Cracow)
Kierownik: prof. dr hab. B. Adamczyk-Tobiasz
Grupa Jakości Życia Europejskiej Organizacji Badań i Leczenia Nowotworów3
(Quality of Life Department, European Organization for Research and Treatment of Cancer.
rd
Jakość życia warunkowana stanem zdrowia jest ważnym obiektem zainteresowania w praktyce klinicznej, zorientowanej na ocenę skutków leczenia z perspektywy pacjenta, ze szczególnym uwzględnieniem wpływu zastosowanego leczenia na jego codzienne funkcjonowanie. Pomiar jakości życia
wymaga stosowania trafnych i rzetelnych narzędzi. Celem pracy było przedstawienie procedury
walidacji najnowszej wersji modułu EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy.
Materiał i metodyka. Moduł EORTC QLQ-CR29 składa się z 29 pytań i został zaadaptowany do
polskich warunków kulturowych na podstawie procedury EORTC. Uzyskane od 20 pacjentów odpowiedzi przeanalizowano pod kątem zgodności z teoretyczną oraz empiryczną strukturą skali. Dokonano oceny trafności zbieżnej i dyskryminacyjnej pytań należących do modułu za pomocą skalowania
metodą wielu cech.
Rzetelność oszacowano za pomocą współczynnika alpha Cronbacha. Oszacowano trafność w aspekcie
różnic międzygrupowych, porównując grupy pacjentów ze stomią oraz bez stomii oraz kobiety i mężczyzn. Wykorzystano dokładny test Manna i Whitney’a. Jako istotne statystycznie traktowano różnice, dla których wartości p<0,05.
Wyniki. Skale zbudowane na podstawie empirycznego modelu modułu charakteryzowały się wyższą
trafnością i rzetelnością niż skale zbudowane na modelu teoretycznym.
Nie zaobserwowano istotnych różnic między kobietami i mężczyznami w przeciętnym poziomie jakości
życia. Zaobserwowano istotnie wyższe przeciętne wartości skali obrazu ciała oraz pytania dotyczącego
nietrzymania gazów u pacjentów bez stomii. Odwrotną tendencję zaobserwowano w przypadku pytań
dotyczących bólów brzucha i pośladków, oraz zażenowania z powodu częstości wypróżnień.
Wnioski. Moduł jest trafnym i rzetelnym narzędziem dającym możliwość ujednolicenia pomiarów
efektów leczenia, zalecanym do stosowania jako standardowe narzędzie służące pomiarowi wpływu
samej choroby oraz zastosowanego leczenia na jakość życia pacjentów z nowotworem odbytnicy.
Słowa kluczowe: nowotwór odbytnicy, jakość życia warunkowana stanem zdrowia, EORTC QLQCR29, trafność, rzetelność
* Źródło sponsorowania (grant); projekt statutowy CM UJ: K/ZDS/001486 / Source of funding (grant); Statutory Project CM UJ: K/ZDS/001486
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
925
trafności i rzetelności
Heath related quality of life has been an important object of interest in the clinical practice, focused
on assessment of treatment effects from patient’s point of view, with particular emphasis placed on
effect of treatment on daily patient functioning. Concept of health-related quality of life needs valid
and reliable instruments.
The aim of the study was to present the process of validation of a new version of EORTC QLQ-CR29
module in Polish patients suffering from rectal cancer.
Material and methods. EORTC QLQ-CR29 module comprises 29 questions, and was adapted to
Polish cultural conditions based on EORTC procedure. Data collected from 20 patients were analyzed,
their agreement with theoretical and empirical structure was assessed. Convergent and discriminant
validity were analyzed with multi trait scaling.
Reliability was assessed with Cronbach alpha coefficient. Known group validity was assessed in terms
of differences between men and women, and between stoma and non-stoma patients. Exact MannWhitney test was used. P values lower than 0.05 were considered significant.
Results. Scales built on bases of empirical model of module had higher validity and reliability than
those based on theoretical model.
There were no significant differences between men and women in health-related quality of life. Significantly higher values were observed in non-stoma patients on body image scale and for leakage of
stool item. Reversed relationship was observed in case of abdominal and buttocks pain, as well as
embarrassment because of bowel movements.
Conclusions. Module CR29 is a valid and reliable tool, which enables standardized measurement of
treatment effects, suggested for use as main tool measuring impact of disease itself and applied treatment on health-related quality of life of rectal cancer patients.
Key words: rectal cancer, health-related quality of life, EORTC QLQ-CR29, validity, reliability
Jakość życia warunkowana stanem zdrowia
(HRQoL) staje się ostatnio coraz ważniejszym
obiektem zainteresowania nie tylko badaczy,
ale także lekarzy-praktyków mających bezpośredni kontakt z pacjentem. Przebieg choroby,
a w szczególności ocena skutków leczenia
z perspektywy pacjenta, to coraz istotniejsze
elementy brane pod uwagę w prowadzonych
formach terapii, zwłaszcza w chorobach nowotworowych (1-8).
Standardem pomiarowym w przypadku
chorób nowotworowych są skale autorstwa
Grupy Jakości Życia (Quality of Life Group),
działającej w ramach organizacji EORTC (European Organisation for Research and Treatment of Cancer), których bazę stanowi kwestionariusz podstawowy QLQ-C30, stosowany
w odniesieniu do dowolnej lokalizacji nowotworu, często używany również w badaniach nad
jakością życia pacjentów z rakiem odbytnicy
(2-5, 9, 10, 11). Dla określonych lokalizacji
nowotworu Grupa Jakości Życia EORTC opracowuje moduły specyficzne, stosowane zawsze
w połączeniu z kwestionariuszem C30. Dla
nowotworu odbytnicy przeznaczony jest moduł
CR29, będący następcą opracowanego w 1999
roku, używanego w wielu badaniach, modułu
CR38 (4, 12, 13, 14). Z modułu CR38 usunięto
pytania, które w toku dotychczasowego użytkowania okazały się nie spełniać wystarczają-
Adaptation of quality of life module EORTC
QLQ-CR29 for polish patients with rectal cancer – initial assessment of validity and reliability
Health-related quality of life (HRQoL)
has recently become an increasingly important
subject of interest not only for researchers, but
also for clinicians that have direct contact with
patients. Disease progression, and in particular assessment of treatment effects from the
patient’s perspective, are increasingly important items that are considered in view of
therapies, in particular in malignancies
(1-8).
Scales prepared by Quality of Life Group,
a division of EORTC (European Organization
for Research and Treatment of Cancer), are a
standard instrument used in malignancies.
They are based on a basic QLQ-C30 questionnaire used for any malignancy location, often
used in studies of quality of life of patients with
rectal cancer (2-5, 9, 10, 11). Quality of Life
Group of EORTC prepares specific modules for
particular malignancy locations, used always
in combination with C30 questionnaire. CR29
module that superseded CR38 module, prepared in 1999 and used in multiple studies,
was intended for rectal cancer (4, 12, 13, 14).
Questions were removed from CR38 module
that proved not sufficiently useful: related to
926
W. Nowak i wsp.
co dobrze swojej roli: dotyczyły bardzo rzadkich
lub mniej ważnych (w ocenie autorów prac
wykorzystujących ten moduł) problemów,
a w zamian uzupełniono go kilkoma dodatkowymi pytaniami (12). Obecnie istniejąca wersja modułu (nr 2.1) została zwalidowana jedynie na próbie pacjentów z krajów Europy Zachodniej, Tajwanu i USA (15).
W języku polskim moduł CR29 dostępny był
do tej pory w wersji nr 1, jednak przeprowadzony przegląd publikacji nie potwierdził prac
opisujących badania z jego użyciem. Różnice
między nowszą a starszą wersją modułu dotyczą głównie drobnych różnic w sformułowaniu
kilku pytań o objawy niezależne od zastosowania stomii oraz odmiennego sformułowania
pytań odnoszących się do różnych problemów
związanych z oddawaniem stolca skierowanych do pacjentów, u których zastosowano
stomię oraz pacjentów bez stomii, co w rezultacie pociągnęło za sobą zmianę kolejności
pytań w module.
Wykorzystanie ujednoliconego, wystandaryzowanego narzędzia pomiarowego w różnych
warunkach kulturowych i w odniesieniu do
różnych działań terapeutycznych daje możliwość porównania wyników różnych badań oraz
uwidocznia różnice w postrzeganiu własnej
jakości życia związane nie tylko z uwarunkowaniami klinicznymi, ale także kulturowymi.
Zastosowanie skali pomiarowej w warunkach
innych niż te, w których skala została opracowana (inny język, inne znaczenia kulturowe
i sensy nadawane tym samym terminom, inny
wiek pacjentów etc.), wymaga przeprowadzenia procesu adaptacji językowo-kulturowej,
która obejmuje proces tłumaczenia pytań należących do skali na język docelowy, testowania
nowego tłumaczenia na pacjentach, oraz weryfikacji właściwości pomiarowych nowo otrzymanego narzędzia – tzw. walidacji. Ponieważ
skale są przeznaczone do samodzielnego wypełnienia przez chorych, pytania powinny być
sformułowane w taki sposób, aby były zrozumiałe przez ogół badanych oraz by trafnie
oddawały to, co jest przedmiotem pomiaru.
Z drugiej strony, powinny być sformułowane
w sposób zachowujący w maksymalnym możliwym stopniu znaczenie pytań w oryginalnej
wersji językowej skali, a także ich właściwości
pomiarowe.
Niniejsza praca przedstawia procedurę
walidacji najnowszej wersji modułu CR29 dla
very rare or less important problems (according to authors that used this module). On the
other hand, a few questions were added (12).
The current module version (2.1) was validated only in a sample of patients from the
Western Europe, Taiwan and USA (15).
Polish version 1 of CD29 module was previously available however literature review did
not demonstrate publication of any studies
with this module. Differences between new
and older version of the module mainly relate
to slight differences in the text of several questions about symptoms not related to stoma and
differences in questions related to various
problems related to bowel movements, for
patients with stoma and without stoma, resulting in change of order of questions in the
module.
Use of a unified, standardized instrument
in various cultural environments and in relation to different therapeutic activities enables
comparison of results of various studies and
demonstrated differences in perception of own
quality of life related not only to clinical circumstances but also cultural ones. For the
measurement scale to be used under different
conditions that it was initially intended for
(another language, other cultural meaning
related to the same phrases, different patient
age, etc), it must undergo the process of language and cultural adaptation involving translation of questions to the target language,
testing of this new translation in patients and
verification of measuring utility of newly obtained tool – so called validation. Since scales
are to be completed by patients themselves,
questions should be understandable for the
study subjects and should accurately refer to
the object of the measurement. On the other
hand, they should, as much as possible, maintain the original meaning of the question and
its measuring properties.
This paper presents a procedure of validation of the most recent CR29 module for Polish
rectal cancer patients and a preliminary assessment of its validity and reliability.
Material and methods
CR29 module comprises 29 questions related to intensity of certain problems during
the past week, numbered from 31 to 59 (since
this module is used in association with QLQC30 questionnaire, its questions being num-
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
927
trafności i rzetelności
polskich pacjentów z rakiem odbytnicy oraz
wstępną ocenę jego trafności i rzetelności.
Materiał i metodyka
Moduł CR29 składa się z 29 pytań dotyczących nasilenia pewnych problemów w ciągu
ostatniego tygodnia, ponumerowanych od 31
do 59 (gdyż moduł stosuje się wraz z kwestionariuszem QLQ-C30, którego pytania są numerowane od 1 do 30), z których każde posiada czterostopniową skalę odpowiedzi (skala
Likerta): 1. Wcale, 2. Trochę, 3. Znacznie, 4.
Bardzo; z wyjątkiem pytania 48 o stosowanie
stomii, gdzie wybrać można między odpowiedzią „tak” lub „nie”. Pytania 49 do 54 sformułowane są w różny sposób dla pacjentów ze
stomią oraz bez stomii, pytanie 55 zaś dotyczy
tylko pacjentów ze stomią. Treść pytań przedstawia tab. 1.
Procedura
Moduł CR29 został zaadaptowany do polskich warunków kulturowych na podstawie
procedury tłumaczeniowej EORTC (16):
1) koordynator tłumaczenia (pracownik Działu Jakości Życia EORTC) porównał anglojęzyczne wersje modułu CR29: najnowszą
oraz wcześniejsze, a następnie pytania,
które w identycznym brzmieniu istniały
w poprzednich wersjach angielskich, zostały automatycznie włączone do polskiej wersji 2.1;
2) pozostałe pytania zostały przetłumaczone
na język polski przez dwóch niezależnych
tłumaczy, Polaków władających biegle językiem angielskim. Z powstałych w ten sposób
dwóch tłumaczeń w trakcie dyskusji między
tłumaczami oraz koordynatorem procesu
adaptacji została utworzona ujednolicona
polska wersja wstępna modułu CR29;
3) ujednolicona polska wersja została następnie
przetłumaczona wstecz (ang. back translation) na język angielski przez dwóch niezależnych tłumaczy, których językiem ojczystym
jest język angielski i którzy biegle mówią po
polsku. Powstałe wersje tłumaczenia wstecznego zostały porównane przez koordynatora
procesu z oryginalną wersją modułu w celu
sprawdzenia czy wersja polska odzwierciedla
odpowiednio angielski oryginał;
4) wobec braku różnic w znaczeniu pytań między tłumaczeniem wstecznym modułu
bered from 1 to 30). Any question has a fourpoint answer scale (Likert scale): 1. Not at all,
2. A little, 3. Quite a bit, 4. Very much, with
the exception of question 48 related to use of
stoma where an answer has to be either “yes”
or “no”. Questions 49 to 54 differ for the patients with and without stoma, while question
55 is only for the stoma patients. The questions
are included in tab. 1.
Procedure
CR29 module was adapter to Polish cultural conditions basing on the EORTC translation procedure (16):
1) The translation coordinator (an employee
of Quality of Life Division, EORTC) compared English versions of CR29 module: the
most recent and previous versions and then
automatically included in the Polish version
2.1 questions that were identical in previous English versions;
2) The remaining questions were translated
into Polish by two independent Polish native speakers who had a high level of fluency in English. An unified preliminary Polish
version of CR29 module was prepared from
these two translations in the process of discussion between the translators and the
adaptation process coordinator;
3) The unified Polish version was then backtranslated into English by two independent
English native speakers who had a high
level of fluency in Polish. The two obtained
back translations were then compared by
the process coordinator with an original
version of the module to check if the Polish
version accurately reflected the English
original version;
4) Since no differences in the meaning of the
questions were fund between the back
translation of the module and the original
version, the Polish version underwent a
pilot study in a sample of 20 rectal cancer
patients: 10 males and 10 females, while 5
persons of each gender had a stoma. The
study subjects were asked if the questions
were understandable to them, if they were
clear and if the words used were easy and
proper, if the questions were not too intruding, embarrassing, overwhelming or irritating. They were also asked if the set of
answers to any question is understandable,
unequivocal and if they posed any problems
928
W. Nowak i wsp.
Tabela 1. Problemy zdrowotne ujęte w pytaniach należących do modułu EORTC QLQ-CR29
Table 1. Health problems referred to in questions included in the EORTC QLQ-CR29 module
31.Częste oddawanie moczu w ciągu dnia / frequent urination during the day
32.Częste oddawanie moczu w ciągu nocy / frequent urination during the night
33.Nietrzymanie moczu / urinary incontinence
34.Bóle podczas oddawania moczu / pain upon urination
35.Bóle brzucha / abdominal pain
36.Bóle pośladków/okolicy krocza/odbytu / pain in the buttocks/anal area/rectum
37.Uczucie wzdęcia brzucha / bloated feeling in the abdomen
38.Krew w stolcu / blood in the stool
39.Śluz w stolcu / mucus in the stool
40.Suchość w ustach / dry mouth
41.Wypadanie włosów w efekcie zastosowanego leczenia / hair loss as a result of the treatment
42.Problemy ze zmysłem smaku / problems with the sense of taste
43.Martwienie się o swoje zdrowie w przyszłości / worrying about the health in the future
44.Martwienie się swoją wagą / worrying about own weight
45.Poczucie mniejszej atrakcyjności z powodu choroby lub leczenia / feeling of reduced attractiveness as a result of
the disease or treatment
46.Poczucie mniejszej męskości/kobiecości z powodu choroby lub leczenia / feeling less masculine/feminine as
a result of the disease or treatment
47.Niezadowolenie z własnego ciała / dissatisfaction with own body
48.Stosowanie worka stomijnego (kolostomijnego/ileostomijnego) / use of stoma bag (colostomy/ileostomy)
49.Niekontrolowane oddawanie gazów/wiatrów / unintentional release of gas/flatulence
50.Niekontrolowane oddawanie stolca/kału / uncontrolled leakage of stool/feces
51.Podrażnienie skóry wokół stomii/odbytu / irritation of skin around the stoma/anus
52.Częste zmiany worka stomijnego w ciągu dnia/częste oddawanie stolca w ciągu dnia / frequent changes of stoma
bag during the day/ frequent bowel movements during the day
53.Częste zmiany worka stomijnego w ciągu nocy/częste oddawanie stolca w ciągu nocy / frequent changes of stoma
bag during the night/ frequent bowel movements during the night
54.Zakłopotanie z powodu stomii/zakłopotanie z powodu częstości wypróżnień / embarrassment because of the
stoma/embarrassment because of frequency of bowel movements
55.Problemy w pielęgnacji stomii (tylko dla pacjentów ze stomią) / problems with caring for the stoma (only for
patients with a stoma)
56.Zainteresowanie seksem (tylko dla mężczyzn) / interest in sex (only for men)
57.Problemy z osiągnięciem lub utrzymaniem wzwodu / problems with getting or maintaining an erection
58.Zainteresowanie seksem (tylko dla kobiet) / interest in sex (only for women)
59.Ból lub dyskomfort w czasie stosunku / pain or discomfort during an intercourse
Użycie skali wymaga każdorazowego otrzymania zgody Grupy Jakości Życia EORTC / Any use of this scale requires approval of
Quality of Life Group EORTC.
a oryginałem przetłumaczoną na język polski wersję modułu poddano badaniu pilotażowemu na próbie 20 pacjentów z rakiem
odbytnicy: 10 mężczyzn i 10 kobiet, przy
czym po 5 osób każdej płci posiadało stomię.
Badane osoby pytano, czy tak sformułowane pytania są dla nich zrozumiałe, czy sens
pytania jest jasno ujęty i czy użyte słownictwo nie jest zbyt trudne lub niewłaściwe,
czy pytania nie są natarczywe, nie wprawiają w zakłopotanie, zawstydzenie lub
zdenerwowanie. Pytano także, czy przygotowane zestawy odpowiedzi na każde pytanie są zrozumiałe, jednoznaczne i nie sprawiają trudności w wyborze właściwej dla
pacjenta opcji. Gdy pacjenci zgłaszali jakieś
with selecting the right option. If patient
reported any concerns, they were asked to
suggest an alternative question or set of
answers. Report from the pilot study was
then sent to Quality of Life Division,
EORTC and was analyzed by the translation coordinator. After approval of results
of the pilot study, the translation process
was considered completed and the translation was considered final.
After completion of translation process of
the module, Polish version of CR29 module
was validated basing on validation procedure
conducted by EORTC in a sample of colorectal
cancer patients from Western Europe, Taiwan
and USA (15). Answers provided by these 20
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
929
trafności i rzetelności
zastrzeżenia, proszono ich o alternatywną
propozycję sformułowania pytania lub zestawu odpowiedzi. Raport z badania pilotażowego został następnie przesłany do Działu Jakości Życia EORTC i przeanalizowany
przez koordynatora tłumaczenia. Po zaakceptowaniu wyników badania pilotażowego
proces tłumaczenia został uznany za zakończony, a wersja tłumaczenia za końcową.
Po zakończeniu procesu tłumaczenia kwestionariusza wykonano walidację polskiej wersji modułu CR29 na podstawie procedury walidacyjnej przeprowadzonej przez EORTC na
próbie pacjentów z rakiem jelita grubego z krajów Europy Zachodniej, Tajwanu i USA (15).
Uzyskane od wspomnianych 20 pacjentów odpowiedzi przeanalizowano pod kątem zgodności
z teoretyczną strukturą skali, zakładającą istnienie w strukturze modułu sześciu skal składających się z następujących pytań: skala wydalania moczu – pytania 31, 32 i 33; skala bólów
brzucha – pytania 34, 35 i 36; skala problemów
z wydalaniem stolca – pytania 38, 39, 52 i 53;
skala lęku – pytania 43 i 44; skala nietrzymania
stolca – pytania 49 i 50; skala obrazu ciała –
pytania 45, 46 i 47; oraz 11 pojedynczych pytań
mierzących inne wymiary jakości życia pacjentów z rakiem odbytnicy (15).
Ponieważ w trakcie walidacji modułu CR29
na próbie europejskiej stwierdzono niskie właściwości psychometryczne skal zbudowanych
w oparciu o model teoretyczny modułu, jego
twórcy zdefiniowali nowe skale na podstawie
empirycznych rozkładów pytań wchodzących
w jego skład. Zdefiniowali cztery skale: skala
częstości wydalania moczu powstała ze skali
wydalania moczu przez usunięcie pytania 33;
skala problemów z wydalaniem stolca została
podzielona na dwie skale: skalę występowania
krwi i śluzu w stolcu (pytania 38 i 39) oraz
skalę częstości wydalania stolca (pytania 52
i 53); natomiast skala obrazu ciała pozostała
niezmieniona w stosunku do oryginalnej wersji, opartej na modelu teoretycznym modułu
(15). W związku z tym przeanalizowano zgodność polskiej adaptacji modułu z modelem
empirycznym, oceniając trafność i rzetelność
skal zdefiniowanych w ten sposób.
Metody walidacji modułu
Walidacja polskiej wersji modułu oznacza
przeanalizowanie w możliwie szerokim zakresie jego właściwości psychometrycznych w pol-
patients were analyzed for their conformity
with the theoretical scale structure: the module comprised six scales including the following questions: urination scale – questions 31,
32, and 33; abdominal pain scale – questions
34, 25, and 36; bowel movement problems
scale – questions 38, 39, 52, and 53; anxiety
scale – questions 43 and 44; stool incontinence
scale – questions 49 and 50; body image scale
– questions 45, 46, and 47; and 11 single questions to measure other dimensions of quality
of life of rectal cancer patients (15).
Since validation of CR29 module in a European sample demonstrated poor psychometric
properties of scales based on the theoretical
module model, its creators defined new scales
based on empirical distribution of questions.
They defined four scales: frequency of urination scale was formed from the urination scale
by removal of question 33; the bowel movement
problems scale was divided into two scales:
stool blood and mucus scale (questions 38 and
39) and frequency of bowel movements scale
(questions 52 and 53); while body image scale
remained unchanged versus the original versions, based on the theoretical module model
(15). Therefore, conformity of Polish module
adaptation with an empirical model was analyzed and validity and reliability of these scales
were assessed.
Module validation methods
Validation of Polish module version involves
an extensive analysis of its psychometric properties in Polish conditions. Such analysis answers to the following questions:
a) Is a scale accurate, i.e. if it measured the
parameters that it was designed to measure,
b) Is a scale reliable, i.e. if it precisely reflects
different values of measured variables.
Reliability most often is measured in the
aspect of internal consistency – this term defines a degree to which scale variables measure
the same variable. Cronbach alpha coefficient
is the most common measure of this internal
consistency. It is calculated on the basis of
mean correlation between questions comprising a scale – if it is higher than 0.7, it is considered adequate to be used in intergroup
comparisons (17, 18).
A scale validity is analyzed in a few aspects:
930
W. Nowak i wsp.
skich warunkach. Analiza taka udziela odpowiedzi na pytanie:
a) czy skala jest trafna, tzn. czy mierzy te
zmienne, do pomiaru których została zaprojektowana,
b) czy skala jest rzetelna, tzn. jak dokładnie
oddaje zróżnicowanie wartości mierzonych
zmiennych.
Rzetelność najczęściej mierzy się w aspekcie
wewnętrznej spójności – terminem tym określa
się stopień, w jakim zmienne tworzące skalę
mierzą tę samą zmienną. Najczęściej używaną
miarą wewnętrznej spójności skali jest współczynnik alfa Cronbacha, obliczany na podstawie wartości średniej korelacji między pytaniami należącymi do skali – jeśli jest ona
wyższa niż 0,7 uważa się, że jest wystarczająca do dokonywania za pomocą ocenianej skali
porównań międzygrupowych (17, 18).
Trafność skali analizuje się w kilku aspektach:
a) kryterialnym, czyli zgodności wyników skali z wynikami innego kryterium służącego
do oceny tej samej zmiennej. Kryterium tym
może być inna skala, ale najlepiej aby
w przypadku badań nad jakością życia była
tym kryterium diagnoza medyczna lub ocena kompetentnego panelu ekspertów;
b) treściowym, czyli homogeniczności treściowej pytań tworzących skalę – pytania tworzące skalę mają stanowić reprezentatywną
próbę dla zbioru wszystkich pytań, które
można traktować jako potencjalne wskaźniki zmiennych ukrytych mierzonych przez
skalę;
c) teoretycznym, czyli związku między pytaniami zawartymi w skali a zmiennymi
teoretycznymi przez nią mierzonymi – jeżeli skala mierzy kilka zmiennych (jest skalą
wielowymiarową), grupy pytań mierzących
tę samą zmienną powinny silniej korelować
ze sobą niż z pytaniami mierzącymi inne
zmienne. Oceny tej dokonuje się na podstawie analizy macierzy korelacji między
zmiennymi tworzącymi skalę oraz wyników
analizy czynnikowej. Ten aspekt obejmuje
także analizę różnic międzygrupowych,
polegającą na ocenie czy skala odzwierciedla
prawidłowo obserwowane różnice w jakości
życia między grupami pacjentów o różnej
charakterystyce klinicznej, w różnym wieku, różnej płci itp. W ramach trafności
teoretycznej mówi się także o aspekcie
zbieżnym (ang. convergent validity) i różni-
a) criterional, i.e. conformity of a scale results
with results of another criterion used to
measure the same variable. This criterion
may involve another scale but preferably a
medical diagnosis or evaluation of a competent expert panel is this criterion in quality
of life studies;
b) substantial, i.e. homogeneity of contents of
a scale comprising questions – questions
that comprise a scale should be a representative sample for the set of all questions
that could be used as potential indices of
unknown variables measured by this scale;
c) theoretical, i.e. correlation between questions that comprise a scale and theoretical
variables measured by it – if a scale measures several variables (is a multidimensional
scale), groups of questions that measure the
same variable should demonstrate stronger
correlation with each other that with questions that measure other variables. This
assessment is made on the basis of analysis
of correlation matrices between variables
that form a scale and results of factorial
analysis. This aspect also involves analysis
of intergroup differences, involving an assessment if a scale reflects true differences
in quality of life between patient groups
with different clinical characteristics, at
different ages, genders, etc. Theoretical
validity also includes convergent validity
and discriminant validity of validity: a scale (and individual questions) should demonstrate stronger correlation with scales
(variables) that measure the same unknown
variable (convergent validity) than with
scales (variables) that measure different
unknown variables (discriminant validity)
(19).
Multi-trait scaling was used to assess theoretical validity of the model using evaluation
of convergent validity and discriminant validity of questions comprising the module. Convergent validity was defined as the strength
of correlation between a question and a scale
that it was included in basing on theoretical
considerations. A question was considered to
meet this validity aspect if its correlation with
and overall scale result after correction of
overlap was at least 0.40. Correction of overlap
was done by calculating correlation of a question with and overall result for the other questions of this scale (i.e. the question was ex-
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
931
trafności i rzetelności
cowym (ang. discriminant validity) trafności: skala (jak i pojedyncze pytania) powinna korelować silniej ze skalami (zmiennymi)
mierzącymi tę samą zmienną ukrytą (aspekt
zbieżny) niż ze skalami (zmiennymi) mierzącymi inne zmienne ukryte (aspekt różnicowy) (19).
Aby ocenić trafność teoretyczną modułu,
dokonano oceny trafności zbieżnej i dyskryminacyjnej pytań należących do modułu za pomocą skalowania metodą wielu cech (multitrait scalling). Trafność zbieżną pytania zdefiniowano jako wysokość korelacji między pytaniem a skalą, do której na podstawie teoretycznych rozważań pytanie zostało włączone.
Uznawano, że pytanie spełnia ten aspekt trafności, jeśli jego korelacja z sumarycznym wynikiem skali po dokonaniu korekty na pokrywanie (pokrywanie się zakresu pomiaru, ang.
correction for overlap) wynosi co najmniej 0,40.
Korekty na pokrywanie dokonano przez obliczenie korelacji danego pytania z sumarycznym wynikiem pozostałych pytań skali (czyli
wykluczając z sumarycznego wyniku skali
dane pytanie). Uznawano, że pytanie skali
spełnia aspekt trafności różnicowej, jeżeli jego
korelacja ze skalą, do której zostało zaliczone
na podstawie rozważań teoretycznych, po
uwzględnieniu korekty na pokrywanie, jest
wyższa niż z pozostałymi skalami modułu
(15).
W odniesieniu do skal zdefiniowanych według empirycznej (powstałej w oparciu o obserwowane między pytaniami skali korelacje)
struktury skali oszacowano trafność w aspekcie różnic międzygrupowych, tzn. porównano
grupy pacjentów różniących się klinicznie
w aspektach mierzonych przez skale oraz pytania modułu (ang. groups differences lub
known group validity) (15,19). W przypadku
modułu CR29 ten aspekt trafności został przeanalizowany przez porównanie wyników pacjentów ze stomią oraz bez stomii.
Rozkłady poszczególnych skal oraz pojedynczych pozycji modułu opisano za pomocą
mediany i kwartyli po przeskalowaniu wszystkich skal oraz pojedynczych pytań na jednolity zakres od 0 do 100. Różnice w rozkładach
pomiędzy kobietami i mężczyznami oraz pomiędzy pacjentami ze stomią i bez stomii
analizowano za pomocą dokładnego testu
Manna i Whitney’a. Jako istotne statystycznie
traktowano różnice, dla których wartości
p<0,05.
cluded from the overall result of the scale). A
question was considered to meet a discriminant validity aspect if its correlation with a
scale that it was included in, after correction
of overlap, was higher than with other scales
of the module (15).
With regard to scales defined according to
empirical (based on correlations observed between a scale questions) scale structure, validity was estimated with respect to intergroup
difference, i.e. groups differences or known
group validity (15, 19). This aspect of validity
for CR29 module was analyzed by comparing
results of patients with and without a stoma.
Distribution of individual scales and module
items was reported with medians and quartiles
after re-scaling all scales and individual questions to a uniform range from 0 to 100. Differences in distribution between women and men
and between patients with and without a
stoma were analyzed with an exact MannWhitney test. P < 0.05 was considered statistically significant.
Results
Validity and reliability of scales build
according to a theoretical module model
A body image scale had the highest reliability of all scales based on a theoretical
model, although reliability of this scale was
lower than 0.7 in both subgroups (patients with
and without a stoma); this value is considered
sufficient for the scale to be used in intergroup
comparisons. Reliability of urinary incontinence scale and stool incontinence scale was
higher in patients without a stoma, while was
close to this value in stoma patients and in the
whole study group. Reliability of the anxiety
scale is close to 0.7 in a subgroup of stoma
patients and in the whole study group. Reliability of the other scales did not reach this
value in any of samples and reliability coefficients were also negative, indicating serious
problems with their internal consistency (tab.
2).
Table 3 presents convergent aspect (correlation between a question and an overall result
of a scale that it was included in, after correction of overlap) and discriminant aspect (correlation between a question and results of
scales that it was not included in) of validity
of scales defined on a basis of theoretical CR29
932
W. Nowak i wsp.
Wyniki
Trafność i rzetelność skal zbudowanych
według modelu teoretycznego modułu
Spośród skal opartych na modelu teoretycznym modułu najwyższą rzetelnością charakteryzowała się skala obrazu ciała, choć w obu
podpróbach (pacjentów ze stomią oraz bez
stomii) rzetelność skali była niższa niż 0,7,
która to wartość jest uważana za wystarczającą, aby skalę można było wykorzystywać do
porównań międzygrupowych. Nieco inaczej
przedstawia się rzetelność skal nietrzymania
moczu oraz nietrzymania stolca, których rzetelność była wyższa w próbie pacjentów bez
stomii, zaś była bliska tej wartości w próbie
pacjentów ze stomią oraz przy uwzględnieniu
ogółem wszystkich pacjentów. Rzetelność skali lęku jest bliska wartości 0,7 w podpróbie
pacjentów ze stomią oraz w całej próbie. Rzetelność pozostałych skal nie osiąga tej wartości
w żadnej z prób, a wartości współczynników
rzetelności przyjmują nawet negatywne wartości, co wskazuje na poważne problemy dotyczące ich spójności wewnętrznej (tab. 2).
Trafność skal zdefiniowanych na podstawie
modelu teoretycznego modułu CR29 w aspekcie zbieżnym (korelacja pytania z wynikiem
sumarycznym skali, do której należy, po korekcie na pokrywanie) i różnicowym (korelacje
pytania z wynikami skal, do których pytanie
nie należy) przedstawia tab. 3. Spośród skal
zdefiniowanych według modelu teoretycznego
modułu pytania należące do skal: wydalania
moczu, nietrzymania kału oraz obrazu ciała,
korelują silniej z wynikiem sumarycznym
skali, do której należą niż z wynikami innych
skal, gdy rozpatrujemy pacjentów ze stomią
i bez stomii razem. W próbie pacjentów ze
stomią jedno pytanie ze skali nietrzymania
kału oraz jedno ze skali lęku silniej koreluje
z wynikiem innej skali niż wynikiem suma-
module model. Questions included in the
scales: urination, stool incontinence and body
image correlated stronger with an overall result of a scale they were included in that with
results of other scales, in combined patients
with and without a stoma. One question from
the stool incontinence scale and one question
from the anxiety scale correlated stronger with
results of another scale than with an overall
result of a scale that it was included in. Such
situation applied to a single question from the
stool incontinence scale in a subgroup of patients without a stoma. Most of the questions
from other scales demonstrated clearly better
correlation with results of other scales than
with an overall result of a scale that they were
included in).
Validity and reliability of scales build
according to an empirical module model
Reliability of scales defined according to
empirical distribution of variables comprising
the module is mainly satisfactory: reliability
of the bowel movement frequency scale in a
subgroup of patients without a stoma (alpha
= 0.75) and in both subgroups combined (alpha
= 0.74) had reliability over 0.7. Scale reliability could not be estimated in a subgroup of
patients with a stoma due to lack of differentiation of answers to a question related to
frequency of changes of a stoma bag at night.
Reliability of urination frequency scale both
in a subgroup of patients with a stoma (alpha
= 0.69) and without a stoma and in both these
subgroups combined (in both cases alpha =
0.66) was close to 0.7. Reliability of bowel
movements problem scale could not be estimated since all answers provided identical
answers to one of its questions, related to a
presence of blood in the stool. Body image according to both models (theoretical and em-
Tabela 2. Rzetelność skal utworzonych według modelu teoretycznego modułu CR29
Table 2. Reliability of scales defined by a theoretical CR29 module
Skala / pacjenci / Scale/patients
Nietrzymanie moczu / urinary incontinence
Bóle brzucha / abdominal pain
Problemy z wydalaniem / problems with bowel movements
Nietrzymanie stolca / stool incontinence
Lęk / anxiety
Obraz ciała / body image
Ogółem / Total
0,68
0,27
0,30
0,64
0,63
0,83
Ze stomią /
With a stoma
0,66
-0,49
0,28
0,69
0,68
0,63
Bez Stomil /
Without a stoma
0,72
0,20
-0,10
0,81
0,00
0,55
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
933
trafności i rzetelności
Tabela 3. Trafność skal utworzonych według modelu teoretycznego modułu CR29 w aspekcie zbieżnym
i różnicowym
Table 3. Accuracy of scales defined by a theoretical CR29 module: convergent and discriminant aspects
Skala / aspekt trafności /
Scale\accuracy aspect
Wydalanie moczu /
urination
Bóle brzucha / abdominal
pain
Problemy ze stolcem/
problems with bowel
movements
Nietrzymanie kału / stool
incontinence
Lęk / anxiety
Obraz ciała / body image
Ogółem / Total
zbieżny /
różnicowy /
convergent discriminant
0,44-0,59
0,47-0,68
Pacjenci bez stomii
zbieżny /
różnicowy /
convergent discriminant
-0,60-0,77
-0,39-0,42
-0,25-0,32
-0,20-0,41
-0,48-0,53
-0,48-0,42
-0,25
-0,55-0,81
-0,08-0,35
-0,36-0,25
-0,48-0,73
-0,35-0,45
0,17
-0,32-0,49
0,48
0,57-0,82
-0,57-0,53
-0,21-0,45
0,41-0,58
-0,28-0,44
0,48
0,66-0,75
0
0,39
-0,32-0,47
-0,36-0,84
-0,54-0,45
-0,54-0,42
0,55
0,49
-0,55-0,48
-0,80-0,45
rycznym skali, do której należy. W próbie pacjentów bez stomii sytuacja taka dotyczy jednego pytania ze skali nietrzymania kału.
W przypadku pozostałych skal większość pytań
koreluje wyraźnie silniej z wynikami innych
skal niż z wynikiem sumarycznym skali, do
której te pytania należą.
Trafność i rzetelność skal zbudowanych
według modelu empirycznego modułu
Rzetelność skal zdefiniowanych według
empirycznych rozkładów zmiennych tworzących moduł jest w dużej części zadowalająca:
rzetelność skali częstości wydalania stolca
w próbie pacjentów bez stomii (alfa=0,75) oraz
w obu próbach łącznie (alfa=0,74) osiągnęła
rzetelność wyższą niż poziom 0,7. W próbie
pacjentów ze stomią nie udało się oszacować
rzetelności skali ze względu na brak zróżnicowania odpowiedzi na pytanie dotyczące
częstości zmian worka stomijnego w nocy.
Rzetelność skali częstości wydalania moczu
zarówno w próbie pacjentów ze stomią (alfa=0,69), jak i bez stomii oraz w obu próbach
łącznie (w obu przypadkach alfa=0,66) była
bliska wartości 0,7. Rzetelności skali problemów z wydaleniem nie udało się oszacować,
gdyż na jedno z jej pytań, dotyczące obecności
krwi w stolcu, wszyscy pacjenci odpowiadali
identycznie. Skala obrazu ciała według obu
modeli (teoretycznego i empirycznego) posiada tę samą budowę, więc jej rzetelność jest
identyczna z wynikami przedstawionymi
wcześniej: alfa=0,63 w próbie pacjentów ze
stomią, alfa=0,55 w próbie pacjentów bez
Pacjenci ze stomią
zbieżny /
różnicowy /
convergent discriminant
0,37-0,61
-0,55-0,64
piric) has the same structure and therefore its
reliability is identical as presented before:
alpha = 0.63 for a subgroup of patients with a
stoma, alpha = 0.55 for a subgroup of patients
without a stoma and alpha = 0.83 for both
subgroups combined.
Table 4 presents convergent aspect and
discriminant aspect of validity of scales defined
on a basis of empirical distribution of variables
comprising the CR29 module. For urination
frequency and body image scales, questions
comprising individual scales were found to
correlate closer with an overall result of their
own scale (after correction of overlap) than
with results of other scales, in a subgroup of
patients with a stoma and in the whole study
group. The bowel movement frequency scale
met this condition in a subgroup of patients
without a stoma and in the whole study group.
Convergent aspect of validity of this scale could
not be estimated in a subgroup of patients with
a stoma since all patients provided the same
answer to a question related to frequency of
changes of a stoma bag at night. Convergent
aspect of validity of blood and mucus in the
stool scale, with relation to questions about a
presence of blood in the stool, could not be
estimated for the same reason.
Analysis of inter-group differences
No differences were found between females
and males in average (median) values for individual scales and individual questions to
measure other dimensions of quality of life of
rectal cancer patients.
934
W. Nowak i wsp.
stomii oraz alfa=0,83 w obu próbach analizowanych łącznie.
Trafność w aspekcie zbieżnym i różnicowym
skal utworzonych na podstawie empirycznych
rozkładów zmiennych tworzących moduł CR29
przedstawia tab. 4. W przypadku skali częstości wydalania moczu oraz skali obrazu ciała
stwierdzono, że pytania tworzące poszczególne
skale korelują silniej z wynikiem sumarycznym własnej skali (po uwzględnieniu poprawki na pokrywanie) niż z wynikami innych skal
w próbie pacjentów ze stomią oraz gdy rozpatruje się wszystkich pacjentów razem. Skala
częstości wydalania stolca spełnia powyższy
warunek w próbie pacjentów bez stomii oraz
przy rozpatrywaniu wszystkich pacjentów
łącznie. W przypadku tej skali w próbie pacjentów ze stomią nie udało się oszacować trafności
zbieżnej tej skali, gdyż na pytanie dotyczące
częstości zmiany worka stomijnego w ciągu
nocy wszyscy pacjenci odpowiadali jednakowo.
Podobnie, z tego samego powodu, w odniesieniu do pytań o obecność krwi w stolcu nie
udało się oszacować zbieżnej trafności skali
obecności krwi i śluzu w stolcu.
Analiza różnic międzygrupowych
Nie zaobserwowano istotnych różnic między
kobietami i mężczyznami w przeciętnych wartościach (medianach) poszczególnych skal oraz
pojedynczych pytań mierzących pozostałe wymiary jakości życia pacjentów z rakiem odbytnicy.
Zaobserwowano istotne statystycznie różnice między pacjentami ze stomią oraz bez
stomii w przeciętnych wartościach skali obra-
Significant differences were found between
patients with a stoma and without a stoma in
average values for the body image scale and
questions related to gas incontinence – results
were higher in patients without a stoma. However, an opposite tendency was observed for
questions related to abdominal and buttock
pain and embarrassment due to frequency of
bowel movements.
Discussion
This paper presents results of analysis of
validity and reliability of EORTC CR29 module
that is used to measure quality of life of rectal
cancer patients. Its version 2.1, adapted for
Polish patients, was analyzed. Scales defined
on empirical distribution of questions comprising a module are characterized by much
better psychometric properties (validity and
reliability) than those defined by a theoretical
model. Almost all of them had reliability
higher or close to 0.7 that is considered sufficient for the scale to be used for inter-group
comparisons. Such values were obtained when
all study group was analyzed as well as patients with and without a stoma were analyzed separately. The body image scale is the
only exception: its reliability in a subgroup of
patients with a stoma was 0.53, while reliability of bowel movements scale in a subgroup of patients with a stoma and bowel
movement problems scale could not be estimated in any subgroup due to identical answers provided by patients to a question asking
for frequency of changes of a stoma bag at night
(bowel movements scale) and presence of blood
Tabela 4. Aspekt zbieżny i różnicowy trafności skal utworzonych według rozkładów empirycznych pytań tworzących
moduł CR29
Table 4. Convergent and discriminant aspect of accuracy of scales defined by empirical distribution of questions
comprising the CR29 module
Ogółem / Total
Pacjenci bez stomii
zbieżny /
różnicowy /
zbieżny /
zbieżny /
convergent discriminant convergent
convergent
Częstość wydalania moczu 0,50
0,50
-0,60-0,57
-0,23-0,36
/ frequency of urination
Częstość wydalania stolca 0,59
0,62
-0,48-0,51
-0,12-0,34
/ frequency of bowel
movements
Krew i śluz w stolcu /
–
–
-0,30-0,04
-0,12-0,17
blood and mucus in the
stool
Obraz ciała / body image 0,66-0,75
0,33-0,75
0,00-0,61
-0,11-0,25
Skala / aspekt trafności /
Scale\accuracy aspect
Pacjenci ze stomią
różnicowy /
zbieżny /
discriminant convergent
0,54
-0,09-0,53
–
0,05-0,49
–
0,16-0,16
0,69-0,73
-0,51-0,30
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
935
trafności i rzetelności
zu ciała oraz pytania dotyczącego nietrzymania
gazów – wyniki były wyższe u pacjentów bez
stomii. Natomiast odwrotną tendencję zaobserwowano w przypadku pytań dotyczących
bólów brzucha i pośladków oraz zażenowania
z powodu częstości wypróżnień.
Omówienie
W niniejszej pracy przedstawiono wyniki
analizy trafności i rzetelności modułu EORTC
CR29, służącego do pomiaru jakości życia pacjentów z rakiem odbytnicy. Przeanalizowano
go w wersji 2.1 po zaadaptowaniu go na potrzeby polskich pacjentów. Skale powstałe na
podstawie empirycznych rozkładów pytań
tworzących moduł charakteryzują się znacznie
lepszymi właściwościami psychometrycznymi
(trafnością i rzetelnością) niż te zbudowane na
modelu teoretycznym. Niemal wszystkie osiągnęły rzetelność wyższą lub bardzo bliską
wartości 0,7, którą uznaje się za wystarczającą, aby skalę można było użyć do porównań
międzygrupowych. Wartości takie otrzymano
zarówno gdy analizowano wszystkich pacjentów łącznie, jak i wtedy gdy analizowano pacjentów ze stomią oraz bez stomii niezależnie
od siebie. Jedynym wyjątkiem jest skala obrazu własnego ciała, której rzetelność w próbie
pacjentów ze stomią wyniosła 0,53, natomiast
rzetelności skali wydalania stolca w próbie
pacjentów ze stomią oraz skali problemów
z wydalaniem w każdej z prób nie udało się
oszacować ze względu na brak zróżnicowania
odpowiedzi udzielonych na pytania o częstość
zmian woreczka stomijnego w nocy (skala
wydalania stolca) oraz o obecność krwi w stolcu (skala problemów z wydalaniem).
Zaprezentowane w niniejszej pracy wyniki
w dużej mierze potwierdziły rezultaty otrzymane przez autorów modułu w trakcie badań
prowadzonych na europejskiej próbie walidacyjnej. W prezentowanych badaniach w przypadku skali obrazu ciała otrzymano rzetelność
niemal równą tej otrzymanej w europejskim
badaniu walidacyjnym (alfa równe 0,83 vs
0,84) w próbie pacjentów ze stomią i bez stomii
łącznie, podczas gdy wartości współczynnika
rzetelności otrzymane w obu próbach osobno
okazały się wyraźnie niższe niż w próbie europejskiej (alfa poniżej 0,65 vs alfa wyższe niż
0,81). W przypadku skali częstości wydalania
moczu otrzymane rzetelności były niższe (od
0,66 do 0,69) niż oszacowano w walidacyjnym
in the stool (bowel movement problems
scale).
Results presented in this paper largely
confirmed results obtained by the authors of
this module during its validation in a European sample. The body scale image was characterized by almost the same reliability as
obtained in the European validation study
(alpha = 0.83 vs. 0.84) in combined subgroups
of patients with and without a stoma, while
reliability coefficient in both groups was markedly lower than in the European sample (alpha
below 0.65 vs. alpha higher than 0.81). Reliability of the urination frequency scale was
lower (from 0.66 to 0.69) than reliability estimated in the validation study conducted by
EORTC (from 0.71 to 0.80), while reliability of
bowel movement frequency scale was even
higher than in the European sample: alpha
was 0.74 in both subgroups combined and 0.75
in a subgroup of patients without a stoma
versus 0.66 for patients without a stoma, 0.70
in both subgroups combined and 0.78 for patients with a stoma, in the validation study of
the original version of the module. Reliability
of bowel movement problems scale in this
study could not be estimated due to lack of
variability of one of the two variables comprising the scale, while the European validation
of this module indicated moderate reliability
of this scale: alpha from 0.54 to 0.72 (15).
Inability to estimate reliability of bowel
movement problems scale stemmed from the
fact that questions comprising this scale related to problems that occur in patients that
await surgical treatment, while the validation
population comprised only patients who have
undergone surgical treatment. In such patients
these problems are sporadic and are mainly
caused by other factors, unrelated to rectal
cancer. It is difficult to explain why there was
no variability in answers regarding changes of
a stoma bag at night.
Negative values of Cronbach alpha coefficient for the scales defined by the theoretical
module model, indicate negative correlations
between questions that comprise a scale. This
results from mutual exclusion of problems
defined by questions comprising a scale: high
frequency of one problem is accompanied by
low frequency of another problem and vice
versa. Cronbach alpha coefficient would be
high, indicating high reliability of quality of
life scale based on medical symptoms, if such
936
W. Nowak i wsp.
badaniu przeprowadzonym przez EORTC (od
0,71 do 0,80), podczas gdy rzetelność skali
częstości wydalania stolca okazała się nawet
wyższa niż w próbie europejskiej: alfa była
równa 0,74 w obu próbach łącznie oraz 0,75
w próbie pacjentów bez stomii, podczas gdy
w badaniu walidacyjnym wersji oryginalnej
modułu wartości te wynosiły od 0,66 u pacjentów bez stomii, 0,70 w obu próbach łącznie oraz
0,78 w próbie pacjentów ze stomią. Rzetelności
skali problemów z wydalaniem w prezentowanym badaniu nie udało się oszacować ze względu na brak zmienności jednej z dwóch zmiennych tworzących skalę, podczas gdy walidacja
europejska modułu wskazała na umiarkowaną
rzetelność tej skali: alfa od 0,54 do 0,72 (15).
Niemożność oszacowania rzetelności skali
problemów z wydalaniem wyniknęła z faktu,
iż wchodzące w jej skład pytania dotyczą problemów występujących głównie u pacjentów,
którzy dopiero oczekują na leczenie chirurgiczne, podczas gdy próba walidacyjna składała
się wyłącznie z pacjentów, którzy już przeszli
ten etap leczenia – u pacjentów tych problemy,
których dotyczą te pytania, występują sporadycznie i w większości są spowodowane innymi
przyczynami, niezależącymi od nowotworu
odbytnicy. Trudno jest natomiast wytłumaczyć, dlaczego zmienna dotycząca wymiany
worka stomijnego w nocy nie wykazywała
zmienności.
Osiąganie przez współczynnik rzetelności
alpha Cronbacha negatywnych wartości, które można było zaobserwować w przypadku
skal zbudowanych w oparciu o model teoretyczny modułu, jest spowodowane występowaniem negatywnych korelacji między pytaniami tworzącymi skalę, co wynika z wzajemnego wykluczania się problemów opisywanych
przez pytania w niej zawarte: wysokiej częstości występowania jednego z nich towarzyszy niska częstość innego oraz odwrotnie. Aby
współczynnik alfa Cronbacha osiągnął wysoką wartość, która wskazywałaby na wysoką
rzetelność skali jakości życia opartej na pytaniach dotyczących somatycznych symptomów
choroby, skala musi zawierać pytania dotyczące symptomów częściej ze sobą współwystępujących. Zaobserwowana sytuacja wskazuje na to, że w procesie konstrukcji skali
jakości życia nie zawsze można oprzeć się na
treściowym podobieństwie pytań, gdyż w sytuacji, gdy dotyczą one symptomów somatycznych o różnym tle fizjologicznym, nie musi to
scale comprised questions asking for symptoms
that coexist more often. This situation indicates that in the process of construction of
quality of life scales it is not always possible
to base on similarity of question contents since
if they relate to medical problems of various
etiologies, this does not necessarily translate
into high psychosomatic parameters.
Analysis of convergent and discriminant
validity also demonstrated, as in the study by
EORTC, better psychometric properties of
scales defined by empirical data than by a
theoretical model. Correlation coefficients
defining a convergent aspect of validity are
similar in both samples, however in Polish
study, in the body image scale in a subgroup
of patient without a stoma, some questions
correlate with an overall result of their own
scale at 0.33 level (while this is over 0.50 for
the other scales), while correlations for this
scale are higher than 0.61 in the European
study. Correlation coefficients defining a discriminant aspect of validity are slightly
higher than in studies conducted in the European validation sample. In these studies,
correlation between individual questions and
results of scales that these questions were not
included in, did not exceed 0.25 for the urination scale and 0.38 for the bowel movement
problems scale, while for the other scales
these correlations were below 0.49 (15). Correlation coefficients defining a discriminant
aspect of validity in the Polish sample did not
exceed 0.17 only for the bowel movement
problems scale, while they even reached 0.61
for the other scales. These results indicate
that problems measured by questions included in different scales coexist more often
in the Polish sample, which does not negate
theoretical validity of the module and its
scales.
Seven of 29 indices of quality of life of rectal
cancer patients of CR29 module are different
for patients that use stoma bag versus those
that do not use it, but they are included in a
separate parts of the module. It additionally
includes questions regarding symptoms occurring mainly in the preoperative period, while
they are not specific for the colorectal cancer
in the postoperative period, as well as questions related to used treatment method and
questions intended for patients receiving chemotherapy: about hair loss and taste disturbances (tab. 5, 6).
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
937
trafności i rzetelności
przekładać się na wysokie parametry psychometryczne.
Analiza trafności zbieżnej i różnicowej (dyskryminacyjnej) również wykazała, podobnie
jak w przypadku badania przeprowadzonego
przez EORTC, lepsze właściwości psychometryczne skal zbudowanych na podstawie danych empirycznych niż na modelu teoretycznym. Wartości współczynników korelacji opisujące aspekt zbieżny trafności mają podobną
wielkość w obu próbach, jednak w polskim
badaniu w przypadku skali obrazu ciała w pró-
Despite these shortcomings, set of questions
included in CR29 module reflects the core of
the research problem that is effect of the colorectal cancer on health related quality of life.
Polish translation of this module is accurate
and reliable tool that enables unification of
measurements of treatment effects, recommended for use as a standardized tool to measure effect of the disease and its treatment on
quality of life of rectal cancer patients.
Tabela 5. Porównanie przeciętnych wartości skal i pojedynczych pytań zawartych w module CR29 miedzy kobietami
i mężczyznami
Table 5. Comparison of average values of scales and individual questions included in the CR29 module between
females and males
Częstość wydalania moczu / frequency of urination
Częstość wydalania stolca / frequency of bowel
movements
Krew i śluz w stolcu / blood and mucus in the stool
Obraz ciała / body image
Nietrzymanie moczu / urinary incontinence
Bóle podczas oddawania moczu / pain upon urination
Bóle brzucha / abdominal pain
Bóle pośladków/okolicy krocza/odbytu / pain in the
buttocks/anal area/rectum
Uczucie wzdęcia brzucha / bloated feeling in the
abdomen
Suchość w ustach / dry mouth
Wypadanie włosów / hair loss
Problemy ze zmysłem smaku / taste disturbances
Martwienie się o swoje zdrowie / worrying about own
health
Martwienie się swoją wagą / worrying about own weight
Niekontrolowane uwalnianie gazów/wiatrów /
unintentional release of gas/flatulence
Niekontrolowany wyciek stolca/kału / uncontrolled
leakage of stool/feces
Podrażnienie skóry wokół stomii/odbytu / irritation of
skin around the stoma/anus
Zakłopotanie z powodu stomii/z powodu częstości
wypróżnień / embarrassment because of the stoma/
embarrassment because of frequency of bowel
movements
Problemy w pielęgnacji stomii/ problems with caring for
the stoma
Zainteresowanie seksem / interest in sex
Problemy z osiągnięciem lub utrzymaniem wzwodu
(mężczyźni)/ ból lub dyskomfort w czasie stosunku
(kobiety) / problems with getting or maintaining an
erection (males)/ pain or discomfort during an
intercourse (females)
Mężczyźni / Males
rozst. kwart. /
mediana /
interquartile
median
range
33,33
16,67-50
16,67
16,67-20,83
Kobiety / Females
rozst. kwart. /
mediana /
interquartile
median
range
16,67
16,67-37,50
16,67
16,67-25
0
72,22
0
0
33,33
16,67
0-16,67
50-91,67
0-8,33
0-0
0-33,33
0-41,67
0
61,11
0
0
16,67
0
0-16,67
52,78-80,56
0-8,33
0-0
0-33,33
0-41,67
16,67
0-33,33
33,33
0-33,33
0
0
16,67
33,33
0-33,33
0-0
0-33,33
25-66,67
0
0
0
33,33
0-8,33
0-0
0-0
25-66,67
66,67
33,33
66,67-100
0-41,67
83,33
33,33
66,67-100
0-33,33
0
0-33,33
0
0-33,33
0
0-8,33
0
0-33,33
50
33,33-66,67
50
33,33-66,67
0
0-16,67
33,33
0-33,33
66,67
33,33
33,33-100
0-75
100
0
66,67-100
0-41,67
938
W. Nowak i wsp.
Tabela 6. Porównanie przeciętnych wartości skal i pojedynczych pytań zawartych w module CR29 miedzy
pacjentami ze stomią oraz bez stomii (tylko różnice istotne statystycznie)
Table 6. Comparison of average values of scales and individual questions included in the CR29 module between
patients with a stoma and without a stoma (only significant differences are shown)
Obraz ciała / body image
Bóle brzucha / abdominal pain
Niekontrolowane uwalnianie gazów/
wiatrów / unintentional release of gas/
flatulence
Pacjenci ze stomią / Patients with
Pacjenci bez Stomil / Patients
a stoma
without a stoma
1 kwartyl 3 kwartyl
1 kwartyl 3 kwartyl
mediana /
mediana /
/ 1st
/ 3rd
/ 1st
/ 3rd
median
median
quartile* quartile
quartile* quartile
55,56
41,67
66,67
83,33
55,56
91,67
33,33
33,33
33,33
0
0
33,33
0
0
33,33
33,33
33,33
41,67
bie pacjentów bez stomii niektóre z pytań korelują z wynikiem sumarycznym własnej
skali na poziomie 0,33 (w pozostałych skalach
powyżej 0,50), podczas gdy w badaniu europejskim korelacje dla tej skali są wyższe od 0,61.
Wartości współczynników korelacji opisujące
aspekt różnicowy trafności są nieco wyższe niż
w wynikach badań przeprowadzonych na europejskiej próbie walidacyjnej. W cytowanych
badaniach korelacje poszczególnych pytań
z wynikami skal, do których te pytania nie
należały, nie przekraczały 0,25 w przypadku
skali oddawania moczu oraz 0,38 w przypadku
skali problemów ze stolcem, podczas gdy
w przypadku pozostałych skal korelacje te były
słabsze od 0,49 (15). W przypadku polskiej
próby wartości współczynników opisujących
aspekt rozbieżny trafności nie przekroczyły
wartości 0,17 wyłącznie w przypadku skali
problemów ze stolcem, podczas gdy w przypadku pozostałych skal osiągały one wartość nawet 0,61. Te wartości wskazują na to, iż w próbie polskich pacjentów problemy mierzone
przez pytania należące do różnych skal częściej
ze sobą współwystępują, co nie podważa trafności teoretycznej modułu i wchodzących
w jego skład skal.
Wśród 29 wskaźników jakości życia pacjentów z rakiem jelita grubego, jakie zawarte są
w module CR29, siedem jest sformułowanych
w zróżnicowany sposób w zależności od tego,
czy dotyczą one pacjentów, którzy stosują worek
stomijny, czy nie – jednak pytania te znajdują
się w wyodrębnionych częściach modułu. Znajdują się w nim także pytania dotyczące objawów
występujących głównie w okresie przedoperacyjnym, a w okresie pooperacyjnym niebędących
specyficznymi objawami dla nowotworu jelita
grubego, oraz pytania związane z zastosowaną
metodą leczenia, jak dotyczące pacjentów leczonych chemioterapią pytania o wypadanie
włosów i problemy ze smakiem (tab. 5, 6).
Pomimo tych niedociągnięć wybrany do
modułu CR29 zestaw pytań oddaje istotę problemu badawczego, jakim jest wpływ nowotworu raka jelita grubego na jakość życia pacjentów warunkowaną stanem zdrowia. Polskie
tłumaczenie modułu jest trafnym i rzetelnym
narzędziem dającym możliwość ujednolicenia
pomiarów efektów leczenia, zalecanym do
stosowania jako standardowe narzędzie służące do pomiaru wpływu samej choroby oraz
zastosowanego leczenia na jakość życia pacjentów z nowotworem odbytnicy.
PIŚMIENNICTWO / REFERENCES
1.Ponczek D, Nowicki A: Rak odbytnicy a jakość
życia po operacji. Współcz onkol 2004; 8: 153-59.
2.Ponczek D, Nowicki A, Zegarski W et al.: Ocena
jakości życia chorych leczonych chirurgicznie z powodu raka odbytnicy w aspekcie czynników społeczno-demograficznych. Współcz onkol 2006; 10:
164-70.
3.Pietrzak L, Bujko K, Nowacki MP et al., on behalf
of the Polish Colorectal Study Group. Quality of
life, anorectal and sexual functions after preopera-
tive radiotherapy for rectal cancer: report of a randomized trial. Radiother oncol 2007; 84: 217-25.
4.Zając O, Spychała A, Murawa D et al.: Quality
of assessment in patients with a stoma due to rectal cancer. Rep Pract Oncol Radiother 2008; 13:
130-34.
5.Hendren SK, O’Connor BI, Liu M et al.: Prevalence of Male and Female Sexual Dysfunction Is
High Following Surgery for Rectal Cancer. Ann
Surg 2005; 242: 212-23.
Adaptacja modułu jakości życia EORTC QLQ-CR29 dla polskich pacjentów z rakiem odbytnicy – wstępna ocena
939
trafności i rzetelności
6.Fenech DS, Takahashi T, Liu M et al.: Function
and quality of life after transanal excision of recital
polyps and cancers. Dis Colon Rectum 2007; 50:
598-603.
7.Banaszkiewicz Z, Szewczyk MT, Cieżniakowska
K i wsp.: Jakość życia osób ze stomią jelitową.
Wspolcz onkol 2007; 11: 17-25.
8.Zolciak A, Bujko K, Kepka L et al.: Abdominoperineal resection or anterior resection for rectal
cancer: patients preferences before and after treatment. Colorectal Diseases 2006; 8: 575-80.
9.Aaronson NK, Ahmedzal S, Bergman B et al.:
The European Organisation for Research and Treatment of Cancer QLQ-C30: a quality of life instrument for use in international clinical trials in oncology. J Natl Cancer Inst 1993; 85: 365-76.
10.Krzakowski M, Bujko K, Drosik K i wsp.: Systemowe leczenie raka okrężnicy i raka odbytnicy –
uzgodnienia oparte na wynikach klinicznych badań.
Onkologia w praktyce klinicznej 2007; 3: 267-85.
11.Boehmer S, Luszczyńska A, Schwarzer R: Coping and quality of life after tumor surgery: Personal and social resources promote different domains
of quality of life. Anxiety, Stress and Coping 2007;
20: 61-75.
12.Gujral S, Conroy T, Fleissner C et al. on behalf
of the European Organisation for Research and
Treatment of Cancer Quality of Life Group: Assessing quality of life in patients with colorectal cancer:
An update of the EORTC quality of life questionnaire. Eur J Cancer 2007; 43: 1564-73.
13.Sprangers MAG, te Velde A, Aaronson NK, on
behalf of the European Organisation for Research
and Treatment of Cancer Study Group on Quality
Pracę nadesłano: 15.04.2011 r.
Adres autora: 31-202 Kraków, ul. Prądnicka 35/37
of life: The construction and testing of the EORTC
colorectal cancer-specific quality of life questionnaire module (QLQ-CR38). Eur J Cancer 1999; 35:
238-47.
14.Ponczek D, Nowicki A, Zegarski W, Banaszkiewicz Z: Ocena jakości życia chorych leczonych
z powodu raka odbytnicy metodą resekcji przedniej
niskiej lub wycięcia brzuszno-kroczowego, bez radioterapii przedoperacyjnej. Współcz onkol 2005, 8,
359-64.
15.Whistance RN, Conroy T, Chie W et al. on behalf
of the European Organisation for the Research and
Treatment of Cancer (EORTC) Quality of Life Group: Clinical and psychometric validation of the
EORTC QLQ-CR29 questionnaire module to assess
health-related quality of life in patients with colorectal cancer. Eur J Cancer 2009; 45: 3017-26.
16.Dewolf L, Koller M, Velikova G et al., on behalf
of the EORTC Quality of Life Group.: EORTC Quality Of Life Group Translation Procedure, Third
Edition. EORTC March 2009.
17.Brzyski P: Trafność i rzetelność skal pomiarowych. W: Kawecka-Jaszcz K, Klocek M, TobiaszAdamczyk B (red.) Jakość życia w chorobach układu sercowo-naczyniowego. Metody pomiaru i znaczenie kliniczne. Termedia Wydawnictwo Medyczne, Poznań 2006, s. 43-54.
18.Fayers PM, Machin D: Quality of life: assessment, analysis and interpretation. Chichester,
New York, Weinheim, Brisbane, Singapore, Toronto: John Wiley & Sons Ltd.; 2000.
19.Brzeziński J: Metodologia badań psychologicznych. Wydawnictwo Naukowe PWN, Warszawa
2006.

Podobne dokumenty