Programy sprawdzianów międzylaboratoryjnych realizowane przez

Transkrypt

Programy sprawdzianów międzylaboratoryjnych realizowane przez
diagnostyka laboratoryjna Journal of Laboratory Diagnostics
2010 • Volume 46 • Number 1 • 15-39
Kontrola jakości • Quality control
Programy sprawdzianów międzylaboratoryjnych
realizowane przez Centralny Ośrodek Badań Jakości
w Diagnostyce Laboratoryjnej w 2009 r.
EQA programmes organized by Centre for Quality Assessment in
Laboratory Medicine in Poland during 2009 year
Andrzej M. Brzeziński, Barbara Przybył-Hac
Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej, Łódź
Streszczenie
W 2009r. Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej przeprowadził w ramach 8 programów 27 różnych
sprawdzianów międzylaboratoryjnych i opracował 750 tysięcy nadesłanych wyników oznaczeń kontrolnych. Wszystkie realizowane przez Centralny Ośrodek programy mają charakter wyłącznie informacyjno-szkoleniowy, nie powodując żadnych
następstw administracyjnych. Ponieważ Ośrodek jest finansowany z budżetu przez Ministerstwo Zdrowia, udział w prowadzonych programach jest dla wszystkich polskich laboratoriów bezpłatny. Najstarszym z realizowanych programów jest tzw.
program centralny, prowadzony od 1975r. tj. od 35 lat dla grupy największych, wiodących laboratoriów kraju. Dla Centralnego
Ośrodka uczestnicy tego programu stanowią obecnie swoistą grupę referencyjną. Najnowszym programem jest podjęty w
2008r. program markerów kardiologicznych - poza oznaczaniem akt. CK oraz akt. i stęż. CK-MB obejmuje on oznaczenia
troponiny I i T, mioglobiny, homocysteiny, BNP i ProBNP. Ocena uzyskiwanych wyników nie jest łatwa, ponieważ jak wszystkie
oznaczenia immunochemiczne są one bardzo wrażliwe na efekt podłoża, więc wyznaczane wartości są silnie powiązane z
wykorzystywanymi systemami analitycznymi. Jest to szczególnie istotne przy niewielkiej liczbie uczestniczących w sprawdzianie laboratoriów. Mioglobinę poddało ocenie tylko 24 laboratoria, lecz wyniki nie mogły zostać ocenione ponieważ żadnym systemem nie posługiwało się co najmniej 6 pracowni. Praktycznie we wszystkich prowadzonych programach - dwóch
chemicznych, hematologicznym, koagulologicznym, dwóch różnych immunochemicznych oraz oceny parametrów równowagi
kwasowo-zasadowej - zaobserwowano nieznaczną lecz stałą poprawę wiarygodności nadsyłanych wyników. Dyskutowanych
jest szereg zagadnień związanych z przyszłością programów międzylaboratoryjnych w Polsce, lecz poza dużymi emocjami
nie prowadzą do wiążących ustaleń.
Summary
During 2009 year Centre for Quality Assessment in Laboratory Medicine has organised 27 different interlaboratory surveys in
eight programmes and nearly 750 thousands of control results have been evaluated. All external quality programmes in Poland
are information-educational only with no administrative consequences. As Ministry of Health sponsors the Centre, the participation in organised programmes is for all polish laboratories charge-free. The eldest programme is so called central one with
surveys organised once a month from 1975 i.e. lasting thirty-five years for 250 biggest leading polish laboratories. At present
they serve for our Centre as the reference group. The last programme started 2008 and includes cardiac markers - besides
CKact. and CK-MBact. and CK-MBmass likewise troponin T and I, myoglobin, homocysteine, BNP and ProBNP. The evaluation of
results is not easy, as all immunochemical estimations are extremely matrix effect dependent and outcomes obtained with various analytical systems are very different. It is especially important with very limited number of participating laboratories – myoglobin was estimate by 24 laboratories only but results were not evaluated as it was impossible to find 6 laboratories using the
same analytical system. Practically in all realised programmes - two chemical, haematological, coagulological, two different
immunochemical and acid-base balance - small but steady improvement of results are observed. A lot of problems connected
with future of quality programmes in Poland are under discussion but besides a lot of emotion with no other consequences.
15
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
Słowa kluczowe:sprawdziany międzylaboratoryjne, wartości umownie należne, granice dopuszczalnego błędu, opracowywanie wyników
Key words:words: interlaboratory surveys, target values, acceptable limits of errors, evaluation of results
Wstęp
Zgodnie z rozporządzeniem Ministra Zdrowia z dn. 26 marca 2006r., od 1 kwietnia 2009r. laboratoria systemu ochrony
zdrowia w Polsce powinny wdrożyć do rutynowego stosowania kilka podstawowych standardów. Jednym z nich jest objęcie wszystkich wykonywanych badań stałą systematyczną
kontrolą wewnątrz- i międzylaboratoryjną, a także obligatoryjne uczestnictwo w programach międzylaboratoryjnych,
organizowanych przez Centralny Ośrodek Badań Jakości w
Diagnostyce Laboratoryjnej. To ostatnie wymaganie potencjalnie stwarzało możliwości przejściowych zakłóceń, związanych z możliwością dołączenia znacznej rzeszy nowych
uczestników programu, co jednak nie nastąpiło. Okazało się,
że w efekcie wieloletnich działań Centralny Ośrodek nawiązał kontakt z praktycznie wszystkimi laboratoriami, a wdrożenie odpowiedniego standardu nie spowodowało istotnych
zmian. Jednocześnie wydaje się mało prawdopodobne, by
laboratoria nie dostosowały się do oficjalnie wdrożonego
standardu, choć w rozporządzeniu nie sprecyzowano warunków jego egzekwowania.
Prowadzone przez Centralny Ośrodek programy sprawdzianów zestawiono w tab. I. Najdłużej realizowanym
jest podjęty w 1975r. tzw. program centralny, obejmujący
comiesięcznymi sprawdzianami 25 podstawowych oznaczeń chemicznych w ok. 250 wiodących laboratoriach
polskich. Oczywiście najistotniejsze są dwa programy
obejmujące teoretycznie wszystkie medyczne laboratoria
diagnostyczne: – powszechny program chemiczny – cztery sprawdziany w roku, 25 składników surowicy w dwóch
materiałach kontrolnych równolegle oraz program hematologiczny, którym formalnie objęte powinny być nie tylko
wszystkie laboratoria, ale wszystkie wykorzystywane w
nich liczniki i analizatory hematologiczne. Ocenianych jest
5 składników mierzalnych i 3 wyliczane wskaźniki, także
w dwóch materiałach kontrolnych równolegle, ale zaled-
wie dwukrotnie w ciągu roku, co uniemożliwia miarodajną ocenę. Zwiększenie częstotliwości sprawdzianów do
czterech w ciągu roku ze względów finansowych wydaje
się obecnie mało realne. Obniżenie przyznanego budżetu
(powszechne oszczędności) spowodowało, że formalnie
bardzo cenny program oceny markerów kardiologicznych
został ograniczony do wręcz symbolicznego jednego
sprawdzianu w ciągu roku.
W sumie w r.2009 przeprowadzono w ramach 8 realizowanych programów aż 27 sprawdzianów, uzyskując w sumie
blisko 750 tys. wyników oznaczeń kontrolnych, będących
podstawą oceny. Należy podkreślić, że aczkolwiek obecnie
udział w programach Centralnego Ośrodka jest obligatoryjny, to są to programy wyłącznie informacyjno-szkoleniowe, a
nie spełnienie wymaganych kryteriów jakościowych nie powoduje żadnych skutków administracyjnych – w przeciwieństwie do sytuacji w Niemczech czy Stanach Zjednoczonych.
Ewentualna zmiana warunków uczestnictwa w programach
Centralnego Ośrodka jest dyskutowana, będąc źródłem rozlicznych kontrowersji.
Uczestnicy
Wydaje się, że programami Centralnego Ośrodka objęte są
wszystkie działające w Polsce medyczne laboratoria diagnostyczne. Oczywiście jest to stan równowagi dynamicznej,
spowodowanej głównie przekształceniami własnościowymi
oraz przetargami na wykonywanie usług laboratoryjnych –
co powoduje ewent. zmiany. Aczkolwiek wielokrotnie podkreślano, że w związku z ogromnymi zmianami organizacyjnymi i technicznymi wdrożony w 1982r. podział laboratoriów
oparty o liczebność zatrudnionego personelu jest obecnie
anachronizmem, to mimo wszystko jest ciągle stosowany. Zestawienie laboratoriów współpracujących w 2009r. z
Centralnym Ośrodkiem przedstawiono w tab. II. Przy dwukierunkowym podziale laboratoriów (liczebność personelu i
Tabela I
Realizowane w r.2009 programy sprawdzianów. Podano nazwę programu, liczbę sprawdzianów w ciągu roku, liczbę
wykorzystywanych równolegle materiałów kontrolnych, liczbę ocenianych składników, liczbę uczestników programu
i liczbę uzyskanych w 2009r. wyników.
Nazwa programu
sprawdz w roku
n mat. kontr.
n ocen. składn.
n uczest.
n wyników w roku
Powszechny chemiczny
4
2
25
1714
243 677
Centralny chemiczny
12
2
25
266
128 349
Podstawowy immunochemiczny
2
2
12
813
25 677
Poszerzony immunochemiczny
2
3
30
485
40 138
Markery kardiologiczne
1
2
9
413
2 475
Parametry równ. kwas.-zasad.
2
3
7
955
21 129
Podstawowy hematologiczny
2
2
8
1971
264 562
Podstawowy koagulologiczny
2
2
5
1280
18 172
744 179
16
A.M. Brzeziński i B. Przybył-Hac
Tabela II
Charakterystyka laboratoriów uczestniczących w powszechnym programie chemicznym w r.2009. W każdym polu
podano: w wierszu górnym – liczby laboratoriów danej grupy i przeciętną liczbę wykonywanych badań (z ocenianych
25), w wierszu dolnym – przeciętną punktową ocenę regularności.
Rodzaj laboratoriów
b. małe
średnie
duże
b. duże
1-3 prac.fach.
4-10 prac.fach.
11-24 prac.fach.
≥ 25 prac.fach.
akademickie
3
±14,3
A
publiczne
36
leczn.zamkn
publiczne
9
±17,8
22
±20,8
4,512
B
±13,4
123
25
±22,8
4,431
C
±19,1
243
4,642
D
4,503
±21,9
94
±22,9
E
4,281
F
4,247
G
4,545
H
4,806
127
±12,0
95
±15,5
30
±16,1
7
±11,4
leczn.otwart
I
4,002
J
4,382
K
4,665
L
4,850
niepubliczne
9
±13,7
71
±20,2
72
±22,0
12
±22,8
razem
59
±20,9
4,546
496
±20,8
4,519
259
±13,7
4,268
164
±20,8
leczn.zamkn
M
3,455
N
4,342
O
4,589
P
4,645
niepubliczne
374
±14,8
328
±18,2
44
±21,5
5
±23,2
leczn.otwart
R
3,926
S
4,219
T
4,482
U
4,871
4,116
±14,0
626
±18,2
411
±21,4
143
±22,3
1729 ±18,0
razem
549
3,959
4,264
4,558
4,449
751
4,741
dodatkowe
61
±14,9
aparaty
X,Y
3,755
±16,7
4,321
61
±14,9
3,755
1790 ±17,9
4,305
powiązania organizacyjne) w odpowiednich polach podano
– w wierszu górnym liczbę laboratoriów danej podgrupy oraz
średnią liczbę wykonywanych przez nie oznaczeń (z 25 ocenianych!), a w wierszu dolnym symbol podgrupy oraz uzyskaną przeciętną punktową ocenę regularności (od 0,00 do
5,00 pkt.). Zwraca uwagę, że ponad 30% laboratoriów są to
placówki bardzo małe, zatrudniające od 1 do maksymalnie
3 pracowników fachowych, o ograniczonym zakresie usług
(asortyment i liczba badań). Częstokroć bardzo proste, nawet wręcz archaiczne wyposażenie tych placówek oraz konieczność krańcowego ograniczenia kosztów warunkują, że
przeciętny poziom wiarygodności uzyskiwanych wyników
jest niski (choć bywają wyjątki). Jak wynika z tabeli, będąca
miarą poprawności wyników – w powszechnym programie
chemicznym – punktowa ocena regularności jest bardzo
wyraźnie skorelowana z wielkością laboratoriów, ocenianą
na podstawie liczby zatrudnionych pracowników fachowych.
Wynika to oczywiście z organizacji pracy, kompetencji personelu oraz wykorzystywanego wyposażenia i metod. Analogiczne wnioski można wyciągnąć, dzieląc laboratoria bardziej merytorycznie, w oparciu o wachlarz wykonywanych
badań (choć w dalszym ciągu z objętych oceną 25 podstawowych oznaczeń chemicznych!). Przedstawiono to, podając zależnie od liczby oznaczanych składników odsetek ocenianych laboratoriów i średnią ocenę punktową regularności:
1-5 skł. – 3,85% lab.,± 3,674 pkt.; 6-10 skł. – 7,65% lab.,±
3,920 pkt.; 11-15 skł. – 16,70% lab.,± 3,994 pkt.; 16-20 skł.
–27,15% lab.,± 4,168 pkt.; 21-25 skł. – 44,64% lab.,± 4,472
pkt. 6 laboratoriów, które oznacza wszystkie 25 składniki (w
tym osmolalność i akt. kwaśnej fosfatazy) uzyskało bardzo
wysoką ocenę regularności, średnio 4,887 pkt., w tym 3 la-
boratoria – 5,000 pkt., a więc dla wszystkich 25 składników
we wszystkich 4 sprawdzianach nadesłały komplet wyników
kontrolnych ocenionych jako poprawne! Zwraca uwagę brak
korelacji między formalną wielkością laboratoriów (ocenianą
zależnie od liczby pracowników fachowych), a wachlarzem
wykonywanych oznaczeń. Zwłaszcza wśród niepublicznych
bardzo małych laboratoriów lecznictwa otwartego występuje
wiele placówek wykonujących badania nieadekwatne do posiadanych możliwości technicznych i kadrowych, z jak najgorszymi skutkami.
Program Centralny
W 1975r. czterdzieści dużych laboratoriów medycznych
zdecydowało o prowadzeniu wspólnego programu międzylaboratoryjnej oceny wyników, z wykorzystaniem jednolitych
materiałów kontrolnych. Był to zalążek realizowanego do
dziś tzw. programu centralnego, a jednocześnie początek
wielokierunkowych działań na rzecz poprawy wiarygodności
wyników laboratoryjnych w Polsce, przejętych obecnie przez
Centralny Ośrodek. Mimo rozlicznych zmian – liczby uczestników, zakresu ocenianych składników, kryteriów oceny czy
sposobu przedstawiania wyników – niezmiennie od niemal
35 lat sprawdziany programu centralnego przeprowadzane
są regularnie 1 x w miesiącu z wykorzystaniem dwóch materiałów kontrolnych równolegle. Ze względów ekonomicznych program pozostał ekskluzywny, ograniczony do ok.
250 dużych, wiodących w skali kraju laboratoriów (choć z
różnych przyczyn dołączono w ciągu tych lat nieco placówek
mniejszych). Z zasady są to placówki dobrze zorganizowane
i wyposażone, o szerokim zakresie świadczonych usług, np.
wszystkie zakłady diagnostyki laboratoryjnej WSZ czy CSK.
17
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
Aczkolwiek laboratoria uczestniczące w programie centralnym stanowią poniżej 15% ogółu laboratoriów objętych
programem powszechnym, to obejmują 90 ze 143 = 63%
laboratoriów bardzo dużych (> 25 prac. fachowych) czy 118
z 411 laboratoriów dużych (11-24 prac. fachowych). Średnio laboratoria te oznaczają podobnie jak laboratoria bardzo
duże 22 z 25 ocenianych składników (średnia dla ogółu laboratoriów – 18 składników), dysponując jednocześnie lepszym od przeciętnego wyposażeniem. U uczestników programu centralnego zlokalizowanych jest 54% analizatorów
Modular/Cobas 6000, 39,3% analizatorów Olympus, 33,6%
analizatorów Cobas Integra i odpowiednio więcej innych dużych nowoczesnych analizatorów spośród wszystkich zgłoszonych przez użytkowników programu powszechnego. Dla
Centralnego Ośrodka laboratoria uczestniczące w programie
centralnym stanowią swoistą grupę referencyjną wyznaczającą kierunki oczekiwanych/pożądanych zmian. Adekwatnie
do wielkości, kompetencji i wyposażenia uczestnicy programu centralnego uzyskują wyniki korzystniejsze niż ogół laboratoriów. W tab. III podano – z rozbiciem na poszczególne
składniki i ogółem – procent wyników uznanych za poprawne względem trzech przyjętych układów odniesienia tj. wartości umownie należnych – średnich ogólnych (z wszystkich
wyników), średnich metodycznych (z wyników uzyskanych
tą samą metodą) i średnich metodyczno-aparaturowych (z
wyników uzyskanych tą samą metodą i aparatem). Oczywiście im lepiej opisane warunki oznaczania, tym uzyskane
wyniki są korzystniejsze – procent wyników uznanych za
poprawne odpowiednio rośnie – 86,86% - 93,19% - 95,63%.
W stosunku do roku 2004 przy ograniczonym zwiększeniu
liczby ocenianych wyników (o 6%) uzyskano wzrost wyników
poprawnych o 2-3%. Pozornie zmiany te wydają się niewielkie, należy jednak uwzględnić, że dotyczą dużych zbiorów
(niemal 135 tys. ocenianych wyników), a jednocześnie zmiany następują na bardzo wysokim poziomie wiarygodności –
nawet powyżej 95% wyników uznanych za poprawne – kiedy uzyskanie nawet znikomej zmiany jest już bardzo trudne.
Dane zbiorcze tab. III zilustrowano ryc. 1.
Ponieważ w tab. III podano dane zbiorcze dla 24 wykorzystanych w r. 2009 materiałów kontrolnych, to jedyną dostęp-
Rycina 1
Graficzne przedstawienie ocen okresowych z tabeli III.
18
ną formą zintegrowanej oceny było podanie procentu wyników przyjętych za poprawne. Przy ocenie vs średnie ogólne
rozproszenie wyników – i automatycznie procent wyników
uznanych jako poprawne – w znacznej mierze zależy od
oczywistych czasami różnic między metodami. Oprócz „klasycznej” różnicy aktywności LDH zależnie od kierunku przebiegu wykorzystywanej reakcji redox, różnice metodyczne
wyraźnie występują także przy ocenie HDL-Chol., magnezu,
bilirubiny, kreatyniny czy akt. amylazy i ALP. Miarą występowania ewent. różnic wartości zależnie od wykorzystywanej
metody jest różnica w odsetku wyników uznanych jako poprawne vs xog i xmet – im ta różnica jest większa, tym prawdopodobieństwo zróżnicowania wartości metodycznych jest
wyższe. Oczywiście należy także uwzględnić popularność
poszczególnych metod. Przykładowo przy oznaczaniu cholesterolu – 94,99% popr. vs xog i 95,42% popr. vs xmet, Δ =
0,43% – wg stosowanej klasyfikacji unifikacja metodyczna
tego badania jest niemal całkowita. Różnice zbiorcze między oceną vs xmet i xmet-ap są już pozornie mniejsze (93,2% i
95,6% poprawnych, Δ = 2,4%), ale są to dane, dla wszystkich składników i aparatów. Dla niektórych składników są
wyraźnie większe, co spowodowane jest zróżnicowaniem
wyników, wyznaczonych nawet tą samą metodą, ale różnymi
analizatorami (skutek związanej z efektem podłoża niekomutabilności materiałów kontrolnych). Problem jest bardzo
poważny, niezależnie od przyjętego systemu odniesienia
(np. liofilizowane materiały kontrolne z wyznaczonymi wartościami definitywnymi). Dla jego zobrazowania w tab. III podano dodatkowo ocenę vs xmet i xmet-ap wyników uzyskanych
6 analizatorami najczęściej wykorzystywanymi przez uczestników programu centralnego. W żadnym wypadku nie jest to
ranking aparatów – wyniki uzyskane zostały w odmiennych
warunkach w różnych laboratoriach. Jednak dla analizatorów Cobas Integra różnica w ocenie wyników vs xmet i xmetjest znikoma (96,4% i 96,9% poprawnych, Δ = 0,5%), co
ap
sugeruje niewielki wpływ analizatora na wyznaczone wartości. Odmienna jest sytuacja z oznaczeniami wykonanymi na
aparatach Dimension (Δ = 7,3%), Konelab (Δ = 4,7%) czy
Cobas 6000 (Δ = 2,9%). Aparatami tymi dla części składników wyznaczane są wartości z zasady wysoce zbieżne, ale
n
134440
131007
129676
126830
r. 2008
r. 2006
r. 2004
5846
3917
GGT
LD
razem r. 2009
439
5231
CK
5984
AMY
AcP
6149
5902
6056
6150
triglicerydy
AST
ALT
5815
HDL-Ch
ALP
6124
6104
bilirubina
6052
6219
moczany
glukoza
cholesterol
6202
6137
mocznik
kreatynina
95,91
93,19
92,9
91,2
90,3
86,86
87,2
85,8
84,9
95,70
93,90
87,77
84,90
83,83
0,89
97,58
89,77
91,17
96,93
85,49
96,23
98,04
93,27
93,09
95,19
90,64
77,32
83,04
89,37
95,42
83,67
94,38
96,92
93,26
95,19
94,99
96,70
89,31
94,36
82,40
90,26
86,73
białko
6067
4992
5510
chlorki
fosforany
87,19
84,14
92,97
77,15
89,27
94,12
5566
5840
magnez
żelazo
93,81
88,45
85,62
5886
wapń
93,58
96,96
89,73
ogółem
95,77
vs xog
%popr.
92,45
6126
6126
sód
wyn.
potas
oznaczany
składnik
96,4
99,6
98,8
98,7
84,7
99,8
99,0
98,9
99,2
98,7
92,2
98,6
87,6
98,0
98,4
93,4
96,9
95,2
98,4
92,2
94,0
94,0
94,9
97,2
93,9
Integra
94,0
97,9
98,3
97,7
-
99,2
63,9
96,7
97,7
97,7
97,8
98,4
96,9
98,3
97,1
93,6
98,2
81,0
95,4
91,0
96,9
78,9
95,2
98,2
94,6
Olympus
89,3
95,0
86,1
89,3
-
97,1
63,2
98,3
98,3
92,3
87,4
94,8
86,9
96,4
84,3
81,5
93,8
93,4
89,7
81,1
84,1
75,7
92,6
98,7
93,8
Konelab
% popr. vs xmet
94,7
99,5
98,0
100,0
-
99,0
99,4
98,8
99,4
97,3
91,9
97,6
79,7
98,7
86,1
90,3
97,3
88,7
97,8
76,1
99,0
87,9
98,0
97,8
94,5
Cobas
6000
89,4
97,8
98,1
91,1
-
78,8
69,9
93,9
98,8
96,4
93,1
67,4
97,3
93,4
99,2
71,9
98,2
98,7
79,1
62,8
95,4
88,0
95,5
97,7
96,7
Dimension
95,8
99,2
99,3
90,7
-
99,0
99,6
97,9
97,9
96,8
94,7
99,3
88,3
97,5
98,2
94,7
97,9
95,0
93,8
98,9
92,5
82,1
94,6
98,7
95,0
Vitros
93,6
94,5
95,6
95,63
90,48
97,44
97,62
82,55
99,23
95,44
97,88
98,85
96,79
93,18
97,24
93,53
97,61
97,14
94,52
97,40
93,98
95,95
94,14
94,90
86,01
95,09
97,70
94,96
ogółem
96,9
99,7
99,0
98,8
82,8
99,8
98,9
99,2
99,5
98,7
92,1
98,6
89,1
98,1
98,4
96,4
97,7
95,5
98,5
94,9
94,0
94,1
95,0
97,9
95,6
Integra
96,5
98,4
99,0
98,1
-
99,0
92,8
98,4
99,0
98,1
97,8
98,2
98,8
98,0
97,6
96,7
98,2
92,2
96,0
97,5
96,8
79,6
96,6
98,1
95,3
Olympus
94,0
96,4
90,9
97,5
-
98,2
91,9
98,8
99,3
92,7
89,7
93,6
98,1
96,7
93,8
89,4
94,8
95,2
97,3
86,3
94,0
79,6
95,0
98,7
95,3
Konelab
97,6
99,5
97,3
99,2
-
99,0
100,0
98,5
98,8
98,2
94,4
98,8
91,5
98,3
97,3
95,6
97,2
98,2
98,7
96,2
99,3
92,4
99,3
97,8
96,7
Cobas
6000
% popr. vs xmet–ap
96,7
99,0
100,0
97,0
-
99,4
91,7
94,5
99,4
98,4
98,0
96,4
98,2
98,5
99,2
98,5
98,2
98,4
82,3
94,1
98,8
89,6
98,7
98,0
97,0
Dimension
95,8
99,2
99,3
90,7
-
99,0
99,6
97,9
97,9
96,8
94,7
99,3
88,3
97,5
98,2
94,7
97,9
95,0
93,8
98,9
92,5
82,1
94,6
98,7
95,0
Vitros
3,99
4,11
4,22
4,29
4,74
4,63
4,53
3,06
4,84
4,24
4,62
4,73
4,54
3,86
4,49
4,09
4,45
4,46
4,05
4,41
3,92
4,21
3,96
4,17
3,24
3,99
4,41
4,16
precyzji
3,48
3,68
3,77
3,92
4,48
4,46
4,27
2,56
4,64
3,97
4,27
4,42
4,18
3,46
4,12
3,70
4,10
4,21
3,57
4,12
3,54
3,78
3,48
3,58
2,60
3,69
4,03
3,69
ogóln.
wiar.
śr. ocena pkt.
Tabela III
Zestawienie ocen wyników oznaczeń kontrolnych programu centralnego w r.2009 zależnie od przyjętych wartości umownie należnych – odsetek wyników poprawnych w stosunku do średnich ogólnych, średnich metodycznych i średnich metodyczno-aparaturowych. Dodatkowo podano odsetek wyników poprawnych uzyskanych najczęściej wykorzystywanymi w programie centralnym analizatorami: Cobas Integra (88 szt.), Olympus (38 szt.), Konelab (27 szt.), Cobas 6000 (16 szt.), Dimension (15 szt.) i Vitros (14 szt.).
A.M. Brzeziński i B. Przybył-Hac
19
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
wyraźnie odmienne od uzyskiwanych innymi analizatorami.
Najbardziej klasycznym przykładem takiego analizatora o
często „własnych” wartościach metodycznych jest Dimension. Dla kilku składników oznaczanych tym analizatorem
wybrano z tab. III procent wyników uznanych jako poprawne
vs xmet i xmet-ap: chlorki – 62,8% i 94,1%, Δ = 31,3%!; cholesterol – 67,4% i 96,4%, Δ = 29,0%; kreatynina – 71,9% i 98,5%,
Δ = 26,6% czy ALP – 69,9% i 91,7%, Δ = 21,8%. Trudno dyskutować, dlaczego wykorzystując formalnie tą samą metodę,
określonym analizatorem wyznacza się wyraźnie odmienne
wartości (w materiałach kontrolnych!). Dotyczy to oczywiście
nie tylko aparatów Dimension, ale także części pozostałych,
np. aparatów Konelab (akt. ALP – Δ = 28,7%, bilirubina – Δ
= 11,2%, moczany – Δ = 9,5%), analizatorów Cobas 6000
(chlorki – Δ = 20,1%, bilirubina – Δ = 11,8%, moczany – Δ =
11,2%) czy Olympus (akt. ALP – Δ = 28,9%, białko całk. –
Δ = 11,2%). Oczywiście z założenia różnice takie nie mogą
występować dla analizatorów Vitros i metody suchej fazy. W
efekcie oceniając wyniki w stosunku do „własnych” średnich
metodyczno-aparaturowych różnice między przedstawionymi analizatorami są stosunkowo małe – 96,5% - 97,5%
poprawnych. Należy jednak uwzględnić, że aczkolwiek poza
analizatorami Vitros są to systemy teoretycznie „otwarte”, to
faktycznie związane są z fabrycznie określonymi metodami,
odczynnikami i kalibratorami, a więc de facto są „zamknięte”. Wyjątek (wśród omawianych) stanowią analizatory Konelab – najniższą („zaledwie” 94%) poprawność względem
wartości metodyczno-aparaturowych można wiązać z równoległym wykorzystywaniem odczynników dwóch firm – bioMerieux i Thermo-Kone, a wyznaczane nimi wartości mogą
się znacząco różnić.
Duża liczba wyników uzyskiwana przez każdego uczestnika dla poszczególnych składników – formalnie 24 w roku –
umożliwia pogłębioną ocenę precyzji i ogólnej wiarygodności
wyznaczanych wartości. Podstawą oceny jest rozproszenie
błędów tj. różnic procentowych między wartościami wyzna-
Tabela IV
Ocena precyzji i ogólnej wiarygodności wyników oznaczanych składników w poszczególnych laboratoriach, uzyskanych przez uczestników programu centralnego w 2009 r.
oceniany
składnik
sód
n aparatów
%% ocena precyzji
%% ocena ogólnej wiarygodności
oznacz.
sklas.
bdb
db
wątpl.
niezad
zła
bdb
db
wątpl.
niezad
zła
269
256
31,6
57,0
9,4
2,0
0
15,2
57,8
18,8
5,1
3,1
potas
269
256
44,1
52,7
3,1
0
0
27,3
57,4
11,7
1,6
2,0
wapń
259
245
24,5
58,4
13,5
2,9
0,8
15,9
56,3
19,6
4,9
3,3
magnez
249
229
7,4
53,7
21,0
8,7
9,2
3,5
38,4
24,9
14,0
19,2
żelazo
259
247
39,3
47,8
8,9
2,4
1,6
21,5
50,2
14,6
6,1
7,7
chlorki
225
209
21,5
62,7
12,0
1,4
2,4
9,1
56,0
24,4
5,7
4,8
fosforany
245
228
43,9
44,7
7,2
1,8
2,6
27,6
49,6
12,7
3,1
7,0
osmolalność
39
34
8,8
67,6
14,7
8,8
0
0
47,1
32,4
14,7
5,9
białko
266
254
20,5
62,2
13,0
2,0
2,4
10,6
54,3
26,4
3,9
4,7
mocznik
271
259
47,5
47,1
4,6
0,8
0
29,3
57,9
10,8
1,2
0,8
kreatynina
268
256
30,5
52,0
14,4
2,0
1,2
18,0
48,8
21,9
5,9
5,5
moczany
265
253
53,8
39,5
6,3
0,4
0
35,6
53,4
9,1
2,0
0
glukoza
272
260
48,8
48,1
2,7
0,4
0
28,8
60,0
8,1
1,5
1,5
bilirubina
268
256
29,3
55,9
12,5
2,0
0,4
14,8
54,7
23,8
5,1
1,6
cholesterol
268
255
55,3
40,4
3,5
0,8
0
33,3
54,5
8,2
2,8
1,2
HDL-Ch
255
242
20,2
61,2
11,6
5,0
2,1
12,4
52,1
23,1
6,6
5,8
triglicerydy
266
253
60,1
34,0
5,9
0
0
40,7
45,1
10,7
2,0
1,6
AST
269
257
79,4
17,1
2,0
1,6
0
57,6
34,2
5,1
2,3
0,8
ALT
269
257
66,5
30,4
2,3
0,8
0
42,8
46,3
9,0
1,2
0,8
ALP
261
245
45,7
42,4
7,4
3,3
1,2
34,7
45,7
12,2
4,1
3,3
AMY
263
250
85,6
13,2
0,8
0,4
0
74,8
22,0
0,4
1,2
1,6
AcP
24
18
5,6
33,3
44,4
11,1
5,6
0
16,7
61,1
5,6
16,7
CK
231
218
56,0
40,8
3,2
0
0
39,4
50,9
8,3
1,4
0
GGT
256
245
71,8
23,3
3,3
1,2
0,4
58,8
33,1
6,1
1,6
0,4
LD
179
159
77,4
19,5
3,1
0
0
64,8
25,8
6,3
1,9
1,3
45,6
44,0
7,6
1,8
1,0
30,6
48,3
14,0
3,7
3,4
20
r. 2009
89,6
7,6
2,8
78,8
14,0
7,1
r. 2008
87,5
9,0
3,5
74,7
15,2
10,0
r. 2006
84,7
10,5
4,8
72,9
16,0
11,1
r. 2004
80,8
12,9
6,3
66,2
19,4
14,4
A.M. Brzeziński i B. Przybył-Hac
czonymi a należnymi, a ściślej odchylenie standardowe zbioru tych błędów (w zestawieniu z dopuszczalnymi granicami
błędów). Podstawę tego systemu opracowano w 1978r. i
wielokrotnie go omawiano, natomiast wyniki uzyskane w r.
2009 przedstawiono w tab. IV. Dla prawie wszystkich ocenianych składników (poza magnezem, osmolalnością i akt.
kwaśnej fosfatazy) uzyskuje się wysoce korzystne oceny nawet ogólnej wiarygodności (suma błędów przypadkowych i
systematycznych). Na podkreślenie zasługuje obserwowana
w kolejnych latach poprawa – zwiększenie bardzo dobrych i
dobrych ocen precyzji z 80,8% w r.2004 do 89,6% w r.2009
czy ogólnej wiarygodności z 66,2% do 78,8% (+ 12,6%) jest
naprawdę istotne. Jeszcze bardziej spektakularny jest spadek w tym samym okresie ocen niezadowalających i złych –
dla precyzji z 6,3% do 2,8%, a dla ogólnej wiarygodności – z
14,4% do 7,1% (!). Jest to niewątpliwie wynik ciężkiej pracy
wykonawców, ale także zachodzących korzystnych zmian
aparaturowych i odczynnikowych oraz znacznego uczulenia
na poprawność procesu kalibracji.
Uzyskiwana przez poszczególne laboratoria ocena precyzji
czy ogólnej wiarygodności oznaczanych składników stały
się w r.1996 podstawą dodatkowej klasyfikacji uczestników programu centralnego. Wprowadzone zróżnicowanie
jest pozorne – aczkolwiek tłumaczeniem ang. certificate
jest zaświadczenie, to w ogólnym odczuciu słowo certyfikat ma inne, „wyższe” znaczenie niż zaświadczenie. I tą
quasi-semantyczną różnicę postanowiono wykorzystać.
Jednocześnie założono, że wymagania nie mogą być zbyt
wygórowane – muszą być do spełnienia przez każde profesjonalnie prowadzone laboratorium. W 1996r. sprecyzowano
3 kryteria, które musiały być równocześnie spełnione – dla
uzyskania certyfikatu laboratorium musiało uzyskać w ciągu
roku powyżej 85,0% wyników kontrolnych ocenionych jako
poprawne oraz średnio > 3,0 pkt. w ocenie precyzji i > 2 pkt.
w ocenie ogólnej wiarygodności. W pierwszym roku wymagania te spełniło 51 z ocenionych 92 laboratoriów (= 55,5%).
Aczkolwiek uzyskanie certyfikatu uczestnictwa (a nie „tylko”
zaświadczenia) nie jest związane z jakimiś korzyściami czy
przywilejami, to zdobycie go stało się dla laboratoriów bardzo istotne ze względów ambicjonalnych – już w roku następnym (1997) wyraźnie wzrosła – do 61 tj. 66,3% uczestników – liczba laboratoriów które uzyskały to wyróżnienie. Od
tego czasu mimo zmiany wachlarza ocenianych składników
i liczby uczestników programu centralnego wymagania były
zmieniane kilkukrotnie, co jest wyrazem zachodzących korzystnych zmian. Gdyby w r.2009 wykorzystać kryteria z r.
1996, to certyfikatu nie dostałoby 12 z 246 laboratoriów (czyli < 5%) i to prawie wyłącznie z powodu zbyt niskiej poprawności nadsyłanych wyników (< 85% poprawnych) – tylko 4
laboratoria (~ 1,6%) nie uzyskało wymaganej wówczas minimalnej oceny precyzji czy ogólnej wiarygodności. Obowiązujące obecnie kryteria uzyskania certyfikatu uczestnictwa
dobrane zostały w r. 2007 - > 92,5% wyników kontrolnych
uznanych za poprawne oraz średnio > 3,95 pkt. w ocenie
precyzji i > 3,4 pkt. w ocenie ogólnej wiarygodności. W r.
2007 kryteria te spełniło 166 z ocenianych 246 laboratoriów
(tj. 67,5%), ale w roku 2009 już 205 tj. 83,3% uczestników.
Tym samym następuje nadmierne obniżenie wartości certyfikatu, traci on charakter wyróżniający i w r.2010 będzie musiała nastąpić kolejna zmiana wymagań – przypuszczalnie >
94 lub 95% wyników kontrolnych ocenionych jako poprawne
i średnio > 4,1-4,2 pkt. w ocenie precyzji i > 3,5-3,6 pkt. w
ocenie ogólnej wiarygodności. Te stosunkowo częste, kolejne zaostrzenia wymagań dla uzyskania certyfikatu uczestnictwa najprawdopodobniej związane są przede wszystkim
z korzystnymi zmianami wykorzystywanego w laboratoriach
wyposażenia. Aczkolwiek można łatwo wykazać, że nowoczesna aparatura nie jest warunkiem wystarczającym do
wyznaczenia poprawnych wyników, to jednak bardzo ich
uzyskanie ułatwia.
Powszechny program chemiczny.
Powołanie przez MZiOS w 1978r. Komisji ds. Standaryzacji i
Kontroli Jakości Badań Laboratoryjnych i Mikrobiologicznych
oraz kilkuletnia bezproblemowa realizacja programu centralnego pozwoliły na wprowadzenie w 1982r. powszechnego
programu sprawdzianów chemicznych, potencjalnie obejmującego wszystkie działające w kraju medyczne laboratoria diagnostyczne. To ambitne założenie stało się składową
obligatoryjnego standardu laboratoryjnego, wdrożonego od
1.04.2009r. rozporządzeniem Ministra Zdrowia (Dz.U.rozp.
435 z dn.23.03.2006r.). W obecnej formie program jest realizowany od 2001 r. – sprawdzianami 4 x w roku w dwóch
materiałach kontrolnych równolegle objętych jest 25 podstawowych oznaczeń chemicznych. Program jest więc niemal
bliźniaczy do programu centralnego, a główne różnice to
częstotliwość przeprowadzania sprawdzianów (1 x w kwartale, 1 x w mies.) oraz liczba (1750 – 250) i dobór uczestników programu (powszechny – elitarny). Pochodną tych
różnic jest nieco odmienny sposób oceny wyników. Kilkukrotnie większa liczba uczestników, a tym samym wyników
pozwala w programie powszechnym dołożyć do szeregu
wykorzystywanych wartości umownie należnych – średnich
ogólnych, średnich metodycznych i średnich metodycznoaparaturowych – kolejną wartość – średnią metodycznoaparaturowo-odczynnikową czyli systemową. Wyodrębnienie grup homogennych wyników, wyznaczonych w bardzo
zbliżonych warunkach – tą samą metodą, na takim samym
aparacie i takimi samymi odczynnikami – spowodowało wyraźną poprawę ich oceny. Jednocześnie jednak znaczny
odsetek wyników jest z możliwości takiej oceny wyłączony.
Dotyczy to przede wszystkim wyników uzyskanych mniej
popularnymi analizatorami, wykorzystującymi zróżnicowane
odczynniki – zebranie min. 6 homogennych wyników może
okazać się niemożliwe. Przedstawiono to w tab. VI w kolumnie X – podano w niej odsetek wyników uzyskanych różnymi
analizatorami, dla których można było zastosować średnie
metodyczno-aparaturowo-odczynnikowe. Z analizatorami
Cobas Integra wykorzystywane są wyłącznie odczynniki firmy Roche – w efekcie aż 99,8% z ponad 35 tys. wyników
21
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
wyznaczonych tymi analizatorami mogło być ocenionych vs
średnie systemowe. Podobnie jest z szeregiem dalszych
analizatorów, wykorzystujących odczynniki producenta
(Olympus, Dimension, Advia, Architect czy A15/A25) bądź
importera (f-ma Cormay – analizatory Accent 200/300 czy
Prestige 24). Jednocześnie szereg analizatorów wykorzystuje bardzo zróżnicowane odczynniki. Zaledwie niewiele
ponad 50% z blisko 7,5 tys. wartości wyznaczonych analizatorami Cobas Mira może być ocenionych vs średnie metodyczno-aparaturowo-odczynnikowe (i to nie z odczynnikami
Roche) czy 0% z 1200 wyników uzyskanych 20 aparatami
Alcyon – wiosną 2009r. do wyznaczenia tymi analizatorami 20 wyników glukozy posłużono się odczynnikami 13 (!)
różnych firm. Zróżnicowanie odczynników jest bardzo duże
– uczestnicy programu wymienili aż 65 firm producentów/
dystrybutorów. 75% wyników nadesłanych w programie powszechnym w r.2009 zostało uzyskanych produktami 10
firm (Roche – 20,6%, BioSystems – 12,5%, Cormay – 8,3%,
α-Diagnostics – 6,4%, Olympus – 6,0%, bioMaxima – 5,9%,
Emapol/Human – 4,8%, bioMerieux – 3,7%, Thermo/Kone
– 3,5%, HORIBA ABX – 3,3%), a dalszych 18,5% - następnych 10 firm. Wykorzystanie wielu z pozostałych 45 firm
jest tak znikome, że może być wynikiem omyłek (czasami
ewidentnych – np. oznaczanie glukozy odczynnikami f-my
Adel). Ewentualne wyjaśnianie tych pomyłek przekracza
możliwości organizatorów – przykładowo latem 2009 z blisko
1700 nadesłanych wyników glukozy aż 135 (!) uzyskanych
zostało jako pojedyncze wyniki aparaturowo-odczynnikowe,
co uniemożliwia jakąkolwiek ich ocenę porównawczą. W sumie ponad 20% wyników glukozy nadesłanych latem 2009
nie pozwalało na stworzenie homogennych grup metodyczno-aparaturowo-odczynnikowych o wymaganej liczebności
n ≥ 6, co wykluczało ich ocenę vs wartości systemowe. Należy uwzględnić, że oznaczanie glukozy jest bardzo popularne, a dla oznaczeń rzadziej wykonywanych sytuacja jest
gorsza.
Ograniczona liczba wyników kontrolnych, wyznaczanych
w ciągu roku przez poszczególnych uczestników dla każde-
Tabela V
Zestawienie ocen wyników oznaczeń kontrolnych w powszechnym programie sprawdzianów chemicznych
w r. 2009.
n ocenianych wyników i %% uznanych za poprawne względem
ocena
regularności
n
ozn.
lab.
n wyn.
% popr.
n wyn.
% popr.
n wyn.
% popr.
n wyn.
% popr.
sód
1257
9537
82,5%
9533
87,1%
8869
90,2%
8329
90,5%
81,0%
6,6%
4,201
potas
1264
9604
89,1%
9582
90,5%
8916
92,4%
8362
93,0%
83,8%
6,4%
4,308
wapń
1279
9682
80,2%
9618
81,7%
8400
84,5%
6767
87,3%
80,9%
8,1%
4,209
magnez
1216
9165
59,8%
9149
64,1%
7849
68,4%
6491
70,6%
65,7%
16,9%
3,660
żelazo
1461
11068
68,9%
11048
73,1%
9666
77,1%
7853
80,3%
71,5%
13,8%
3,906
chlorki
764
5598
82,3%
5578
83,7%
4801
89,9%
4373
91,8%
74,3%
14,3%
3,920
fosforany
994
7500
81,5%
7500
83,2%
6348
87,7%
5085
89,9%
84,6%
7,6%
4,359
osmolalność
56
423
83,4%
421
83,4%
398
85,2%
362
84,8%
80,4%
7,1%
4,232
oceniany
składnik
vs xog
vs xmet
vs xmet-ap
vs xsyst
bdb + db nzd + zła
± pkt
białko
1464
11128
69,5%
11126
72,7%
9904
78,3%
8080
82,0%
74,6%
10,2%
4,018
mocznik
1674
12776
86,8%
12730
89,3%
11736
90,3%
9769
91,6%
86,0%
6,2%
4,386
kreatynina
1726
13161
76,0%
13149
80,0%
11677
85,4%
9613
87,2%
91,5%
3,4%
4,633
moczany
1638
12479
83,0%
12477
83,7%
11513
86,5%
9657
88,4%
81,0%
8,8%
4,231
glukoza
1748
13339
90,2%
13303
91,6%
12271
92,3%
10244
93,3%
84,2%
6,7%
4,321
bilirubina
1646
12539
80,9%
12516
82,7%
10445
87,7%
8510
89,1%
79,4%
8,8%
4,170
cholesterol
1718
13103
91,2%
13091
91,8%
12441
92,8%
10487
93,8%
85,5%
5,8%
4,377
HDL-Ch
1460
11029
66,9%
10997
78,2%
8966
83,8%
7375
86,6%
78,3%
9,8%
4,124
triglicerydy
1681
12824
88,6%
12820
89,5%
12080
90,6%
10192
92,2%
86,1%
6,8%
4,391
AST
1709
13046
92,4%
13044
93,2%
11868
94,5%
9970
95,6%
90,6%
3,7%
4,573
ALT
1737
13262
92,4%
13260
92,9%
12078
94,1%
10048
95,1%
91,2%
3,9%
4,579
ALP
1331
10076
73,6%
10064
77,4%
8750
86,1%
7153
88,6%
82,0%
7,4%
4,271
AMY
1441
10913
88,1%
10903
92,9%
9447
96,4%
8014
97,2%
90,4%
5,1%
4,541
AcP
72
452
68,4%
440
69,8%
164
85,4%
100
97,0%
54,2%
30,6%
3,014
CK
880
6590
90,3%
6590
91,3%
5412
93,6%
4712
94,3%
86,7%
6,2%
4,440
GGT
1302
9863
86,8%
9855
90,2%
8764
93,6%
6898
95,6%
90,6%
4,7%
4,578
LD
515
rok 2009
22
3784
5,6%
3784
89,1%
3182
92,8%
2782
94,0%
85,4%
8,9%
4,336
242936
81,0%
242596
84,9%
215945
88,3%
181226
90,1%
83,1%
7,6%
4,296
rok 2007
248220
80,9%
247791
84,0%
223103
86,9%
176917
89,0%
4,210
rok 2005
246783
80,1%
245275
83,4%
220364
85,8%
167392
87,8%
4,055
A.M. Brzeziński i B. Przybył-Hac
go ocenianego składnika (4 x 2 = 8 wyników, a nie 12 x 2 =
24 wyniki) uniemożliwia roczną ocenę precyzji i ogólnej wiarygodności pojedynczego laboratorium, wykorzystywaną w
programie centralnym. W zamian wprowadzono ocenę uzyskiwanej regularności oznaczeń poszczególnych składników,
zależną od liczby „zaliczonych” w ciągu roku sprawdzianów
(obydwa równoległe wyniki uznane za poprawne). W tab. V
zestawiono dla regularności udział procentowy ocen bardzo
dobrych i dobrych oraz niezadowalających i złych, a także
średnią ocenę punktową danego oznaczenia. Mimo analogicznej skali punktowej (0 – 5 pkt.) ocena regularności jest
zasadniczo różna od ocen wykorzystywanych w programie
centralnym. Dane zbiorcze uzyskane w powszechnym programie chemicznym w r.2009 z rozbiciem na poszczególne
oceniane składniki, zestawiono w tab. V. Dla porównania
podano wyniki uzyskane 2 i 4 lata wcześniej. Poprawa przy
ocenie vs xog czy nawet xmet jest znikoma, ale przy ocenie
vs xmet-ap czy xsyst jest już zdecydowanie bardziej wyraźna.
Przypuszczalnie jest to związane z postępującą korzystną
zmianą wyposażenia. Wyraźny jest też wzrost przeciętnej
punktowej oceny regularności – z 4,055 pkt. w r. 2005 do
4,296 pkt. w r. 2009.
W tab. VI podano wyniki uzyskane najczęściej wykorzystywanymi analizatorami – nie jest to ranking tych aparatów!
Wyniki kilku typów analizatorów, zwłaszcza przy ocenie vs
xsyst, są wysoce korzystne – 96,8% poprawnych wśród wartości wyznaczonych aparatami Roche Modular, 96,0% - analizatorami Olympus czy 95,5% analizatorami Cobas Integra
dobrze świadczą o tych systemach. Niektórymi systemami
analitycznymi wyznacza się w materiałach kontrolnych wartości wysoce zbieżne (wysoki procent poprawnych vs xsyst),
ale wyliczone średnie systemowe są wyraźnie różne od średnich metodycznych czy ew. średnich ogólnych. W wypadku
8 wykorzystywanych w ciągu roku materiałów kontrolnych
najprostszą formą przekazania zintegrowanej informacji jest
podanie procentu wyników ocenionych jako poprawne w
stosunku do kolejnej przyjętej wartości umownie należnej.
Wartości wyznaczane w materiałach kontrolnych analizatorami Vitros są często zdecydowanie odmienne, niż wyznaczone innymi aparatami. W efekcie niewiele ponad połowa
wyników kontrolnych uzyskanych aparatami Vitros została
oceniona jako poprawne w stosunku do średnich ogólnych z
wszystkich nadesłanych wyników. Jednocześnie wyznaczane wartości są zbieżne, co warunkuje wysoką poprawność
przy ocenie w stosunku do średnich metodycznych oraz
równych im (system zamknięty!) średnich metodyczno-aparaturowych czy metodyczno-aparaturowo-odczynnikowych.
Mimo wykorzystywania odpowiednich metod, wartości wyznaczane w materiałach kontrolnych aparatami Dimension
są często odmienne od średnich metodycznych. W efekcie z
niemal 5 tys. wyników kontrolnych wyznaczonych aparatami
Dimension w 2009r. jako poprawne zakwalifikowano tylko
77,6% przy ocenie vs xog , ale już 84,4% vs xmet (= + 6,8%) i
93,3 % (kolejne + 8,9%) przy ocenie vs xmet-ap. Wykorzystywanie w praktyce wyłącznie odczynników firmowych powo-
duje nie tylko dla analizatorów Dimension ale i szeregu dalszych (Cobas Integra, Olympus, Accent, Pentra), że średnie
systemowe są identyczne ze średnimi metodyczno-aparaturowymi, taka sama jest więc ocena wyznaczanych wartości.
Niestety szereg analizatorów wykorzystuje bardzo zróżnicowane odczynniki, co odbija się negatywnie na możliwościach
oceny wyznaczanych wartości. Przykładem mogą być dwa
analizatory f-my Abbott – wycofany, wg firmy zapomniany Alcyon (w r. 2009 – ciągle ok. 15-18 szt.) i nowoczesny Architect (także ok. 15 szt.). Oznaczenia na Alcyonach prowadzone są z wykorzystaniem odczynników kilkunastu dostawców,
co powoduje, że żadnej części z 1200 wyznaczonych w r.
2009 wyników kontrolnych nie można było ocenić wzgledem
średnich systemowych. Jednocześnie z analizatorami Architect oznaczenia prowadzone są wyłącznie z odczynnikami
dostawcy aparatów i 96,7% z ponad tysiąca wyników mogło zostać ocenionych w stosunku do wysoce korzystnych
średnich metodyczno-aparaturowo-odczynnikowych. Jak
istotny może być wpływ wykorzystywanych odczynników
(i skojarzonych z nimi kalibratorów?) przedstawiono już w
ubiegłym roku na przykładzie aparatów Konelab. Z analizatorami tymi wykorzystywane są odczynniki f-my Thermo/
Kone albo bioMerieux (dystrybutor tych analizatorów). Dla
wielu oznaczanych składników rodzaj wybranych odczynników wydaje się nie mieć znaczenia, a wyznaczane wartości
nie różnią się lub różnią się tylko sporadycznie. Jednak dla
niektórych składników sytuacja jest odmienna – w 17 wykorzystanych w latach 2008-2009 materiałach kontrolnych
wartości cholesterolu wyznaczone odczynnikami bioMerieux
były 17 razy wyższe niż wyznaczone odczynnikami Thermo/
Kone – średnio o + 4,0% (s = 1,01%), z tego 15 razy różnica
była statystycznie istotna przy ocenie zarówno testem parametrycznym (test t-Studenta) jak i nieparametrycznym (test
U Manna-Whitneya). Podobnie 17 razy odczynnikami (i kalibratorami?) f-my bioMerieux wyznaczono niższe niż odczynnikami Thermo/Kone wartości moczanów (x = - 4,74%, s =
1,7%, 15 x różnica istotna) czy triglicerydów (x = - 4,76%,
s = 2,20%, testem U różnice 16 x istotne). Oczywiście w
przypadku mniej licznej grupy aparaturowej (aparatów Konelab ok. 100 szt.) i bardziej zróżnicowanych odczynników
przeprowadzenie takich porównań nie jest możliwe, jednak
przedstawiony przykład wyraźnie obrazuje wpływ odczynników na wyznaczane wartości. Z punktu widzenia organizatorów sprawdzianów pożądana byłaby maksymalna unifikacja
zaopatrzenia odczynnikowego. Z wielu przyczyn nie jest to
możliwe, istotne jest jednak wyeliminowanie odczynników używanych (lub zgłaszanych pomyłkowo) przez pojedyncze tylko
laboratoria, co wyklucza możliwość ich racjonalnej oceny.
Sprawdziany hematologiczne.
Sprawdziany hematologiczne przeprowadzane są dwukrotnie w ciągu roku, każdorazowo wykorzystując dwa materiały
kontrolne. Ocenie podlega 5 składników mierzalnych – hematokryt, stęż. hemoglobiny oraz liczba erytrocytów, krwinek białych i płytek oraz 3 pochodne parametry wyliczane
23
24
BioMerieux/Kone-Konelab
Olympus
Cormay – Accent 200,300
Roche – Cobas Mira
AMP Polska – Flexor
Ortho Clin.Diagn. – Vitros
Horiba ABX – Pentra 400
Roche – Hitachi serii 9..
Dade Behring – Dimension
BioMaxima–Metrolab
Cormay – Prestige 24, 24i
Bayer – Express
Cormay – Lumen, Livia
Mindray – BS120-400
Bayer – Advia 1650,1200
Roche – Modular
-13-02
-78-01
-18-04
-44-02
-03-01
-35-01
-50-01
-44-05
-19-01
-91-02
-18-03
-08-01
-18-01
-69-01
-08-03
-44-08
Poll Ltd – Epoll
Marcel – Euro
Pointe – Pointe 180
Analco – Stat Fax
-38-01
-31-01
-37-01
-04-01
Foto- i spektrofotometry
BioSystems A15, A25
-15-02
02-
Roche – Cobas Integra
Analizatory
nazwa
i model aparatu
-44-04
01-
kod
aparatu
29
35
61
196
24
25
26
27
35
38
39
39
47
50
52
53
57
75
89
101
143
238
n
apar.
2670
2874
5750
21821
3585
3545
2084
2570
3930
4508
3957
4788
6199
7766
7789
6878
7413
7519
14333
15705
15551
35172
n
wyn.
75,5%
79,6%
76,6%
77,2%
85,1%
83,7%
80,2%
82,4%
82,0%
84,9%
77,1%
77,6%
85,6%
84,0%
56,2%
79,3%
83,2%
82,5%
86,8%
84,5%
80,6%
88,2%
xog
75,5%
80,1%
77,4%
78,9%
91,8%
87,4%
81,0%
83,4%
82,6%
86,9%
78,3%
84,4%
87,9%
86,2%
93,3%
82,0%
84,3%
84,3%
92,6%
87,2%
81,4%
94,0%
xmet
76,8%
80,7%
77,9%
80,3%
96,5%
91,0%
83,6%
84,8%
83,7%
88,2%
80,5%
93,2%
90,3%
89,0%
93,4%
87,2%
85,0%
86,8%
95,9%
91,5%
83,1%
95,4%
xmet-ap
%% wyników poprawnych vs
83,6%
81,1%
82,4%
82,0%
96,8%
90,9%
91,1%
85,2%
85,9%
88,4%
80,5%
93,3%
93,1%
89,4%
93,4%
90,7%
86,9%
86,9%
96,0%
92,7%
83,8%
95,5%
xsyst
14,8%
68,2%
55,5%
82,1%
98,6%
90,8%
30,1%
71,0%
67,1%
93,0%
92,7%
94,4%
74,6%
97,2%
100,0%
54,5%
53,4%
93,9%
98,6%
85,4%
95,6%
99,8%
X
374
412
844
2890
522
508
403
348
517
633
629
761
857
970
1035
918
963
1220
1911
2049
2197
4782
n zbior.
67,4%
67,0%
64,2%
72,8%
97,9%
89,8%
74,2%
87,4%
77,2%
81,5%
74,2%
89,1%
89,8%
87,4%
89,2%
81,6%
79,4%
83,8%
96,9%
92,0%
79,9%
93,6%
bdb+db
18,4%
15,3%
20,6%
13,1%
0,8%
2,2%
13,9%
5,8%
9,5%
8,4%
11,8%
3,2%
5,8%
3,5%
3,9%
8,2%
8,1%
6,3%
0,5%
2,3%
8,0%
2,7%
nzd+zła
3,693
3,760
3,594
3,921
4,831
4,587
3,928
4,388
4,103
4,250
3,946
4,549
4,466
4,497
4,520
4,255
4,202
4,321
4,806
4,612
4,205
4,674
± pkt.
35
4
6
4
11
12
7
14
4,507
4,784
4,287
4,147
4,231
4,434
4,434
4,406
4,383
3,946
4,183
54
71
51
38
40
25
39
35
6
13
4,300
4,784
2
11
3,928
4,355
2
19
26
25
33
41
4,065
22
4,190
79
3
2
49
80
4,575
141
A
158
Punktowa ocena regularności
4,869
4,692
4,806
4,800
4,707
4,799
4,614
4,776
4,839
4,761
4,848
B
Tabela VI
Program powszechny 2009. Ocena wyników uzyskanych najczęściej wykorzystywanymi aparatami (n ≥ 25) – podano odsetek wyników uznanych za poprawne vs xog, xmet, vs
xmet-ap i vs xsyst, w tym ostatnim wypadku w rubryce X podając odsetek wyników, które mogły zostać ocenione. W drugiej części tabeli podano ocenę regularności – liczbę ocenionych zbiorów, odsetek zbiorów dla których regularność oceniono jako b.dobrą lub dobrą oraz jako niezadowalającą i złą, a na końcu oceniane analizatory rozbito na dwie
podgrupy – wykorzystywane przez laboratoria nie biorące (A) lub biorące (B) udział w programie centralnym, w każdej podgrupie poza średnią oceną punktową podając liczbę
analizatorów.
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
Orphee Mythic 18
Swelab AC920, 970
CD serii 3...
Coulter ACT Diff
Advia 120, 2120
Micros 45
Mindray BC2800,
3000, 3200
Nihon Kohden 3diff
Celltac
Medonic CA 5..
-50-02
-18-03
-12-02
-01-04
-60-02
-08-03
-50-03
-69-01
Coulter Gen S,
LH750, 500
CD Ruby
ogółem
ogółem
ogółem
-01-06
r. 2009
r. 2008
r. 2007
-60-05
-18-02
-03-01
Pentra 5 diff
-01-03
-
13
34
31
-
48
34
70
38
90
40
75
197
117
-40-02
9
25
24
24
20
40
36
50
43
68
64
98
169
188
343
338
Sysmex SF...., XT....,
XE...., XS....
CD1600, 1700, 1800
483
513
28
25
22
18
35
34
42
40
45
61
84
92
140
261
338
486
n aparatów
J07
J08
J09
kod
nazwa
aparatu
modeli aparatów
08-40-01 Sysmex F-5.., 8..,
K1000, 4500, KX21
-50-01 Micros 60 3diff
30700
30580
30970
384
390
400
424
528
624
652
708
720
1032
1360
1568
2376
3888
5400
n wyn.
dla
składn.
7722
Hct
95,6
96,5
96,9
97,7
99,7
97,0
98,1
93,9
99,2
98,0
94,5
91,0
89,2
95,3
98,5
96,2
98,4
97,8
98,0
a
b
c
93,6
4,47
97,2
0,63
94,8
3,58
87,4
8,75
97,5
1,02
67,3
28,0
86,1
3,10
79,0
11,9
91,4
3,11
4,4
93,6
93,6
5,61
72,9
21,0
75,9
22,2
94,0
3,00
98,2
1,54
6,2
91,4
88,7
8,35
90,6
5,99
90,3
5,28
93,9
94,6
94,5
96,4
98,5
88,5
95,3
85,8
88,9
95,7
91,2
96,1
82,3
92,6
98,3
92,8
99,2
91,9
98,0
a
Hb
b
c
97,5
0,49
89,4
2,52
99,2
0,07
89,3
3,49
97,6
0,70
89,8
2,72
75,7
6,59
78,6
17,5
89,4
1,83
92,8
2,91
87,0
1,92
81,2
4,55
95,0
0,23
83,0
5,50
94,9
3,59
93,8
2,60
91,5
2,97
92,8
1,78
91,4
2,55
94,6
95,0
95,0
98,4
99,2
93,8
97,2
90,7
95,8
93,2
87,6
96,4
91,5
89,3
96,8
93,2
97,6
94,1
b
c
97,6
0,30
93,8
0,26
97,4
0,15
87,2
5,93
95,0
1,79
88,7
0,66
89,2
2,32
94,7
1,67
86,7
0,85
92,0
1,23
95,7
0,16
87,1
3,60
96,9
0,24
87,8
6,00
99,0
0,26
97,9
0,52
93,7
1,32
99,0
0,97
93,6
1,03
RBC
97,9
a
92,6
94,4
93,8
94,5
98,7
82,8
98,1
94,9
91,7
95,1
94,4
92,6
89,7
79,3
92,0
92,2
97,7
93,8
b
c
95,1
1,62
93,3
0,43
97,2
0,48
83,6
8,54
91,1
0,89
74,2
5,15
85,3
4,46
88,8
3,89
89,8
4,52
83,7
11,4
90,7
0,97
88,8
6,07
98,1
0
78,2
4,50
78,0
20,8
94,5
0
90,4
3,40
91,8
2,56
88,8
3,77
WBC
96,7
a
80,8
81,1
83,4
87,0
91,0
68,2
80,2
81,6
84,1
85,1
78,2
86,4
74,4
80,3
88,1
81,8
92,0
75,5
b
c
87,8
0,26
73,9
1,56
86,0
5,98
78,5
3,33
83,2
4,84
79,9
0,36
70,1
4,36
53,5
32,9
74,0
4,24
47,2
37,9
82,2
1,92
77,8
3,79
57,3
22,9
63,0
5,25
74,9
16,2
74,2
12,8
78,0
5,36
72,6
8,54
73,3
7,46
PLT
88,1
a
MCHC
a
b
c
97,1
90,9
6,15
94,6
94,1
0,53
96,8
96,6
0,26
96,4
94,4
2,02
98,8
97,6
1,21
96,2
77,5
18,8
88,6
88,5
0,09
91,0
90,4
0,55
93,1
92,4
0,71
98,5
2,0
96,5
95,7
95,7
0
95,3
87,6
7,66
97,2
77,4
19,8
93,5
93,5
0
99,7
99,7
0
94,5
9,9
84,6
95,8
88,9
6,83
95,9
99,0
5,87
95,0
90,2
4,83
97,9
98,2
97,9
97,4
100
94,2
99,5
97,5
98,9
99,2
95,9
99,4
95,9
97,3
99,6
98,3
99,7
96,4
b
c
98,6
0,02
95,8
0,61
99,7
0
98,0
0,34
99,7
0,06
97,0
0,30
96,5
-0,58
97,9
1,52
95,9
0
98,9
0,30
98,2
0,64
97,5
0,01
99,5
0
94,2
0
99,7
0,26
97,7
-0,26
97,3
0,58
97,5
0,64
97,3
0,61
MCH
98,7
a
97,2
97,9
98,2
100
100
98,0
96,9
97,4
98,9
98,8
97,6
91,0
92,9
98,7
98,9
98,8
98,5
98,6
b
c
96,3
2,37
98,6
0
96,4
2,08
97,6
1,26
98,0
0,90
78,2
20,4
95,4
-2,51
90,7
0,28
96,3
1,27
3,2
95,6
98,7
0,16
92,8
4,55
65,1
31,8
99,0
-1,00
100
0
2,6
97,4
94,2
4,00
93,5
4,39
94,2
2,99
MCV
98,7
a
93,5
94,2
94,5
95,7
98,4
89,5
95,3
92,1
94,2
95,5
91,6
93,0
88,1
91,1
96,4
93,7
97,5
92,8
b
c
94,7
1,96
92,0
0,81
95,9
1,57
89,5
4,21
95,0
1,41
81,6
9,55
85,8
2,23
84,2
8,79
89,5
2,06
53,1
42,4
92,7
1,42
85,8
6,39
83,2
12,1
86,6
2,91
93,0
5,32
59,6
36,1
90,1
4,32
90,4
3,83
89,9
3,56
razem
96,6
a
Tabela VII
Sprawdziany hematologiczne 2009. Dla poszczególnych składników podano uzyskiwany najczęściej wykorzystywanymi aparatami procent wyników uznanych za poprawne vs
średnie aparaturowe (a) i średnie ogólne z wszystkich wyników (b) oraz różnicę między tymi wartościami (c).
A.M. Brzeziński i B. Przybył-Hac
25
26
razem aparaty CellDyna
CD1600, 1800
CD serii 3...
CD Ruby
razem aparaty
Advia
Advia 60
Advia 70
Advia 120, 2120
razem aparaty
Orphee-Mythic
Mythic 18
Mythic 22
-01-03
-01-04
-01-06
08-08-
-08-01
-08-02
-08-03
08-18-
-18-03
-18-04
Aparaty ogółem
nazwa
i model aparatu
08-01-
08-
kod
aparatu
32
224
256
144
27
96
267
-
204
716
984
37,71
-1,90
39,86
+3,69
39,59
+2,99
33,94
-11,71
40,42
+5,15
38,44
0
36,22
-5,78
-
40,82
+6,19
39,73
+3,36
39,93
+3,88
38,44
32
224
256
144
28
96
268
-
204
716
984
7822
36,48
-2,09
39,13
+5,02
38,80
+4,13
32,99
-11,46
39,31
+5,50
37,40
+0,38
35,23
-5,45
-
39,61
+6,30
38,76
+4,02
38,89
+4,37
37,26
n
x Hct
Δ%vs xog
x Hct
n
Δ%vs xog
7822
W-08
mat.2
W-08
mat.1
36
256
292
142
32
72
246
36
172
678
924
7684
48,21
-2,98
51,40
+3,44
51,01
+2,66
43,78
-11,89
51,61
+3,86
50,80
+2,23
46,85
-5,72
46,98
-5,45
53,16
+6,98
50,92
+2,48
51,24
+3,12
49,69
n
x Hct
Δ%vs xog
J-08
mat.1
36
256
292
142
32
72
246
36
172
676
924
7682
16,92
-4,57
18,44
+4,00
18,25
+2,93
15,12
-14,72
18,62
+5,02
17,40
-1,86
16,24
-8,40
16,03
-9,59
18,85
+6,32
18,39
+3,72
18,48
+4,23
17,73
n
x Hct
Δ%vs xog
J-08
mat.2
24
344
368
157
20
88
265
80
180
628
948
7881
25,22
-2,85
27,93
+7,59
27,75
+6,90
22,76
-12,33
27,08
+4,31
25,94
-1,08
24,14
-7,01
22,02
-15,18
27,30
+5,16
27,07
+4,28
27,12
+4,47
25,96
n
x Hct
Δ%vs xog
W-09
mat.1
24
344
368
159
20
88
267
80
180
628
948
7883
36,28
-3,25
39,80
+6,13
39,57
+5,52
32,86
-12,37
38,85
+3,60
37,82
+0,85
34,94
-6,83
32,92
-12,21
39,52
+5,39
38,80
+3,47
38,94
+3,84
37,50
n
x Hct
Δ%vs xog
W-09
mat.2
32
336
368
168
24
72
264
112
180
560
904
7842
15,78
-5,40
17,57
+5,34
17,41
+4,38
14,39
-13,73
17,21
+3,18
16,28
-2,40
15,16
-9,12
14,78
-11,39
17,69
+6,06
17,42
+4,44
17,45
+4,62
16,68
n
x Hct
Δ%vs xog
J-09
mat.1
32
336
368
168
24
72
264
112
180
560
904
7841
27,68
-2,30
30,07
+6,14
29,86
+5,40
24,69
-12,85
28,98
+2,29
28,15
-0,64
26,02
-8,15
25,09
-11,44
30,07
+6,14
29,66
+4,69
29,67
+4,73
28,33
n
x Hct
Δ%vs xog
J-09
mat.2
-3,17
+5,17
+4,36
-12,63
+4,81
-0,315
-7,06
-10,88
+6,07
+3,81
+4,16
x
1,2314
1,4304
1,4997
1,1050
1,0942
1,5044
1,3788
3,2243
0,5674
0,7103
0,5269
s
opracowanie zbioru
8 wyników
Tabela VIII
Sprawdziany hematologiczne 2008-2009 w 8 materiałach kontrolnych podano wartości hematokrytu ogółem oraz wyznaczone kilku modelami aparatów 3 producentów a poniżej różnicę procentową w stosunku do średnich ogólnych. W ostatniej kolumnie – wartości średnie.
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
A.M. Brzeziński i B. Przybył-Hac
– MCHC, MCH i MCV. Sprawdzianami powinny być objęte wszystkie wykorzystywane przez uczestników programu
analizatory/liczniki hematologiczne. Każdym aparatem należy wykonać po dwa niezależne oznaczenia w dwóch kolejnych dniach – średnia z czterech pomiarów jest podstawą
oceny błędu systematycznego, natomiast różnica między
równoległymi oznaczeniami jednego dnia może być miarą
powtarzalności, a w dwu kolejnych dniach – odtwarzalności
wyników. Sumarycznie wyniki uzyskane najczęściej wykorzystywanymi aparatami podano w tab.VII. W tabeli podano nr kodowy grupy aparatów wg aktualnego „Przewodnika ...”, hasłową nazwę omawianych aparatów, zmiany ich
liczebności w ostatnich latach oraz średnią ocenianą liczbę
wyników pojedynczego składnika. Ponieważ w tabeli zestawiono wyniki uzyskane w czterech różnych materiałach kontrolnych wykorzystanych w 2009 r., to jedyną możliwością
zintegrowanej oceny było przedstawienie odsetka wyników
uznanych za poprawne w stosunku do wartości średnich
wyznaczonych danym aparatem (w tabeli kolumny a) bądź
średnich ogólnych z wszystkich nadesłanych wyników (w
tabeli kolumny b). Poniżej przedstawiono różnicę między
tymi wartościami (wartość c). Na dole tabeli podsumowano
wyniki uzyskane w r. 2009 w zestawieniu z wynikami w dwu
ostatnich latach. Korzystne zmiany są bardzo nieznaczne,
należy jednak uwzględnić, że dotyczą bardzo dużych liczebności – w sumie w ciągu roku ocenianych jest niemal 250
tys. wyników. Wartość przedstawionej tabeli podważa obawa
o właściwą klasyfikację aparatów. Teoretycznie zróżnicowa-
nie aparatów zgłaszanych przez uczestników sprawdzianów
jest zaskakująco duże i uwzględnienie wszystkich modeli
spowodowałoby stworzenie bardzo znacznej liczby grup, w
dużej mierze zbyt mało licznych dla jakiejkolwiek oceny. Bardzo często różnice między poszczególnymi modelami wydają się pozorne, a ich rozdzielanie powoduje tylko szkodliwe
mnożenie odrębnych grup o automatycznie zmniejszonej
liczebności. Ten proces łączenia/dzielenia poszczególnych
modeli jest bardzo trudny, czasem ograniczony jedynie do
„5 diff” i „3 diff”. Organizatorzy sprawdzianów niestety nie
dysponują wystarczającymi kompetencjami, a tym bardziej
dobrą znajomością wszystkich eksploatowanych w Polsce
analizatorów/liczników hematologicznych. Przedstawiciele
producentów/importerów z różnych przyczyn nie kwapią się
z pomocą mimo, że to im przede wszystkim powinno zależeć
na korzystnej ocenie rozprowadzanego sprzętu. Skutki nie
zróżnicowania aparatów Advia (mod. 60, 70 i 120) omówiono
w sprawozdaniu za r.2006, a popełnione błędy zostały wówczas łatwo wychwycone. Nie zawsze sytuacja jest tak oczywista. Z przyczyn technicznych stosunkowo najczęściej występują różnice w wyznaczanych wartościach hematokrytu.
Przedstawiono to w tabeli VIII dla 8 materiałów kontrolnych
wykorzystanych w latach 2008/2009, zestawiając średnie
wartości hematokrytu wyznaczone aparatami 3 firm oraz poszczególnymi modelami tych firm z wartościami hematokrytu
z wszystkich nadesłanych wyników (dla każdego materiału
7,5-7,9 tys. wyników), przyjętymi za umownie należne. Jak
wynika z tabeli, wyrażone w procentach różnice między tymi
Tabela IX
Sprawdziany hematologiczne 2008-2009r. Analiza wariancji średnich wartości Hct, Hgb, i RBC, wyznaczonych aparatami Orphee Mythic oraz Mythic 18 i Mythic 22. Test post hoc Tukey’a dla nierównych liczebności. Gwiazdkami
zaznaczono istotne różnice w pojedynczym materiale.
wartości średnie
HCT
HGB
RBC
W-08
J-08
W-09
J-09
mat. 1
mat. 2
mat. 1
mat. 2
mat. 1
mat. 2
mat. 1
mat. 2
{1}
{2}
{3}
Orphee
Mythic
39,60
38,77
50,90
18,16
27,68
39,55
17,36
29,73
Orphee Mythic
{1}
**
****
****
Mythic 18
39,87
39,07
51,29
18,33
27,84
39,75
17,51
29,93
Mythic 18
{2}
**
Mythic 22
37,78
36,68
48,14
16,89
25,35
36,68
15,82
27,68
Mythic 22
{3}
****
****
****
****
{1}
{2}
{3}
***
***
****
****
****
****
Orphee
Mythic
13,26
12,98
17,18
5,88
9,24
13,25
5,61
10,03
Orphee Mythic
{1}
Mythic 18
13,38
13,13
17,39
5,96
9,29
13,31
5,65
10,09
Mythic 18
{2}
***
***
Mythic 22
12,45
11,95
15,75
5,36
8,54
12,30
5,15
9,44
Mythic 22
{3}
****
****
****
****
{1}
{2}
****
****
{3}
Orphee
Mythic
4,465
4,439
5,938
2,044
3,091
4,492
2,083
3,505
Orphee Mythic
{1}
**
Mythic 18
4,459
4,437
5,933
2,049
3,095
4,494
2,088
3,509
Mythic 18
{2}
**
Mythic 22
4,507
4,456
5,976
2,004
3,033
4,464
2,026
3,455
Mythic 22
{3}
**
**
27
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
wartościami (wiersze dolne każdego pola) są z zasady ukierunkowane, co podsumowano w kolumnie ostatniej (średnia
ze zbioru 8 różnic oraz odchylenie standardowe). Różnice
między różnymi modelami mogą być nieznacznie lub wysoce istotne, a ich wychwycenie i poprawna ocena zależy od
liczebności odpowiednich grup. Zróżnicowanie aparatów Orphee Mythic na modele Mythic 18 i Mythic 22 wprowadzono
dopiero w ubiegłym roku, zgodnie z sugestią importera (fma Cormay). Pewnym usprawiedliwieniem opóźnienia/przeoczenia może być bardzo duża różnica liczebności tych modeli – jesienią 2009r. wykorzystywano 84 szt. mod. Mythic
18 i zaledwie 8 szt. mod. Mythic 22. Automatycznie średnie
ogólne dla aparatów Orphee Mythic są zależne od wartości
wyznaczonych mod. Mythic 18, z wysoce korzystną ich oceną – i automatycznie ze znacznie gorszą oceną stosunkowo
nielicznych wyników wyznaczonych ap. Mythic 22. W tabeli
IX przedstawiono analizę wariancji wartości trzech składników (hematokrytu, hemoglobiny i RBC), wyznaczonych w
2008/2009r. w 8 materiałach kontrolnych aparatami Orphee
Mythic oraz modelami Mythic 18 i Mythic 22. Różnice statystycznie istotne w poszczególnych materiałach zaznaczono
gwiazdkami, a duże zróżnicowanie liczebności porównywanych grup (ogółem – ± 92 ap. = 368 wyników, w tym Mythic
18 – 85 aparatów, Mythic 22 – 7 aparatów) wymusiło wykorzystanie do wyznaczania kontrastów test Tukey`a (zamiast
normalnie wykorzystywanego testu Scheffego). Jak wynika
z tabeli, dla wartości hematokrytu i hemoglobiny istotne róż-
nice między wartościami wyznaczonymi poszczególnymi
modelami są regułą (8 razy w 8 materiałach), dodatkowo
występują dość liczne różnice także dla wartości hemoglobiny wyznaczonych modelem 18, co wynika przede wszystkim z dużej liczebności a małego rozproszenia ocenianych
wyników.
Powyższy przykład przedstawiono, by zobrazować trudności racjonalnego wyodrębnienia grup homogennych. Pomoc
wszystkich uczestników sprawdzianów, a tym bardziej pomoc zespołów serwisowych poszczególnych firm jest wysoce pożądana!
Sprawdziany hematologiczne nie mają nawet najprostszej
formy okresowej zintegrowanej oceny wyników uzyskiwanych przez poszczególnych uczestników. Wynika to ze zbyt
małej liczby różnych materiałów kontrolnych ocenianych w
ciągu roku (zaledwie 4), niepewności odnośnie właściwej klasyfikacji analizatorów/liczników hematologicznych oraz nie
ustalonych granic dopuszczalnego błędu. W tabeli X zestawiono dla 8 materiałów wykorzystanych w latach 2007/2008
procent wyników uznanych za poprawne zależnie od przyjętych granic dopuszczalnego błędu – podano wartości przyjęte (kolumna zacieniona) oraz granice wyraźnie węższe i
szersze. Automatycznie zmienia się ocena nadsyłanych wyników – np. zgodnie z przedstawionymi danymi oznaczania
liczby krwinek białych, błędem ≤ 5% obarczonych jest 79%
porównywanych wyników, błędem ≤ 10% - 95,3%, a błędem
≤ 15% - 98,1% ocenianych w 8 materiałach kontrolnych wy-
Tabela X
% wyników poprawnych zależnie od wielkości dopuszczalnego błędu. n = 8 – liczba ocenianych materiałów kontrolnych w latach 2007-2008, x - średni procent wartości poprawnych, s – odchylenie standardowe zbioru 8 wyników.
błąd przyjęty!
Dopuszczalny błąd
± 4,0%
± 6,0%
± 8,0%
± 10,0%
± 12,0%
± 15,0%
Hematokryt ±popr.% n = 8
x
s
79,15%
3,15
91,15%
1,91
96,08%
0,94
98,08%
0,50
98,85%
0,20
99,44%
0,14
MCV
±popr.% n = 8
x
s
85,51%
1,83
94,44%
0,86
97,52%
0,53
98,70%
0,27
99,18%
0,15
99,60%
0,08
MCH
±popr.% n = 8
x
s
85,25%
3,15
94,98%
1,52
98,02%
0,67
99,11%
0,29
99,46%
0,14
99,75%
0,08
x
s
77,86%
3,81
90,34%
2,72
95,38%
1,45
97,58%
0,80
98,56%
0,40
99,31%
0,14
± 3,0%
± 4,0%
± 5,0%
± 6,0%
± 8,0%
± 10,0%
MCHC
±popr.%
n=8
Dopuszczalny błąd
Hemoglobina ±popr.% n = 8
x
s
82,71%
3,20
90,01%
3,06
94,26%
2,05
96,56%
1,12
98,56%
0,70
99,26%
0,35
RBC
x
s
81,31%
3,10
90,34%
1,97
94,79%
1,01
97,29%
1,32
98,80%
0,39
99,41%
0,19
± 5,0%
± 7,0%
± 8,0%
± 9,0%
± 10,0%
± 12,0%
x
s
78,96%
4,61
90,38%
2,30
93,46%
2,26
95,29%
1,36
96,70%
0,89
98,09%
0,58
± 5,0%
± 7,0%
± 10,0%
± 12,0%
± 15,0%
± 18,0%
x
s
53,71%
8,80
67,52%
9,53
80,95%
8,80
86,61%
7,77
91,78%
6,13
94,86%
4,61
±popr.% n = 8
Dopuszczalny błąd
WBC
±popr.% n = 8
Dopuszczalny błąd
PLT
28
±popr.% n = 8
A.M. Brzeziński i B. Przybył-Hac
Rycina 2
Sprawdziany hematologiczne 2006-2009r. (8 sprawdzianów – 16 materiałów). Wpływ stężeń oznaczanych składników na uznaną poprawność wyników. Współczynnik
korelacji i linia trendu – aproksymacja funkcją kwadratową.
ników. Jednocześnie uzyskiwana poprawność nadsyłanych
wyników wydaje się zależeć nie tylko od przyjętych granic
dopuszczalnego błędu, lecz także od wartości bezwzględnych ocenianych składników. Przedstawiono to graficznie
na ryc. 2 dla trzech składników (Hct, Hgb, RBC) w 16 materiałach kontrolnych wykorzystanych w latach 2006-2009 w
postaci linii trendu (aproksymacji funkcji kwadratowej) oraz
współczynnika korelacji R – przy 16 ocenionych wartościach
korelacja jest niewątpliwie wysoce istotna. Stężenie ocenianych składników jest więc dodatkowym elementem, utrudniającym poprawną ocenę nadsyłanych wyników. Nie ma to
żadnego znaczenia dopóki program jest wyłącznie szkoleniowo-informacyjnym. Wymagania mogą być nawet wyraźnie zawyżane, mobilizując do wzmożonych starań. Jeżeli
jednak program miałby charakter klasyfikacyjny, potencjalnie dyskwalifikując część wykonawców, wówczas zarówno
przyjmowane wartości umownie należne, jak i dopuszczalne
granice błędu powinny być dobrane znacznie staranniej i
oparte o powszechnie akceptowane ustalenia.
Sprawdziany koagulologiczne.
W r. 2009 przeprowadzono dwa sprawdziany oznaczeń koagulologicznych (Wiosna-Jesień), każdorazowo wykorzystując dwa materiały kontrolne – z wartościami prawidłowymi
i patologicznymi. Porównawczą oceną objęto oznaczenia
czasu protrombinowego (PT wsk. i PT-INR), czasu częściowej tromboplastyny po aktywacji (APTT), czasu trombinowego (TT) oraz stężenia fibrynogenu, przyjmując jako wartości
umownie należne średnie ogólne z wszystkich nadesłanych
wyników oraz średnie aparaturowe – z wyników (n ≥ 6) uzyskanych tym samym modelem wg przyjętej klasyfikacji. Najpopularniejsze było oznaczenie PT (1270 koagulometrów)
i APTT (1180 koagulometrów), natomiast oznaczenia TT
wykonywane były wręcz sporadycznie na nielicznych tylko
aparatach (ok. 75). Duże było zróżnicowanie wykorzystywanych koagulometrów – dla najczęściej oznaczanego czasu
protrombinowego korzystano (wg przyjętej w aktualnym
„Przewodniku ...” klasyfikacji) 29 modeli koagulometrów 12
producentów (z tego 7 modeli przy n < 6). Ponad 60% wyników wyznaczonych zostało na aparatach produkcji dwóch
polskich firm – BioKsel i ELZA bis Kselmed. Jeszcze większe
niż aparatów było zróżnicowanie wykorzystywanych odczynników – wiosną 2009 do oznaczania czasu protrombinowego posłużono się odczynnikami 34 producentów/dostawców,
choć połowa z nich była deklarowana przez mniej niż 6 laboratoriów (granica oceny). Ponad 6% nadesłanych wyników
czasu protrombinowego wyznaczono w pojedynczym układzie aparat/odczynnik, co z góry wykluczało wszelką ocenę.
Wydaje się, że część z tych wartości była wynikiem pomyłek
– mało prawdopodobne, by wśród 1277 wyników PT zaledwie po jednej wartości wyznaczono odczynnikami jakoby
dostarczonymi przez f-mę Trident, MaxMat czy DPC. Najczęściej posługiwano się odczynnikami dostarczonymi przez
f-mę BioKsel (395 wyników, 10 różnych modeli), Dade-Behring obecnie Siemens (166 wyników, 10 modeli), ELZA bis
Kselmed (118 wyników, 5 modeli), Roche Diagnostics (107
wyników, 8 modeli). Oczywiście możliwości/poprawność
oceny są wprost proporcjonalne do wielkości i jednorodności grupy odniesienia. Zestawienie ocen wyników PT-INR
oraz APTT, wyznaczonych najczęściej wykorzystywanymi
w 2009r. koagulometrami przedstawiono w tabeli XI. Nie
jest chyba przypadkiem, że najkorzystniej oceniono wyniki
PT-INR wyznaczone aparatami Roche STA, Siemens BCS
czy Sysmex CA serii 5.. – zwłaszcza z dwoma pierwszymi
29
30
-26-04
-26-02
-26-01
-44-02
-19-04
-13-01
-19-01
-44-01
-41-02
-40-01
-27-01
Bio-Ksel
-41-01
ACL Elite Pro
IL
ACL 8000-10000
IL
ACL 100-7000
IL
Start wszystkie
Roche
Fibrintimer II
Dade Behring
Option wszystkie
bioMerieux
BCS
Dade Behring
STA Compact
Roche
CC 3002
Bio-Ksel
CA serii 5..
Sysmex
K3002 wszystkie
Eliza bis Kselmed
Chrom 7, CC 3003
ogółem
nazwa
i model aparatu
07-
kod
aparatu
16
28
40
36
44
56
46
52
25
75
365
363
1270
W-09
24
24
29
38
42
45
49
50
69
87
311
348
1256
J-09
n aparatów
n
40
52
69
71
86
101
95
102
94
162
676
711
2526
a/b
70,00%
70,00%
78,85%
78,85%
76,81%
71,01%
80,28%
78,87%
74,42%
73,26%
70,30%
72,28%
86,32%
69,47%
89,22%
87,25%
70,21%
73,40%
87,65%
87,04%
67,60%
67,46%
72,01%
72,01%
73,99%
72,64%
mat. N
n
40
52
69
71
86
101
95
102
94
162
675
713
2527
a/b
52,50%
7,50%
59,62%
11,54%
63,77%
34,78%
63,38%
30,98%
65,12%
66,28%
48,51%
45,54%
80,00%
72,63%
67,65%
28,43%
62,76%
58,51%
81,48%
77,16%
47,11%
40,89%
70,83%
70,41%
62,05%
53,46%
mat. P
PT-INR
n
80
104
138
142
172
202
190
204
188
324
1351
1424
5083
a/b
61,25%
38,75%
69,23%
45,19%
70,29%
52,90%
71,83%
54,93%
69,77%
69,77%
59,40%
58,91%
83,16%
71,05%
78,43%
57,84%
66,49%
65,96%
84,57%
82,10%
57,36%
54,18%
71,42%
71,21%
67,62%
62,68%
razem
n
40
52
69
65
80
98
95
102
86
161
606
656
2347
a/b
87,50%
75,00%
82,69%
69,23%
72,46%
71,01%
64,62%
69,29%
60,00%
60,00%
50,00%
56,12%
72,63%
62,10%
80,39%
80,39%
61,63%
55,81%
75,40%
71,43%
55,78%
56,27%
68,44%
67,53%
65,79%
63,53%
mat. N
n
40
52
69
65
80
98
95
102
86
160
606
656
2346
a/b
32,50%
42,50%
65,38%
42,31%
52,17%
31,88%
43,08%
46,15%
40,00%
27,50%
40,82%
42,85%
67,37%
4,21%
57,84%
31,37%
45,35%
27,91%
52,50%
14,38%
33,83%
31,02%
48,02%
35,21%
45,82%
31,24%
mat. P
APTT
n
80
104
138
130
160
196
190
204
172
321
1212
1312
4693
75,00%
58,75%
74,04%
55,77%
62,32%
51,45%
53,85%
57,69%
50,00%
43,75%
45,41%
49,49%
70,00%
33,16%
69,12%
55,88%
53,49%
41,86%
64,48%
42,99%
44,80%
43,65%
58,23%
51,37%
55,81%
47,39%
razem
Tabela XI
Sprawdziany koagulologiczne 2009. Podano ogółem i dla wybranych aparatów (n > 20) liczbę ocenianych wyników i odsetek wyników uznanych za poprawne w stosunku do
wartości średnich ogólnych (a-wiersz górny) a poniżej w stosunku do średnich aparaturowych (b-wiersz dolny) – z rozbiciem na mat. N, mat. P i razem – dla oznaczeń PT-INR
oraz APTT.
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
A.M. Brzeziński i B. Przybył-Hac
koagulometrami wykorzystywane są wyłącznie odczynniki firmowe (Roche – 100%, Siemens – 98% wyników). W
materiałach prawidłowych średnie aparaturowe nie różniły
się istotnie od średnich ogólnych, co powodowało zbliżony
odsetek wyników uznanych za poprawne przy ocenie wobec
tych dwu wartości umownie należnych (ogółem – 72,64%
i 73,99%, Sysmex CA serii 5.. – 87,04% i 87,65%, Roche
STA – 87,25% i 89,22%). Odmiennie zostały ocenione wyniki wyznaczone na koagulometrach Siemens BCS, którymi
w materiale prawidłowym uzyskano wartości wyraźnie wyższe od średnich ogólnych, co zaowocowało stosunkowo niską poprawnością vs xog, przy wyraźnie dobrej ocenie vs xap
(69,5% i 86,3% poprawnych, Δ = 16,8%).
Zupełnie inna jest ocena wyników wyznaczonych w materiałach patologicznych. Tylko koagulometrami BCS uzyskano
przy ocenie vs xog wyniki korzystniejsze niż w materiale prawidłowym, przy nieznacznie gorszej ocenie vs xap („zaledwie”
80% ocen poprawnych, najkorzystniejsze wyniki uzyskano
ap. Sysmex CA 5.. – 81,5% poprawnych). Jednak wyniki BCS
były wyjątkowe – z zasady wyniki wyznaczone w materiałach
patologicznych były zdecydowanie gorsze niż w materiałach
prawidłowych, przede wszystkim wobec średnich ogólnych
(koagulometry STA – 28,4% poprawnych vs xog i 67,65% vs
xap), częściowo tylko kompensowanych wyraźnie korzystniejszymi ocenami vs xap (w przedstawionym przykładzie koagulometrów STA – o niemal 40%!). Wydaje się, że bardzo
pilnym zadaniem zarówno dla wykonawców oznaczeń jak i
producentów/dystrybutorów wykorzystywanych koagulometrów jest dążenie do unifikacji odczynników, co niewątpliwie
poprawi ocenę wyznaczanych wartości, zwłaszcza wobec
średnich aparaturowych. Mało prawdopodobne, by zniwelowało to różnice między wartościami wyznaczanymi różnymi
koagulometrami w materiałach patologicznych. Warto jednak podkreślić, że częścią nowoczesnych koagulometrów
nawet w materiałach patologicznych ocena wyznaczonych
wyników nie jest zła – być może należałoby przyjąć szersze
granice dopuszczalnego błędu.
Oznaczanie czasu trombinowego jest bardzo mało popularne – jesienią 2009 wykonane zostało w zaledwie 77 laboratoriach, w tym tylko dla 55 możliwa była ocena (n aparatów
≥ 6). Wśród ogółem nadesłanych w 2009 r. 300 wyników TT
jako poprawne w stosunku do średnich ogólnych oceniono
56,0%, a wobec średnich aparaturowych – 61% wyników.
Oznaczenia fibrynogenu wykonywało nieco ponad 700 laboratoriów – wśród ocenianych w 2009r. 2900 wyników za
poprawne vs xog uznano 58,8%, a vs xap – 66,2% nadesłanych wyników. Dla oznaczeń fibrynogenu różnice oceny
między materiałami N i P były nieznaczne (58,8% i 58,9%
oraz 67,9% i 64,6% poprawnych). Należy podkreślić bardzo
dobrą ocenę, wyraźnie wyższą od średniej, wyników wyznaczonych aparatami f-my BioKsel model Chrom 7 i CC 3003
– 66,8% poprawnych vs xog i 77,7% vs xap, co przypuszczalnie wynika z faktu, że ponad 93% nadesłanych wartości
wyznaczono odczynnikami dostarczonymi przez BioKsel.
Są to wyniki nawet korzystniejsze, niż wyznaczone ap. BCS
f-my Siemens (70,9% poprawnych) czy STA f-my Roche
(73,4% poprawnych vs xap). Wpływ zróżnicowania wykorzystywanych odczynników można zobrazować na przykładzie
koagulometru K 3002 f-my ELZA bis Kselmed – 135 wartości
wyznaczono korzystając z odczynników aż 15 firm (z tego
zaledwie 6 przy n > 6 - 8, 10, 27, 18, 20, 31 = 114 wyników
tj. 84,4% nadesłanych), co spowodowało odpowiednie zróżnicowanie wartości aparaturowo-odczynnikowych i zaledwie
47,6% poprawnych vs xap. Niewątpliwie gdyby podobnie jak
z aparatami Chrom 7/CC 3003 także z koagulometrami K
3002 wykorzystywane były zunifikowane odczynniki, to wyniki byłyby zdecydowanie korzystniejsze. Wydaje się, że
radą/pomocą laboratoriom powinni służyć dostawcy eksploatowanego sprzętu.
Sprawdziany immunochemiczne.
Zarówno potrzeby kliniczne, jak i szybko korzystnie zmieniające się możliwości techniczne laboratoriów warunkują
rosnącą popularność oznaczeń wykonywanych technikami
immunochemicznymi, przede wszystkim oznaczeń hormonów, markerów nowotworowych, specyficznych białek czy
części leków. Oczywistym następstwem jest konieczność
oceny jakości wyznaczanych wartości. Nie jest to łatwe,
ponieważ oznaczenia immunochemiczne są z założenia
bardzo wrażliwe na tzw. efekt podłoża, czego efektem są
bardzo zróżnicowane wartości, wyznaczane w stabilizowanych materiałach kontrolnych różnymi systemami analitycznymi (aparat-odczynnik-kalibratory). Stosunkowo dawno
Centralny Ośrodek wykorzystał możliwość oceny pewnych
składników oznaczanych metodami immunochemicznymi w „normalnych” materiałach kontrolnych używanych w
sprawdzianach chemicznych. Zwykle możliwe są oznaczenia hormonów tarczycy (TSH, FT3, FT4), niektórych innych
hormonów (estradiolu, progesteronu, prolaktyny, FSH i LH,
a nawet testosteronu i kortyzolu), a także podstawowych
markerów nowotworowych (całk. PSA, AFP, CEA) czy ferrytyny. Zaletą tego rozwiązania jest brak dodatkowych kosztów (zrezygnowanie z zasady kosztownych, specjalnych
materiałów kontrolnych) oraz ogólna dostępność – każdy
uczestnik powszechnego programu chemicznego może
dodatkowo poddać ocenie określone oznaczenia immunochemiczne adekwatnie do własnych potrzeb i możliwości.
Wady są też bardzo istotne – często spotykane zbyt niskie
stężenia oznaczanych składników, utrudniające/uniemożliwiające prawidłową ocenę, ograniczony wachlarz możliwych
do oznaczania składników, ścisłe powiązanie wyznaczonych
wartości z wykorzystywanym systemem analitycznym (aktualne dla wszystkich sprawdzianów immunochemicznych),
co wyklucza ocenę wyników uzyskanych techniką manualną
lub bardzo mało popularnymi analizatorami oraz brak informacji o systemowych wartościach należnych, wyznaczonych
przez producenta wykorzystywanych materiałów. W sumie
jednak zalety przeważają nad wadami i co roku przy okazji
sprawdzianów chemicznych przeprowadzane są dwa takie
sprawdziany immunochemiczne – w r. 2009 wiosną i jesie31
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
nią, obejmując oceną 18 składników. Najczęściej laboratoria
poddawały ocenie oznaczenia TSH (ok. 800 lab.), FT4 (ok.
730 lab.), FT3 (ok. 630 lab.) czy całkowitego PSA (ok. 520
lab.), najrzadziej – oznaczenia TT3, TT4 oraz digoksyny –
po ok. 60 lab. W sumie w 2 sprawdzianach w 4 materiałach
kontrolnych wyznaczono dla 18 składników ponad 25 tys.
wartości. Dobra zgodność oceny poprawności wg średnich
ogólnych i systemowych może świadczyć o małych różnicach
w wartościach wyznaczanych poszczególnymi systemami –
dla TSH z ponad 3100 ocenionych w ciągu roku wyników
jako poprawne w stosunku do średnich ogólnych uznano
86,1%, a w stosunku do średnich systemowych – 89,7% (Δ =
3,6%). Na drugim biegunie można umieścić oznaczenia, dla
których wartości są bardzo zróżnicowane zależnie od wykorzystywanego systemu analitycznego – np. FT4 (zaledwie
33,8% z 2870 wyników oceniono jako poprawne vs średnie
ogólne, a aż 86,5% - vs średnie systemowe, Δ = 52,7%!) czy
progesteronu (odpowiednio z 1370 wyników 48,2% poprawnych vs średnie ogólne i 90,8% vs średnie systemowe, Δ =
42,6%!). W sumie wśród ponad 25 tys. ocenianych wyników
18 składników jako poprawne vs xog uznano 55,7%, a vs
xsyst – 82,4%. Oczywiście miarodajna jest ocena w stosunku
Tabela XII
Wyniki sprawdzianu immunochemii poszerzonej w r.2009 - 2 sprawdziany, 6 materiałów kontrolnych. Zestawiono
ocenę wszystkich nadesłanych w obydwu sprawdzianach wyników (A) oraz wyników sklasyfikowanych (B). a - liczba
ocenianych wyników, b - % wyników ocenionych jako poprawne.
oceniany
składnik
n
wykorzystanych
A
B
wszystkie wyniki
ocena wyników sklasyfikowanych
ocena vs xog
vs xog
vs xsyst
syst.
apar.
a
b
a
b
a
b
a
b
estradiol
10
356
2131
66,02%
2062
66,58%
2062
86,87%
1546
84,02%
FSH
10
354
2120
80,38%
2039
81,31%
2039
93,28%
1610
90,74%
TSH
11
481
2862
71,00%
2770
71,34%
2770
92,67%
2122
87,79%
FT3
11
455
2696
66,32%
2621
67,11%
2621
92,71%
2071
89,14%
TT3
5
59
344
58,72%
246
58,54%
246
80,08%
192
77,08%
FT4
11
476
2839
57,77%
2749
58,20%
2749
92,54%
2165
88,73%
vs nom.
TT4
5
55
322
71,12%
208
73,08%
208
84,13%
160
76,25%
LH
10
310
1851
75,96%
1776
76,69%
1776
94,76%
1393
93,75%
GH
2
27
152
71,05%
111
84,68%
111
91,89%
111
85,58%
HCG
10
332
1975
61,16%
1921
62,05%
1921
94,06%
1496
91,31%
kortyzol
8
138
799
72,84%
727
74,28%
727
86,80%
508
80,90%
progesteron
10
311
1867
76,43%
1789
77,08%
1789
90,22%
1396
87,96%
prolaktyna
10
394
2334
73,18%
2253
73,72%
2253
87,62%
1663
86,95%
testosteron
10
305
1777
68,26%
1699
68,69%
1699
86,76%
1321
80,77%
AFP
9
204
1222
89,77%
1138
90,33%
1138
91,92%
844
89,10%
CEA
10
333
1960
81,99%
1906
82,84%
1906
97,53%
1457
95,74%
CA-125
10
344
2021
86,34%
1970
87,56%
1970
96,85%
1499
95,40%
CA15.3
9
160
934
69,38%
879
71,33%
879
95,22%
643
87,25%
CA19.9
9
210
1225
58,78%
1171
60,55%
1171
95,73%
897
83,95%
t PSA
10
456
2710
58,01%
2626
58,2%
2626
93,03%
2070
95,99%
f PSA
8
123
721
67,13%
688
70,06%
688
90,12%
404
87,62%
digoksyna
4
65
387
58,40%
237
60,76%
237
82,28%
177
80,22%
9
54
88,89%
-
-
-
-
-
-
fenytoina
karbama-zepina
3
49
285
81,05%
189
85,18%
189
96,30%
178
89,89%
Kwas foliowy
5
74
432
47,68%
358
52,23%
358
77,65%
281
53,74%
Kwas walproinowy
4
54
320
84,69%
213
91,08%
213
92,02%
183
92,90%
Wit.B12
7
155
905
73,59%
852
74,18%
852
81,92%
651
77,26%
ferrytyna
11
215
1261
56,86%
1192
56,88%
1192
64,76%
845
57,75%
IgE
9
256
1507
83,88%
1381
86,60%
1381
89,50%
1051
86,96%
23
125
54,40%
21
80,95%
21
95,24%
21
95,24%
Zima 09
19830
68,54%
18663
69,31%
18663
90,75%
14604
86,65%
Lato 09
20308
72,06%
19129
73,16%
19129
90,80%
14362
87,02%
razem 09
40138
70,32%
37792
71,26%
37792
90,78%
28966
86,83%
razem 08
39147
68,08%
36484
68,86%
36484
89,44%
31357
86,65%
β-2-micro-lobulina
32
A.M. Brzeziński i B. Przybył-Hac
do średnich systemowych, ocena w stosunku do średnich
ogólnych jest informacją pomocniczą – miarą zróżnicowania
wartości wyznaczanych różnymi systemami.
Konieczność prawidłowej oceny oznaczeń immunochemicznych związana z ich rosnącym znaczeniem diagnostycznym
spowodowała wprowadzenie „dodatkowego” specjalnego
programu oceny tych oznaczeń. Program obejmuje dwa
sprawdziany w roku, każdorazowo z wykorzystaniem trzech
różnych materiałów kontrolnych umożliwiających ocenę co
najmniej 30 różnych składników oznaczanych metodami immunochemicznymi. Dodatkowo wykorzystywane materiały
w większości mają wyznaczone przez producenta wartości
należne do uzyskania najczęściej wykorzystywanymi systemami. Ponieważ nie we wszystkich 3 wykorzystywanych
materiałach kontrolnych oraz nie zawsze dla wszystkich
popularnych w Polsce systemów producent wyznaczył takie
wartości, to w sumie wobec systemowych wartości należnych mogło zostać ocenionych tylko 76,6% nadesłanych
przez uczestników programu wyników, najmniej dla wartości
fPSA – zaledwie 404 z nadesłanych 721 wartości, tj. 56%.
Zestawienie wyników programu immunochemii poszerzonej
w r.2009 z rozbiciem na oznaczane składniki zawarto w tab.
XII. Podano liczbę systemów wykorzystanych do oznaczania poszczególnych składników oraz liczbę aparatów, całkowitą liczbę nadesłanych wyników oraz ich ocenę vs średnie
ogólne, a następnie tylko dla wyników sklasyfikowanych wg
określonych systemów analitycznych – odsetek wyników
uznanych za poprawne w stosunku do średnich ogólnych,
średnich systemowych oraz systemowych wartości należnych wyznaczonych przez producenta wykorzystanych
materiałów. Ze względu na koszty liczbę uczestników tego
programu ograniczono do 500 laboratoriów, które oznaczały przynajmniej 5 różnych składników. Zwraca uwagę duża
zbieżność wyników uzyskanych w dwóch niezależnych
sprawdzianach – przy ocenie vs średnie systemowe jako
poprawne uznano Zimą 09 – 90,75% wyników, a Jesienią
Rycina 3
Zobrazowanie danych z tabeli XII.
33
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
09 – 90,80% (Δ = 0,05%!), a przy ocenie vs wyznaczone
przez producenta systemowe wartości należne – odpowiednio 86,65% i 87,02% ocenianych wartości. Należy ponownie
podkreślić, że liczba wyników ocenianych względem podanych w metryczkach systemowych wartości należnych jest
wyraźnie mniejsza od ocenianych względem średnich systemowych wg uczestników programu. Jako bardzo korzystną
należy ocenić dobrą z zasady korelację oceny vs średnie
systemowe i systemowe wartości należne (dwie ostatnie
kolumny w tab. XII oraz dodatkowo ryc. 3). Współczynnik
korelacji 0,892 przy 29 ocenianych parach wyników jest zdecydowanie istotny (dla α = 0,05 przy n = 30, r krytyczne =
0,3494). Po dodatkowym odrzuceniu wyników trzech oznaczeń, dla których różnica w ocenie wobec średnich systemowych i systemowych wartości należnych jest szczególnie
duża (CA 19.9 – 95,73% i 83,95%, Δ = 11,78%; CA 15.3
– 95,22% i 87,25%, Δ = 7,95% oraz kwas foliowy – 77,65% i
53,74%, Δ = 23,9%), wartość współczynnika korelacji wzrasta do 0,963. Trudno dyskutować, dlaczego dla wymienionych trzech składników występują tak nietypowo duże różnice przy ocenie w stosunku do tych dwóch przyjmowanych
układów wartości należnych. Oczywiście podane różnice są
wartościami średnimi z wyznaczonych w 6 wykorzystanych
materiałach kontrolnych. Nie można zakładać błędów producenta, choć wzbudza poważne wątpliwości, jeśli z wyliczonych 6 średnich 4 lub 5 jest wysoce zgodnych z systemowymi wartościami metrykalnymi, natomiast 1 lub 2 – wyraźnie
odmienne. Błędne wyniki uczestników programu też muszą
być rozważone, choć trudno wytłumaczyć, dlaczego np. zła
kalibracja miałaby dotyczyć tych trzech składników – i to w
różnych systemach, przy użyciu różnych kalibratorów. Oczywiście wyniki uległyby wyraźnej poprawie przy przyjęciu
szerszych granic dopuszczalnego błędu – obecny szkoleniowo-informacyjny charakter programu umożliwia przyjęcie
bardziej restrykcyjnych kryteriów oceny.
W tab. XIII zestawiono wyniki uzyskane najbardziej w Pol-
sce rozpowszechnionymi systemami immunochemicznymi.
Podano nazwę systemu, liczbę składników oznaczanych
danym systemem, liczbę ocenianych wyników oraz ich ocenę w stosunku do średnich ogólnych (tylko jako informacja
dodatkowa) i średnich systemowych, a następnie liczbę
wyników, które mogły być ocenione w stosunku do wyznaczonych przez producenta wartości należnych oraz liczbę
i odsetek wyników uznanych za poprawne. Zbiorczo podane wyniki są oczywiście zgodne z wynikami zebranymi dla
poszczególnych składników w poprzedniej tabeli, jednak
zaznaczają się różnice między systemami, zarówno w odsetku wyników możliwych do oceny vs systemowe wartości
należne (100% wyników wyznaczonych aparatami Modular
E170 czy Immulite 2000 do zaledwie 93,2% wyników wyznaczonych aparatem Access), jak i oceny poprawności – od
83,6% aż do 94,3% poprawnych z 1148 wyników wyznaczonych systemem Modular. Należy żałować, że producent
wykorzystywanych materiałów kontrolnych nie podaje wartości należnych dla nadspodziewanie obecnie popularnych
w Polsce analizatorów Cobas 6000/Cobas e601. Jednak wg
otrzymanej ostatnio z firmy Roche Diagnostics informacji, ze
względu na te same odczynniki i kalibratory uzyskiwane wartości powinny być analogiczne do wyznaczonych aparatem
Modular – i w „Przewodniku ...” na r. 2010 obie te grupy analizatorów połączono, co niewątpliwie ułatwi ocenę.
Markery kardiologiczne
W 2008r. rozpoczęto nowy program sprawdzianów, obejmujący oznaczenia akt. CK całk., akt. CK-MB, CK-MBmass.,
troponiny I, troponiny T, mioglobiny, homocysteiny, peptydu
natriuretycznego typu B oraz jego NT-końcowego fragmentu
ProBNP, a więc oznaczenia wykorzystywane w diagnostyce
martwicy mięśnia sercowego oraz niewydolności krążenia.
Powszechność i skutki chorób układu krążenia decydują
o wadze tego programu, do udziału w którym zaproszono tych uczestników programu powszechnego, którzy wy-
Tabela XIII
Ocena wyników uzyskanych poszczególnymi systemami analitycznymi w sprawdzianach immunochemii poszerzonej w r. 2009. Podano liczbę składników oznaczanych poszczególnymi systemami, liczbę wykorzystanych aparatów
w sprawdzianach Zima 09 i Lato 09 oraz liczby ocenianych wyników i procent wyników uznanych za poprawne w
różnych układach odniesienia.
system analityczny
n
n apar.
n wyników i % poprawnych
n wyn.
vs xog
vs xsyst
n wyn.
nom.
n wyn. i %popr.
skł.
Z09
L09
Abbott-AxSym
27
51
50
4173
2543-
60,9%
3639-
87,2%
4079
3424-
83,9%
Abbott-Architect
23
24
29
2259
1395-
61,8%
2068-
91,5%
2175
1910-
87,8%
Bayer-Advia Centaur
22
24
28
2185
1470-
67,3%
1900-
87,0%
2164
1817-
84,0%
Beckman-Access
21
20
23
1716
1112-
64,8%
1560-
90,9%
1600
1338-
83,6%
bioMerieux-Vidas
22
71
78
5680
3928-
69,2%
5038-
88,7%
5434
4770-
87,8%
Roche-Elecsys
25
96
88
7020
5598-
79,7%
6389-
91,0%
6988
6196-
88,7%
Roche-Modular E170
20
13
13
1148
947-
82,5%
1091-
95,0%
1148
1082-
94,3%
Roche-Cobas 6000
25
87
106
7978
6617-
82,9%
7512-
94,2%
DPC-Immulite 1000
18
31
30
1808
1034-
57,2%
1602-
88,6%
1786
1502-
84,1%
DPC-Immulite 2000
23
razem r. 2009
34
vs nom.
34
33
3031
1704-
56,2%
2770-
91,4%
3031
2567-
84,7%
451
478
36998
26348-
71,2%
33569-
90,7%
28405
24606-
86,6%
A.M. Brzeziński i B. Przybył-Hac
konywali oznaczanie którejś z troponin – I lub T, w sumie
450 laboratoriów. Niestety okazało się, że zakres badań
wykonywanych przez te laboratoria był bardzo ograniczony. Oczywiście wszyscy oznaczali troponinę I (70%) lub T
(30%), ale już tylko 85% - akt. całk. CK, 65% - akt. CK-MB,
a 25% - stęż. CK-MBmass. Pozostałe badania wykonywane
były przez bez mała pojedyncze placówki – mioglobina – 26
lab., homocysteina – 24 lab., BNP – 23 lab., ProBNP – 31
laboratoriów. To ostatnie badanie wykazuje zresztą bardzo
znaczną dynamikę wzrostu – Zimą 08 - 31 lab., Zimą 09 - 60
lab., Zimą 10 - 82 lab. W roku 2009 ze względu na zmniejszenie przez Ministerstwo Zdrowia budżetu Centralnego
Ośrodka przeprowadzono tylko 1 sprawdzian kardiologiczny
zamiast planowanych 2, oceniając w sumie 2469 wyników,
z których 57,6% oceniono jako poprawne względem mało
miarodajnych średnich ogólnych. Zasadniczą wadą przeprowadzanych sprawdzianów jest ogromne zróżnicowanie wykorzystywanej do oznaczeń aparatury. Nawet dla formalnie
bardzo podstawowego oznaczania aktywności całkowitej
kinazy kreatynowej 345 laboratoriów zgłosiło wykorzystywanie aż 22 modeli analizatorów i 8 modeli spektrofotometrów,
z czego tylko 13 modeli analizatorów i 1 spektrofotometr
reprezentowane były przez co najmniej 6 egzemplarzy (w
sumie 310 szt. tj. 90% oznaczających) – najczęściej analizatory Cobas Integra (89 szt.). Konelab (51 szt.), Olympus (43
szt.), Vitros (20 szt.) i Pentra (19 szt.). Dodatkowo poza analizatorami Cobas Integra, Dimension i Vitros z pozostałymi
analizatorami wykorzystywano różne odczynniki – czasem
zróżnicowanie było symboliczne (Olympus – 42 x Olympus,
1 x bioMerieux), ale czasem istotne (Konelab – 30 x bioMerieux, 3 x BioSystems, 1 x α-Diagnostics, 17 x Thermo/
Kone). W sumie w homogennych zbiorach aparaturowo-odczynnikowych o n ≥ 6 można było ocenić 79% nadesłanych
wyników całk. CK. Jeszcze trudniejsza była ocena oznaczeń
mniej popularnych – w sprawdzianie Zima 09 akt. CK-MB
oznaczało 247 laboratoriów, wykorzystując tak jak dla akt.
CK te same 22 modele analizatorów i 10 modeli spektrofotometrów. W liczbie co najmniej 6 egzemplarzy występowało
7 analizatorów i 1 spektrofotometr (Epoll – 10 szt.), razem
190 aparatów (77% wykorzystywanych), natomiast w homogenne grupy aparaturowo-odczynnikowe o n ≥ 6 można było
zestawić tylko 65% nadesłanych wyników. Oczywiście ujemnym skutkiem tak znacznego zróżnicowania aparaturowego
jest znaczne zróżnicowanie systemowych wartości średnich,
wyznaczanych w wykorzystywanych stabilizowanych materiałach kontrolnych. Zestawiono to na ryc. 4 dla trzech oznaczanych składników w dwóch materiałach kontrolnych – tj.
oznaczeń troponiny I, troponiny T i ProBNP. Dla troponiny
I, oznaczanej różnymi systemami, uzyskano w jednym materiale wartości średnie od 0,09 μg/l 21 analizatorami Architect do 0,60 μg/l 20 aparatami Immulite 1000 (i odpowiednio
0,41 μg/l i 2,09 μg/l w drugim materiale). Przeprowadzona
analiza wariancji wykazała bardzo liczne istotne różnice
występujące między systemami. Troponina T oznaczana
jest wyłącznie analizatorami f-my Roche i mimo ew. różnic
między poszczególnymi systemami (Elecsys, Modular E170
czy Cobas 6000/e601) zwykle nie są to różnice istotne. W
związku z rosnącym rozpowszechnieniem wyposażenia
f-my Roche liczba oznaczeń troponiny I nieznacznie spada
(Zimą 08 – 270, Zimą 09 – 259 lab.), a troponiny T rośnie
(Zimą 08 – 122, Zimą 09 – 140 lab.). Na tej samej rycinie
4 zestawiono wartości uzyskiwane dla oznaczenia bardzo
istotnego dla oceny stopnia niewydolności krążenia, tj. NT
fragmentu propeptydu natriuretycznego typu B (ProBNP).
Należy zwrócić uwagę, że to cenne badanie bardzo zyskuje na popularności – Zimą 08 wykonywało je 31 laboratoriów, Zimą 09 – 60 laboratoriów, a wg zdobytych informacji
Zimą 10 – już 82 laboratoria, a więc w ciągu 2 lat wzrost
ponad 2,5-krotny. Rośnie także, choć mniej wyraźnie, popularność oznaczania samego peptydu natriuretycznego typu
B – Zimą 08 – 23 lab., Zimą 09 – 32 lab. Niestety również
występuje duże zróżnicowanie między wartościami wyznaczonymi różnymi systemami. Zimą 2009 dla wartości BNP
uzyskano (podano system, n egzemplarzy oraz średnie i odchylenia standardowe uzyskane w materiale 1 i 2) – AxSym,
n = 16, x1 = 40,17 ng/l, s1 = 14,13 i x2 = 207,6 ng/l, s2 =
61,61; Architect, n = 8, x1 = 15,85 ng/l, s1 = 6,61 i x2 = 116,7
ng/l, s2 = 16,26 oraz Immulite 1000, n = 5, x1 = 128,6 ng/l,
s1 = 46,29 i x2 = 318,0 ng/l, s2 = 62,76. Jak widać, różnice
między systemami są bardzo znaczne, a wysokie wartości
odchyleń standardowych informują o znacznym zróżnicowaniu wartości składających się na poszczególne średnie, co
warunkuje niską poprawność ocen nawet względem średnich systemowych (średnio zaledwie ok. 25% poprawnych).
Byłoby bardzo interesujące móc ocenić, czy i jakie różnice
wyznaczonych wartości występują między wykorzystywanymi systemami przy oznaczeniach przeprowadzonych w
rutynowo oznaczanym świeżym materiale biologicznym,
pozbawionym efektu podłoża. Niestety wymagałoby to znalezienia odpowiednich pacjentów (łatwiejsze) i uzyskanie
zgody Komisji Etyki na pobranie wystarczającej próbki krwi
(znacznie trudniejsze!). W sumie dla 9 ocenianych składników w sprawdzianie Zima 09 wyznaczono 2469 wartości, z których 57,5% oceniono jako poprawne względem
średnich ogólnych (mało miarodajne!). Wobec średnich
systemowych można było ocenić tylko 2128 wartości (tj.
86%), z których jako poprawne uznano zaledwie 1728 tj.
81,2%, najwięcej dla oznaczeń akt. całk. CK (88,0%), a
najmniej dla omawianego oznaczenia BNP. Oznaczana
przez 24 laboratoria mioglobina żadnym analizatorem nie
była oznaczana w co najmniej 6 laboratoriach, a więc nie
mogła zostać oceniona w stosunku do średnich systemowych – poprawność oceniana względem średnich ogólnych wynosiła 72,9% (w sprawdzianie Lato 2008 – 72,7%).
Sprawdziany kardiologiczne są merytorycznie bardzo istotne, choć chwilowo ich użyteczność jest ograniczona małą
liczbą uczestników. Wydaje się jednak, że popularność najważniejszych oznaczeń będzie rosła (CK-MBmass, BNP,
ProBNP, chyba także troponiny), co automatycznie będzie
zwiększało możliwości oceny wyznaczanych wartości.
35
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
Rycina 4
Sprawdzian markerów kardiologicznych Zima 2009 – Różnice wyznaczanych wartości zależnie od systemu analitycznego – przedstawione graficznie oraz w analizie wariancji (post hoc Scheffe’go * - różnica istotna).
Sprawdziany oznaczeń równowagi kwasowo-zasadowej.
Sprawdziany oznaczeń parametrów równowagi kwasowo-zasadowej prowadzone są w Polsce od ponad 30 lat.
Centralny Ośrodek obecnie realizuje te sprawdziany 2 x w
ciągu roku przy użycie 3 sztucznych materiałów kontrolnych
– normal, acidosis i alkalosis. Oceną powinny być objęte nie
laboratoria, a wszystkie wykorzystywane przez uczestników
programu analizatory rkz – Latem 2009 było to 661 aparatów. Poza oznaczeniami typowych parametrów rkz (pH,
PCO2, PO2) uczestnicy proszeni są o jednoczesne oznaczenia elektrolitów met. ISE, jeżeli użytkowany analizator
rkz oferuje takie możliwości, a laboratoria je wykorzystują.
36
Oczywiście oznaczenia te nie zastępują oceny oznaczeń
elektrolitów (sodu, potasu, wapnia, chlorków) w surowicach
kontrolnych oznaczanych w powszechnych sprawdzianach
chemicznych. Zbiorcze wyniki wszystkich oznaczanych
składników w trzech materiałach kontrolnych zestawiono w
górnej części tabeli XIV. W części dolnej tej samej tabeli zestawiono wyniki (tylko parametrów rkz) uzyskane najczęściej
wykorzystywanymi analizatorami, dwóch przede wszystkim
firm – Siemens/Bayer – 237 egz. (36%) i Roche/AVL – 274
egz. (41%). Jak zawsze należy przypomnieć, że podane
dane nie są podstawą do formalnego rankingu aparatów –
wyniki uzyskiwano w różnych laboratoriach, w nieporównywalnych warunkach. Tym niemniej wyraźnie wyróżniają się
1318
1319
1029
1035
429
71
60,0
170,0
120,0
6,70
85,0
2,00
1,90
PO2
Na +
+
Cl –
Ca ++
+
n
* bardzo znaczne różnice między dwoma materiałami
** tylko jeden materiał
21
03-42-04 Radiometer ABL serii 500
22
21
03-42-07 Radiometer ABL serii 800
27
57
03-44-03 AVL serii Omni
19
87
03-08-02 Rapidlab 348
03-26-02 Gem Premier 3000
29
90
03-42-06 Radiometer ABL serii 700
137
106
03-44-04 Cobas b 121,b 221
03-44-01 AVL Compact 1,2,3
20
22
54
87
83
661
150
642
154
71
431
462
1039
1033
1327
1327
1333
n apar.
1,10
1,20
98,0
4,60
135,0
110,0
40,0
7,40
c
ogółem
49,3
80,6
85,1
91,8
85,3
92,9
92,6
88,9
C
03-08-01 Rapidlab 238,248,278,280,288
56,5
85,4
78,3
93,5
88,9
94,5
96,1
95,1
B
L-09
40,8
82,5
59,8
90,6
83,3
92,6
93,5
89,7
A
acidosis
Z-09
tylko parametry rkz
II
Li
458
1324
7,10
pH
PCO2
K
n
c
składnik
I
123
123
147
150
327
519
518
727
907
3892
n
62,0
88,6
73,4
94,2
87,2
66,6
96,5
91,7
A
normal
96,8
100,0
94,6
95,3
99,1
94,6
88,6
97,0
88,3
93,4
B
pH
63,8
91,3
86,2
95,2
94,0
87,5
97,0
94,4
B
94,3
100,0
96,6
98,2**
97,6
52,2*
74,7
95,4
77,8
82,2
C
56,5
71,3
82,4
94,8
91,2
75,6
89,4
85,4
C
123
123
147
150
327
519
518
727
907
3883
n
0,70
0,50
115,0
2,70
160,0
80,0
15,0
7,70
c
95,1
99,2
96,6
96,7
97,2
96,7
88,4
97,8
93,5
94,8
B
PCO2
71
425
460
1036
1030
1319
1319
1325
n
93,5
99,2
98,0
98,8**
96,3
57,2*
86,7
97,9
92,5
88,6
C
42,2
51,1
66,5
79,1
86,7
59,6
89,1
73,8
A
alkalosis
123
123
147
150
327
519
519
727
907
3884
n
50,7
59,6
83,0
80,6
90,3
82,4
91,2
90,7
B
88,6
97,6
95,2
91,3
83,5
91,9
89,6
82,7
88,4
88,2
B
PO2
47,8
50,1
80,9
78,8
88,8
74,8
83,7
72,2
C
87,0
96,8
95,2
89,7
80,8
59,5*
87,5
79,5
84,7
80,9
C
213
1285
1380
3110
3092
3965
3964
3982
n
369
369
441
450
982
1557
1555
2181
2721
11659
n
46,4
74,2
66,6
88,0
85,7
86,2
93,0
B
93,5
98,9
95,5
94,4
93,3
94,4
88,9
92,5
90,1
92,1
B
razem
57,0
78,8
82,5
88,8
91,2
88,2
94,8
93,4
razem
85,1
A
91,6
98,6
96,6
95,8**
91,6
56,3
83,0
91,0
95,0
83,9
C
51,2
67,4
73,8
88,5
88,4
80,9
88,6
82,2
C
Tabela XIV
Sprawdziany parametrów równowagi kwasowo-zasadowej w r.2009. I – zestawienie oznaczanych składników: c- orientacyjne stężenie; n- liczba ocenianych wyników, a następnie podano odsetek wyników poprawnych względem średnich ogólnych (A), średnich aparaturowych (B) i nominału wg producenta (C); II – ocena tylko parametrów rkz
wybranymi aparatami – n, B, C jak w części I.
A.M. Brzeziński i B. Przybył-Hac
37
Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ...
wyniki uzyskane niezbyt licznymi analizatorami ABL serii 700
f-my Radiometer – z 369 wyników pH, PCO2 i PO2 aż 98,9%
oceniono jako poprawne wobec średnich aparaturowych, a
98,6% - wobec wyznaczonych przez producenta (f-ma Medriv) aparaturowych wartości należnych. Zaskakuje niska
poprawność wobec wartości należnych wg producenta wyników uzyskanych analizatorami Rapidlab 348. Wynikała ona
z dużej niezgodności ocen w dwóch przeprowadzonych w
ciągu roku sprawdzianach – w jednym ocena była porównywalna z innymi analizatorami, natomiast w drugim – bardzo
niska, co może sugerować błąd/pomyłkę metrykacji. Teoretycznie ocena zbiorcza wyników r.2009 wydaje się w miarę
korzystna – ponad 92% wyników ocenionych jako poprawne wobec średnich aparaturowych. Jeżeli jednak uwzględnić, że oznaczenia dotyczą tzw. parametrów krytycznych, o
podstawowym znaczeniu przy prowadzeniu ciężko chorych
pacjentów, to ocena nie jest tak pozytywna. Wydaje się, że
celowe byłoby zwiększenie liczby sprawdzianów do przynajmniej 4 w ciągu roku, z wprowadzeniem wyraźnej klasyfikacji
wyników. Przeszkodą jest wykorzystywany materiał kontrolny, tak zdecydowanie odmienny od rutynowo oznaczanego
materiału biologicznego.
Uwagi końcowe
Szczegółowe omówienie wszystkich uzyskanych w ciągu
roku wyników oznaczeń kontrolnych nie jest możliwe. Należy pamiętać, że każdy z 750 tys. wyników kontrolnych
nadesłanych w 2009r. skojarzony jest z kilku istotnymi informacjami pomocniczymi – kto, co, jaką metodą, z wykorzystaniem jakiego analizatora, odczynników, kalibratorów
czy w jakich seriach. Każdego roku tworzy to ogromną bazę
kilku milionów informacji. Merytoryczne, a nie wyłącznie
formalne opanowanie tej bazy danych, możliwość/umiejętność kompleksowej wielokierunkowej oceny, a tym bardziej
wyciągnięcie odpowiednich wniosków i adekwatnych do
nich propozycji staje się niemal niemożliwe. Naturalnym
prostym rozwiązaniem jest przygotowanie zindywidualizowanych szczegółowych ocen dla poszczególnych uczestników programów na tle wyników pozostałych laboratoriów,
uwzględniając wysoce zróżnicowane warunki wyznaczania
wartości oznaczeń kontrolnych. Poważnym ograniczeniem
wartości tych ocen indywidualnych są liczne niestety informacje błędne, przekazywane przez wykonawców, a dotyczące zarówno warunków prowadzenia oznaczenia jak i
wyznaczanych wartości (jednostki, przecinek, znaczne błędy przypadkowe). Te informacje błędne czasami są oczywiste (wykorzystanie do oznaczeń glukozy analizatora rkz
czy oznaczanie analizatorem Vitros z odczynnikami Roche
itp.), czasami przez swoją unikalność są wysoce prawdopodobne (tylko 1 z 1700 laboratoriów oznacza glukozę odczynnikami danej firmy), a często są w ogóle nie do uchwycenia, co nie znaczy, że nie wpływają negatywnie na ocenę
wyników. Dodatkowo samo wychwycenie błędów/pomyłek
nie wystarcza, w każdym wypadku należałoby przeprowadzić szybkie i efektywne postępowanie wyjaśniająco-kory38
gujące. Niestety przyjęcie takiego rozwiązania przekracza –
czasowo i finansowo – możliwości techniczne Centralnego
Ośrodka i najczęściej nie jest prowadzone, z oczywistymi
negatywnymi skutkami. Podobnie tylko sporadycznie wyjaśniane są wartości znacznie odbiegające od pozostałych,
w rzeczywistości nie należące do ocenianego zbioru. Jednocześnie takie wartości błędne wpływają negatywnie nie
tylko na ocenę wyników autora (co nie budzi sprzeciwu),
ale także na ocenę pozostałych uczestników sprawdzianu czy na opinię o określonym sprzęcie. W sprawdzianie
markerów kardiologicznych Zima 2009 troponinę T w mat.
1 wyznaczono 92 analizatorami Elecsys, przy czym wynik
przedostatni od góry wynosił 0,056 μg/l, a ostatni – 0,26
μg/l (niemal 5 x więcej). Charakterystyka zbioru wyjściowego: n = 92, x = 0,035 μg/l, s = 0,025 (nieprawdopodobnie
duże, sugerujące ogromny rozrzut wartości wyznaczanych
ap. Elecsys), a po odrzuceniu 1 wyniku: n = 91, x = 0,033
μg/l, s = 0,0089. Jednocześnie jednak początkowo nieistotna różnica w stosunku do wartości wyznaczonych analizatorami Modular/Cobas 6000 po korzystnym zmniejszeniu
odchylenia standardowego stałą się istotna. Odrębną sprawą jest rzeczywista istotność merytoryczna występujących
różnic. W programach międzylaboratoryjnych, przy dużych
liczebnościach porównywanych zbiorów, a jednocześnie
przy często spotykanej dużej zbieżności wyników (szczególnie po oczyszczeniu pierwotnych zbiorów), klasyczne
metody oceny statystycznej okazują się zbyt czułe, wykazując istotność naprawdę znikomych różnic, nie mających
żadnego znaczenia praktycznego. Problem w rzeczywistości nie został rozwiązany, utrudniając ocenę przyjmowanych wartości umownie należnych rożnego szczebla.
Dodatkową trudnością jest obciążający wykorzystywane
stabilizowane materiały kontrolne efekt podłoża, bardzo
wyraźnie modyfikujący wyniki uzyskiwane poszczególnymi metodami czy analizatorami. Co gorsza, nawet ewentualne wykorzystanie trudno dostępnych i kosztownych
stabilizowanych materiałów kontrolnych z wyznaczonymi
wartościami definitywnymi/referencyjnymi problemu nie
rozwiązuje. Odrębnym zagadnieniem jest przyjęcie odpowiednich granic dopuszczalnego błędu, zależnych zarówno od wiarygodności będących podstawą oceny wartości
umownie należnych, jak i celu prowadzonych sprawdzianów. Przyjęty informacyjno-szkoleniowy tryb sprawdzianów
jest prosty, nie jest konfliktogenny i nie wzbudza emocji, ale
i nie wymusza wystarczających starań o poprawność uzyskiwanych/przesyłanych danych. Dodatkowo często powoduje dyskomfort świadomości świadczenia usług przez
placówki, których działalność powinna być co najmniej
ograniczona. Rozwiązanie tych – i dalszych – problemów
przekracza zarówno kompetencje jak i uprawnienia zespołu
Centralnego Ośrodka. Aktualnym pozostaje postulat utworzenia pod egidą Ministerstwa Zdrowia zespołu z udziałem
wszystkich potencjalnie zainteresowanych – wykonawców
i odbiorców wyników, organizatorów ochrony zdrowia, producentów/dystrybutorów sprzętu czy odczynników, orga-
A.M. Brzeziński i B. Przybył-Hac
nizacji i korporacji pracowników – z zadaniem ustalenia/
unowocześnienia trybu, wymagań i ew. konsekwencje realizowanych w Polsce programów sprawdzianów międzylaboratoryjnych.
Adres Autorów:
Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej
90-613 Łódź, ul. Gdańska 80
(Praca wpłynęła do Redakcji: 2010-05-20)
(Praca przekazana do opublikowania: 2010-05-24)
39

Podobne dokumenty