Programy sprawdzianów międzylaboratoryjnych realizowane przez
Transkrypt
Programy sprawdzianów międzylaboratoryjnych realizowane przez
diagnostyka laboratoryjna Journal of Laboratory Diagnostics 2010 • Volume 46 • Number 1 • 15-39 Kontrola jakości • Quality control Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej w 2009 r. EQA programmes organized by Centre for Quality Assessment in Laboratory Medicine in Poland during 2009 year Andrzej M. Brzeziński, Barbara Przybył-Hac Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej, Łódź Streszczenie W 2009r. Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej przeprowadził w ramach 8 programów 27 różnych sprawdzianów międzylaboratoryjnych i opracował 750 tysięcy nadesłanych wyników oznaczeń kontrolnych. Wszystkie realizowane przez Centralny Ośrodek programy mają charakter wyłącznie informacyjno-szkoleniowy, nie powodując żadnych następstw administracyjnych. Ponieważ Ośrodek jest finansowany z budżetu przez Ministerstwo Zdrowia, udział w prowadzonych programach jest dla wszystkich polskich laboratoriów bezpłatny. Najstarszym z realizowanych programów jest tzw. program centralny, prowadzony od 1975r. tj. od 35 lat dla grupy największych, wiodących laboratoriów kraju. Dla Centralnego Ośrodka uczestnicy tego programu stanowią obecnie swoistą grupę referencyjną. Najnowszym programem jest podjęty w 2008r. program markerów kardiologicznych - poza oznaczaniem akt. CK oraz akt. i stęż. CK-MB obejmuje on oznaczenia troponiny I i T, mioglobiny, homocysteiny, BNP i ProBNP. Ocena uzyskiwanych wyników nie jest łatwa, ponieważ jak wszystkie oznaczenia immunochemiczne są one bardzo wrażliwe na efekt podłoża, więc wyznaczane wartości są silnie powiązane z wykorzystywanymi systemami analitycznymi. Jest to szczególnie istotne przy niewielkiej liczbie uczestniczących w sprawdzianie laboratoriów. Mioglobinę poddało ocenie tylko 24 laboratoria, lecz wyniki nie mogły zostać ocenione ponieważ żadnym systemem nie posługiwało się co najmniej 6 pracowni. Praktycznie we wszystkich prowadzonych programach - dwóch chemicznych, hematologicznym, koagulologicznym, dwóch różnych immunochemicznych oraz oceny parametrów równowagi kwasowo-zasadowej - zaobserwowano nieznaczną lecz stałą poprawę wiarygodności nadsyłanych wyników. Dyskutowanych jest szereg zagadnień związanych z przyszłością programów międzylaboratoryjnych w Polsce, lecz poza dużymi emocjami nie prowadzą do wiążących ustaleń. Summary During 2009 year Centre for Quality Assessment in Laboratory Medicine has organised 27 different interlaboratory surveys in eight programmes and nearly 750 thousands of control results have been evaluated. All external quality programmes in Poland are information-educational only with no administrative consequences. As Ministry of Health sponsors the Centre, the participation in organised programmes is for all polish laboratories charge-free. The eldest programme is so called central one with surveys organised once a month from 1975 i.e. lasting thirty-five years for 250 biggest leading polish laboratories. At present they serve for our Centre as the reference group. The last programme started 2008 and includes cardiac markers - besides CKact. and CK-MBact. and CK-MBmass likewise troponin T and I, myoglobin, homocysteine, BNP and ProBNP. The evaluation of results is not easy, as all immunochemical estimations are extremely matrix effect dependent and outcomes obtained with various analytical systems are very different. It is especially important with very limited number of participating laboratories – myoglobin was estimate by 24 laboratories only but results were not evaluated as it was impossible to find 6 laboratories using the same analytical system. Practically in all realised programmes - two chemical, haematological, coagulological, two different immunochemical and acid-base balance - small but steady improvement of results are observed. A lot of problems connected with future of quality programmes in Poland are under discussion but besides a lot of emotion with no other consequences. 15 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... Słowa kluczowe:sprawdziany międzylaboratoryjne, wartości umownie należne, granice dopuszczalnego błędu, opracowywanie wyników Key words:words: interlaboratory surveys, target values, acceptable limits of errors, evaluation of results Wstęp Zgodnie z rozporządzeniem Ministra Zdrowia z dn. 26 marca 2006r., od 1 kwietnia 2009r. laboratoria systemu ochrony zdrowia w Polsce powinny wdrożyć do rutynowego stosowania kilka podstawowych standardów. Jednym z nich jest objęcie wszystkich wykonywanych badań stałą systematyczną kontrolą wewnątrz- i międzylaboratoryjną, a także obligatoryjne uczestnictwo w programach międzylaboratoryjnych, organizowanych przez Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej. To ostatnie wymaganie potencjalnie stwarzało możliwości przejściowych zakłóceń, związanych z możliwością dołączenia znacznej rzeszy nowych uczestników programu, co jednak nie nastąpiło. Okazało się, że w efekcie wieloletnich działań Centralny Ośrodek nawiązał kontakt z praktycznie wszystkimi laboratoriami, a wdrożenie odpowiedniego standardu nie spowodowało istotnych zmian. Jednocześnie wydaje się mało prawdopodobne, by laboratoria nie dostosowały się do oficjalnie wdrożonego standardu, choć w rozporządzeniu nie sprecyzowano warunków jego egzekwowania. Prowadzone przez Centralny Ośrodek programy sprawdzianów zestawiono w tab. I. Najdłużej realizowanym jest podjęty w 1975r. tzw. program centralny, obejmujący comiesięcznymi sprawdzianami 25 podstawowych oznaczeń chemicznych w ok. 250 wiodących laboratoriach polskich. Oczywiście najistotniejsze są dwa programy obejmujące teoretycznie wszystkie medyczne laboratoria diagnostyczne: – powszechny program chemiczny – cztery sprawdziany w roku, 25 składników surowicy w dwóch materiałach kontrolnych równolegle oraz program hematologiczny, którym formalnie objęte powinny być nie tylko wszystkie laboratoria, ale wszystkie wykorzystywane w nich liczniki i analizatory hematologiczne. Ocenianych jest 5 składników mierzalnych i 3 wyliczane wskaźniki, także w dwóch materiałach kontrolnych równolegle, ale zaled- wie dwukrotnie w ciągu roku, co uniemożliwia miarodajną ocenę. Zwiększenie częstotliwości sprawdzianów do czterech w ciągu roku ze względów finansowych wydaje się obecnie mało realne. Obniżenie przyznanego budżetu (powszechne oszczędności) spowodowało, że formalnie bardzo cenny program oceny markerów kardiologicznych został ograniczony do wręcz symbolicznego jednego sprawdzianu w ciągu roku. W sumie w r.2009 przeprowadzono w ramach 8 realizowanych programów aż 27 sprawdzianów, uzyskując w sumie blisko 750 tys. wyników oznaczeń kontrolnych, będących podstawą oceny. Należy podkreślić, że aczkolwiek obecnie udział w programach Centralnego Ośrodka jest obligatoryjny, to są to programy wyłącznie informacyjno-szkoleniowe, a nie spełnienie wymaganych kryteriów jakościowych nie powoduje żadnych skutków administracyjnych – w przeciwieństwie do sytuacji w Niemczech czy Stanach Zjednoczonych. Ewentualna zmiana warunków uczestnictwa w programach Centralnego Ośrodka jest dyskutowana, będąc źródłem rozlicznych kontrowersji. Uczestnicy Wydaje się, że programami Centralnego Ośrodka objęte są wszystkie działające w Polsce medyczne laboratoria diagnostyczne. Oczywiście jest to stan równowagi dynamicznej, spowodowanej głównie przekształceniami własnościowymi oraz przetargami na wykonywanie usług laboratoryjnych – co powoduje ewent. zmiany. Aczkolwiek wielokrotnie podkreślano, że w związku z ogromnymi zmianami organizacyjnymi i technicznymi wdrożony w 1982r. podział laboratoriów oparty o liczebność zatrudnionego personelu jest obecnie anachronizmem, to mimo wszystko jest ciągle stosowany. Zestawienie laboratoriów współpracujących w 2009r. z Centralnym Ośrodkiem przedstawiono w tab. II. Przy dwukierunkowym podziale laboratoriów (liczebność personelu i Tabela I Realizowane w r.2009 programy sprawdzianów. Podano nazwę programu, liczbę sprawdzianów w ciągu roku, liczbę wykorzystywanych równolegle materiałów kontrolnych, liczbę ocenianych składników, liczbę uczestników programu i liczbę uzyskanych w 2009r. wyników. Nazwa programu sprawdz w roku n mat. kontr. n ocen. składn. n uczest. n wyników w roku Powszechny chemiczny 4 2 25 1714 243 677 Centralny chemiczny 12 2 25 266 128 349 Podstawowy immunochemiczny 2 2 12 813 25 677 Poszerzony immunochemiczny 2 3 30 485 40 138 Markery kardiologiczne 1 2 9 413 2 475 Parametry równ. kwas.-zasad. 2 3 7 955 21 129 Podstawowy hematologiczny 2 2 8 1971 264 562 Podstawowy koagulologiczny 2 2 5 1280 18 172 744 179 16 A.M. Brzeziński i B. Przybył-Hac Tabela II Charakterystyka laboratoriów uczestniczących w powszechnym programie chemicznym w r.2009. W każdym polu podano: w wierszu górnym – liczby laboratoriów danej grupy i przeciętną liczbę wykonywanych badań (z ocenianych 25), w wierszu dolnym – przeciętną punktową ocenę regularności. Rodzaj laboratoriów b. małe średnie duże b. duże 1-3 prac.fach. 4-10 prac.fach. 11-24 prac.fach. ≥ 25 prac.fach. akademickie 3 ±14,3 A publiczne 36 leczn.zamkn publiczne 9 ±17,8 22 ±20,8 4,512 B ±13,4 123 25 ±22,8 4,431 C ±19,1 243 4,642 D 4,503 ±21,9 94 ±22,9 E 4,281 F 4,247 G 4,545 H 4,806 127 ±12,0 95 ±15,5 30 ±16,1 7 ±11,4 leczn.otwart I 4,002 J 4,382 K 4,665 L 4,850 niepubliczne 9 ±13,7 71 ±20,2 72 ±22,0 12 ±22,8 razem 59 ±20,9 4,546 496 ±20,8 4,519 259 ±13,7 4,268 164 ±20,8 leczn.zamkn M 3,455 N 4,342 O 4,589 P 4,645 niepubliczne 374 ±14,8 328 ±18,2 44 ±21,5 5 ±23,2 leczn.otwart R 3,926 S 4,219 T 4,482 U 4,871 4,116 ±14,0 626 ±18,2 411 ±21,4 143 ±22,3 1729 ±18,0 razem 549 3,959 4,264 4,558 4,449 751 4,741 dodatkowe 61 ±14,9 aparaty X,Y 3,755 ±16,7 4,321 61 ±14,9 3,755 1790 ±17,9 4,305 powiązania organizacyjne) w odpowiednich polach podano – w wierszu górnym liczbę laboratoriów danej podgrupy oraz średnią liczbę wykonywanych przez nie oznaczeń (z 25 ocenianych!), a w wierszu dolnym symbol podgrupy oraz uzyskaną przeciętną punktową ocenę regularności (od 0,00 do 5,00 pkt.). Zwraca uwagę, że ponad 30% laboratoriów są to placówki bardzo małe, zatrudniające od 1 do maksymalnie 3 pracowników fachowych, o ograniczonym zakresie usług (asortyment i liczba badań). Częstokroć bardzo proste, nawet wręcz archaiczne wyposażenie tych placówek oraz konieczność krańcowego ograniczenia kosztów warunkują, że przeciętny poziom wiarygodności uzyskiwanych wyników jest niski (choć bywają wyjątki). Jak wynika z tabeli, będąca miarą poprawności wyników – w powszechnym programie chemicznym – punktowa ocena regularności jest bardzo wyraźnie skorelowana z wielkością laboratoriów, ocenianą na podstawie liczby zatrudnionych pracowników fachowych. Wynika to oczywiście z organizacji pracy, kompetencji personelu oraz wykorzystywanego wyposażenia i metod. Analogiczne wnioski można wyciągnąć, dzieląc laboratoria bardziej merytorycznie, w oparciu o wachlarz wykonywanych badań (choć w dalszym ciągu z objętych oceną 25 podstawowych oznaczeń chemicznych!). Przedstawiono to, podając zależnie od liczby oznaczanych składników odsetek ocenianych laboratoriów i średnią ocenę punktową regularności: 1-5 skł. – 3,85% lab.,± 3,674 pkt.; 6-10 skł. – 7,65% lab.,± 3,920 pkt.; 11-15 skł. – 16,70% lab.,± 3,994 pkt.; 16-20 skł. –27,15% lab.,± 4,168 pkt.; 21-25 skł. – 44,64% lab.,± 4,472 pkt. 6 laboratoriów, które oznacza wszystkie 25 składniki (w tym osmolalność i akt. kwaśnej fosfatazy) uzyskało bardzo wysoką ocenę regularności, średnio 4,887 pkt., w tym 3 la- boratoria – 5,000 pkt., a więc dla wszystkich 25 składników we wszystkich 4 sprawdzianach nadesłały komplet wyników kontrolnych ocenionych jako poprawne! Zwraca uwagę brak korelacji między formalną wielkością laboratoriów (ocenianą zależnie od liczby pracowników fachowych), a wachlarzem wykonywanych oznaczeń. Zwłaszcza wśród niepublicznych bardzo małych laboratoriów lecznictwa otwartego występuje wiele placówek wykonujących badania nieadekwatne do posiadanych możliwości technicznych i kadrowych, z jak najgorszymi skutkami. Program Centralny W 1975r. czterdzieści dużych laboratoriów medycznych zdecydowało o prowadzeniu wspólnego programu międzylaboratoryjnej oceny wyników, z wykorzystaniem jednolitych materiałów kontrolnych. Był to zalążek realizowanego do dziś tzw. programu centralnego, a jednocześnie początek wielokierunkowych działań na rzecz poprawy wiarygodności wyników laboratoryjnych w Polsce, przejętych obecnie przez Centralny Ośrodek. Mimo rozlicznych zmian – liczby uczestników, zakresu ocenianych składników, kryteriów oceny czy sposobu przedstawiania wyników – niezmiennie od niemal 35 lat sprawdziany programu centralnego przeprowadzane są regularnie 1 x w miesiącu z wykorzystaniem dwóch materiałów kontrolnych równolegle. Ze względów ekonomicznych program pozostał ekskluzywny, ograniczony do ok. 250 dużych, wiodących w skali kraju laboratoriów (choć z różnych przyczyn dołączono w ciągu tych lat nieco placówek mniejszych). Z zasady są to placówki dobrze zorganizowane i wyposażone, o szerokim zakresie świadczonych usług, np. wszystkie zakłady diagnostyki laboratoryjnej WSZ czy CSK. 17 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... Aczkolwiek laboratoria uczestniczące w programie centralnym stanowią poniżej 15% ogółu laboratoriów objętych programem powszechnym, to obejmują 90 ze 143 = 63% laboratoriów bardzo dużych (> 25 prac. fachowych) czy 118 z 411 laboratoriów dużych (11-24 prac. fachowych). Średnio laboratoria te oznaczają podobnie jak laboratoria bardzo duże 22 z 25 ocenianych składników (średnia dla ogółu laboratoriów – 18 składników), dysponując jednocześnie lepszym od przeciętnego wyposażeniem. U uczestników programu centralnego zlokalizowanych jest 54% analizatorów Modular/Cobas 6000, 39,3% analizatorów Olympus, 33,6% analizatorów Cobas Integra i odpowiednio więcej innych dużych nowoczesnych analizatorów spośród wszystkich zgłoszonych przez użytkowników programu powszechnego. Dla Centralnego Ośrodka laboratoria uczestniczące w programie centralnym stanowią swoistą grupę referencyjną wyznaczającą kierunki oczekiwanych/pożądanych zmian. Adekwatnie do wielkości, kompetencji i wyposażenia uczestnicy programu centralnego uzyskują wyniki korzystniejsze niż ogół laboratoriów. W tab. III podano – z rozbiciem na poszczególne składniki i ogółem – procent wyników uznanych za poprawne względem trzech przyjętych układów odniesienia tj. wartości umownie należnych – średnich ogólnych (z wszystkich wyników), średnich metodycznych (z wyników uzyskanych tą samą metodą) i średnich metodyczno-aparaturowych (z wyników uzyskanych tą samą metodą i aparatem). Oczywiście im lepiej opisane warunki oznaczania, tym uzyskane wyniki są korzystniejsze – procent wyników uznanych za poprawne odpowiednio rośnie – 86,86% - 93,19% - 95,63%. W stosunku do roku 2004 przy ograniczonym zwiększeniu liczby ocenianych wyników (o 6%) uzyskano wzrost wyników poprawnych o 2-3%. Pozornie zmiany te wydają się niewielkie, należy jednak uwzględnić, że dotyczą dużych zbiorów (niemal 135 tys. ocenianych wyników), a jednocześnie zmiany następują na bardzo wysokim poziomie wiarygodności – nawet powyżej 95% wyników uznanych za poprawne – kiedy uzyskanie nawet znikomej zmiany jest już bardzo trudne. Dane zbiorcze tab. III zilustrowano ryc. 1. Ponieważ w tab. III podano dane zbiorcze dla 24 wykorzystanych w r. 2009 materiałów kontrolnych, to jedyną dostęp- Rycina 1 Graficzne przedstawienie ocen okresowych z tabeli III. 18 ną formą zintegrowanej oceny było podanie procentu wyników przyjętych za poprawne. Przy ocenie vs średnie ogólne rozproszenie wyników – i automatycznie procent wyników uznanych jako poprawne – w znacznej mierze zależy od oczywistych czasami różnic między metodami. Oprócz „klasycznej” różnicy aktywności LDH zależnie od kierunku przebiegu wykorzystywanej reakcji redox, różnice metodyczne wyraźnie występują także przy ocenie HDL-Chol., magnezu, bilirubiny, kreatyniny czy akt. amylazy i ALP. Miarą występowania ewent. różnic wartości zależnie od wykorzystywanej metody jest różnica w odsetku wyników uznanych jako poprawne vs xog i xmet – im ta różnica jest większa, tym prawdopodobieństwo zróżnicowania wartości metodycznych jest wyższe. Oczywiście należy także uwzględnić popularność poszczególnych metod. Przykładowo przy oznaczaniu cholesterolu – 94,99% popr. vs xog i 95,42% popr. vs xmet, Δ = 0,43% – wg stosowanej klasyfikacji unifikacja metodyczna tego badania jest niemal całkowita. Różnice zbiorcze między oceną vs xmet i xmet-ap są już pozornie mniejsze (93,2% i 95,6% poprawnych, Δ = 2,4%), ale są to dane, dla wszystkich składników i aparatów. Dla niektórych składników są wyraźnie większe, co spowodowane jest zróżnicowaniem wyników, wyznaczonych nawet tą samą metodą, ale różnymi analizatorami (skutek związanej z efektem podłoża niekomutabilności materiałów kontrolnych). Problem jest bardzo poważny, niezależnie od przyjętego systemu odniesienia (np. liofilizowane materiały kontrolne z wyznaczonymi wartościami definitywnymi). Dla jego zobrazowania w tab. III podano dodatkowo ocenę vs xmet i xmet-ap wyników uzyskanych 6 analizatorami najczęściej wykorzystywanymi przez uczestników programu centralnego. W żadnym wypadku nie jest to ranking aparatów – wyniki uzyskane zostały w odmiennych warunkach w różnych laboratoriach. Jednak dla analizatorów Cobas Integra różnica w ocenie wyników vs xmet i xmetjest znikoma (96,4% i 96,9% poprawnych, Δ = 0,5%), co ap sugeruje niewielki wpływ analizatora na wyznaczone wartości. Odmienna jest sytuacja z oznaczeniami wykonanymi na aparatach Dimension (Δ = 7,3%), Konelab (Δ = 4,7%) czy Cobas 6000 (Δ = 2,9%). Aparatami tymi dla części składników wyznaczane są wartości z zasady wysoce zbieżne, ale n 134440 131007 129676 126830 r. 2008 r. 2006 r. 2004 5846 3917 GGT LD razem r. 2009 439 5231 CK 5984 AMY AcP 6149 5902 6056 6150 triglicerydy AST ALT 5815 HDL-Ch ALP 6124 6104 bilirubina 6052 6219 moczany glukoza cholesterol 6202 6137 mocznik kreatynina 95,91 93,19 92,9 91,2 90,3 86,86 87,2 85,8 84,9 95,70 93,90 87,77 84,90 83,83 0,89 97,58 89,77 91,17 96,93 85,49 96,23 98,04 93,27 93,09 95,19 90,64 77,32 83,04 89,37 95,42 83,67 94,38 96,92 93,26 95,19 94,99 96,70 89,31 94,36 82,40 90,26 86,73 białko 6067 4992 5510 chlorki fosforany 87,19 84,14 92,97 77,15 89,27 94,12 5566 5840 magnez żelazo 93,81 88,45 85,62 5886 wapń 93,58 96,96 89,73 ogółem 95,77 vs xog %popr. 92,45 6126 6126 sód wyn. potas oznaczany składnik 96,4 99,6 98,8 98,7 84,7 99,8 99,0 98,9 99,2 98,7 92,2 98,6 87,6 98,0 98,4 93,4 96,9 95,2 98,4 92,2 94,0 94,0 94,9 97,2 93,9 Integra 94,0 97,9 98,3 97,7 - 99,2 63,9 96,7 97,7 97,7 97,8 98,4 96,9 98,3 97,1 93,6 98,2 81,0 95,4 91,0 96,9 78,9 95,2 98,2 94,6 Olympus 89,3 95,0 86,1 89,3 - 97,1 63,2 98,3 98,3 92,3 87,4 94,8 86,9 96,4 84,3 81,5 93,8 93,4 89,7 81,1 84,1 75,7 92,6 98,7 93,8 Konelab % popr. vs xmet 94,7 99,5 98,0 100,0 - 99,0 99,4 98,8 99,4 97,3 91,9 97,6 79,7 98,7 86,1 90,3 97,3 88,7 97,8 76,1 99,0 87,9 98,0 97,8 94,5 Cobas 6000 89,4 97,8 98,1 91,1 - 78,8 69,9 93,9 98,8 96,4 93,1 67,4 97,3 93,4 99,2 71,9 98,2 98,7 79,1 62,8 95,4 88,0 95,5 97,7 96,7 Dimension 95,8 99,2 99,3 90,7 - 99,0 99,6 97,9 97,9 96,8 94,7 99,3 88,3 97,5 98,2 94,7 97,9 95,0 93,8 98,9 92,5 82,1 94,6 98,7 95,0 Vitros 93,6 94,5 95,6 95,63 90,48 97,44 97,62 82,55 99,23 95,44 97,88 98,85 96,79 93,18 97,24 93,53 97,61 97,14 94,52 97,40 93,98 95,95 94,14 94,90 86,01 95,09 97,70 94,96 ogółem 96,9 99,7 99,0 98,8 82,8 99,8 98,9 99,2 99,5 98,7 92,1 98,6 89,1 98,1 98,4 96,4 97,7 95,5 98,5 94,9 94,0 94,1 95,0 97,9 95,6 Integra 96,5 98,4 99,0 98,1 - 99,0 92,8 98,4 99,0 98,1 97,8 98,2 98,8 98,0 97,6 96,7 98,2 92,2 96,0 97,5 96,8 79,6 96,6 98,1 95,3 Olympus 94,0 96,4 90,9 97,5 - 98,2 91,9 98,8 99,3 92,7 89,7 93,6 98,1 96,7 93,8 89,4 94,8 95,2 97,3 86,3 94,0 79,6 95,0 98,7 95,3 Konelab 97,6 99,5 97,3 99,2 - 99,0 100,0 98,5 98,8 98,2 94,4 98,8 91,5 98,3 97,3 95,6 97,2 98,2 98,7 96,2 99,3 92,4 99,3 97,8 96,7 Cobas 6000 % popr. vs xmet–ap 96,7 99,0 100,0 97,0 - 99,4 91,7 94,5 99,4 98,4 98,0 96,4 98,2 98,5 99,2 98,5 98,2 98,4 82,3 94,1 98,8 89,6 98,7 98,0 97,0 Dimension 95,8 99,2 99,3 90,7 - 99,0 99,6 97,9 97,9 96,8 94,7 99,3 88,3 97,5 98,2 94,7 97,9 95,0 93,8 98,9 92,5 82,1 94,6 98,7 95,0 Vitros 3,99 4,11 4,22 4,29 4,74 4,63 4,53 3,06 4,84 4,24 4,62 4,73 4,54 3,86 4,49 4,09 4,45 4,46 4,05 4,41 3,92 4,21 3,96 4,17 3,24 3,99 4,41 4,16 precyzji 3,48 3,68 3,77 3,92 4,48 4,46 4,27 2,56 4,64 3,97 4,27 4,42 4,18 3,46 4,12 3,70 4,10 4,21 3,57 4,12 3,54 3,78 3,48 3,58 2,60 3,69 4,03 3,69 ogóln. wiar. śr. ocena pkt. Tabela III Zestawienie ocen wyników oznaczeń kontrolnych programu centralnego w r.2009 zależnie od przyjętych wartości umownie należnych – odsetek wyników poprawnych w stosunku do średnich ogólnych, średnich metodycznych i średnich metodyczno-aparaturowych. Dodatkowo podano odsetek wyników poprawnych uzyskanych najczęściej wykorzystywanymi w programie centralnym analizatorami: Cobas Integra (88 szt.), Olympus (38 szt.), Konelab (27 szt.), Cobas 6000 (16 szt.), Dimension (15 szt.) i Vitros (14 szt.). A.M. Brzeziński i B. Przybył-Hac 19 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... wyraźnie odmienne od uzyskiwanych innymi analizatorami. Najbardziej klasycznym przykładem takiego analizatora o często „własnych” wartościach metodycznych jest Dimension. Dla kilku składników oznaczanych tym analizatorem wybrano z tab. III procent wyników uznanych jako poprawne vs xmet i xmet-ap: chlorki – 62,8% i 94,1%, Δ = 31,3%!; cholesterol – 67,4% i 96,4%, Δ = 29,0%; kreatynina – 71,9% i 98,5%, Δ = 26,6% czy ALP – 69,9% i 91,7%, Δ = 21,8%. Trudno dyskutować, dlaczego wykorzystując formalnie tą samą metodę, określonym analizatorem wyznacza się wyraźnie odmienne wartości (w materiałach kontrolnych!). Dotyczy to oczywiście nie tylko aparatów Dimension, ale także części pozostałych, np. aparatów Konelab (akt. ALP – Δ = 28,7%, bilirubina – Δ = 11,2%, moczany – Δ = 9,5%), analizatorów Cobas 6000 (chlorki – Δ = 20,1%, bilirubina – Δ = 11,8%, moczany – Δ = 11,2%) czy Olympus (akt. ALP – Δ = 28,9%, białko całk. – Δ = 11,2%). Oczywiście z założenia różnice takie nie mogą występować dla analizatorów Vitros i metody suchej fazy. W efekcie oceniając wyniki w stosunku do „własnych” średnich metodyczno-aparaturowych różnice między przedstawionymi analizatorami są stosunkowo małe – 96,5% - 97,5% poprawnych. Należy jednak uwzględnić, że aczkolwiek poza analizatorami Vitros są to systemy teoretycznie „otwarte”, to faktycznie związane są z fabrycznie określonymi metodami, odczynnikami i kalibratorami, a więc de facto są „zamknięte”. Wyjątek (wśród omawianych) stanowią analizatory Konelab – najniższą („zaledwie” 94%) poprawność względem wartości metodyczno-aparaturowych można wiązać z równoległym wykorzystywaniem odczynników dwóch firm – bioMerieux i Thermo-Kone, a wyznaczane nimi wartości mogą się znacząco różnić. Duża liczba wyników uzyskiwana przez każdego uczestnika dla poszczególnych składników – formalnie 24 w roku – umożliwia pogłębioną ocenę precyzji i ogólnej wiarygodności wyznaczanych wartości. Podstawą oceny jest rozproszenie błędów tj. różnic procentowych między wartościami wyzna- Tabela IV Ocena precyzji i ogólnej wiarygodności wyników oznaczanych składników w poszczególnych laboratoriach, uzyskanych przez uczestników programu centralnego w 2009 r. oceniany składnik sód n aparatów %% ocena precyzji %% ocena ogólnej wiarygodności oznacz. sklas. bdb db wątpl. niezad zła bdb db wątpl. niezad zła 269 256 31,6 57,0 9,4 2,0 0 15,2 57,8 18,8 5,1 3,1 potas 269 256 44,1 52,7 3,1 0 0 27,3 57,4 11,7 1,6 2,0 wapń 259 245 24,5 58,4 13,5 2,9 0,8 15,9 56,3 19,6 4,9 3,3 magnez 249 229 7,4 53,7 21,0 8,7 9,2 3,5 38,4 24,9 14,0 19,2 żelazo 259 247 39,3 47,8 8,9 2,4 1,6 21,5 50,2 14,6 6,1 7,7 chlorki 225 209 21,5 62,7 12,0 1,4 2,4 9,1 56,0 24,4 5,7 4,8 fosforany 245 228 43,9 44,7 7,2 1,8 2,6 27,6 49,6 12,7 3,1 7,0 osmolalność 39 34 8,8 67,6 14,7 8,8 0 0 47,1 32,4 14,7 5,9 białko 266 254 20,5 62,2 13,0 2,0 2,4 10,6 54,3 26,4 3,9 4,7 mocznik 271 259 47,5 47,1 4,6 0,8 0 29,3 57,9 10,8 1,2 0,8 kreatynina 268 256 30,5 52,0 14,4 2,0 1,2 18,0 48,8 21,9 5,9 5,5 moczany 265 253 53,8 39,5 6,3 0,4 0 35,6 53,4 9,1 2,0 0 glukoza 272 260 48,8 48,1 2,7 0,4 0 28,8 60,0 8,1 1,5 1,5 bilirubina 268 256 29,3 55,9 12,5 2,0 0,4 14,8 54,7 23,8 5,1 1,6 cholesterol 268 255 55,3 40,4 3,5 0,8 0 33,3 54,5 8,2 2,8 1,2 HDL-Ch 255 242 20,2 61,2 11,6 5,0 2,1 12,4 52,1 23,1 6,6 5,8 triglicerydy 266 253 60,1 34,0 5,9 0 0 40,7 45,1 10,7 2,0 1,6 AST 269 257 79,4 17,1 2,0 1,6 0 57,6 34,2 5,1 2,3 0,8 ALT 269 257 66,5 30,4 2,3 0,8 0 42,8 46,3 9,0 1,2 0,8 ALP 261 245 45,7 42,4 7,4 3,3 1,2 34,7 45,7 12,2 4,1 3,3 AMY 263 250 85,6 13,2 0,8 0,4 0 74,8 22,0 0,4 1,2 1,6 AcP 24 18 5,6 33,3 44,4 11,1 5,6 0 16,7 61,1 5,6 16,7 CK 231 218 56,0 40,8 3,2 0 0 39,4 50,9 8,3 1,4 0 GGT 256 245 71,8 23,3 3,3 1,2 0,4 58,8 33,1 6,1 1,6 0,4 LD 179 159 77,4 19,5 3,1 0 0 64,8 25,8 6,3 1,9 1,3 45,6 44,0 7,6 1,8 1,0 30,6 48,3 14,0 3,7 3,4 20 r. 2009 89,6 7,6 2,8 78,8 14,0 7,1 r. 2008 87,5 9,0 3,5 74,7 15,2 10,0 r. 2006 84,7 10,5 4,8 72,9 16,0 11,1 r. 2004 80,8 12,9 6,3 66,2 19,4 14,4 A.M. Brzeziński i B. Przybył-Hac czonymi a należnymi, a ściślej odchylenie standardowe zbioru tych błędów (w zestawieniu z dopuszczalnymi granicami błędów). Podstawę tego systemu opracowano w 1978r. i wielokrotnie go omawiano, natomiast wyniki uzyskane w r. 2009 przedstawiono w tab. IV. Dla prawie wszystkich ocenianych składników (poza magnezem, osmolalnością i akt. kwaśnej fosfatazy) uzyskuje się wysoce korzystne oceny nawet ogólnej wiarygodności (suma błędów przypadkowych i systematycznych). Na podkreślenie zasługuje obserwowana w kolejnych latach poprawa – zwiększenie bardzo dobrych i dobrych ocen precyzji z 80,8% w r.2004 do 89,6% w r.2009 czy ogólnej wiarygodności z 66,2% do 78,8% (+ 12,6%) jest naprawdę istotne. Jeszcze bardziej spektakularny jest spadek w tym samym okresie ocen niezadowalających i złych – dla precyzji z 6,3% do 2,8%, a dla ogólnej wiarygodności – z 14,4% do 7,1% (!). Jest to niewątpliwie wynik ciężkiej pracy wykonawców, ale także zachodzących korzystnych zmian aparaturowych i odczynnikowych oraz znacznego uczulenia na poprawność procesu kalibracji. Uzyskiwana przez poszczególne laboratoria ocena precyzji czy ogólnej wiarygodności oznaczanych składników stały się w r.1996 podstawą dodatkowej klasyfikacji uczestników programu centralnego. Wprowadzone zróżnicowanie jest pozorne – aczkolwiek tłumaczeniem ang. certificate jest zaświadczenie, to w ogólnym odczuciu słowo certyfikat ma inne, „wyższe” znaczenie niż zaświadczenie. I tą quasi-semantyczną różnicę postanowiono wykorzystać. Jednocześnie założono, że wymagania nie mogą być zbyt wygórowane – muszą być do spełnienia przez każde profesjonalnie prowadzone laboratorium. W 1996r. sprecyzowano 3 kryteria, które musiały być równocześnie spełnione – dla uzyskania certyfikatu laboratorium musiało uzyskać w ciągu roku powyżej 85,0% wyników kontrolnych ocenionych jako poprawne oraz średnio > 3,0 pkt. w ocenie precyzji i > 2 pkt. w ocenie ogólnej wiarygodności. W pierwszym roku wymagania te spełniło 51 z ocenionych 92 laboratoriów (= 55,5%). Aczkolwiek uzyskanie certyfikatu uczestnictwa (a nie „tylko” zaświadczenia) nie jest związane z jakimiś korzyściami czy przywilejami, to zdobycie go stało się dla laboratoriów bardzo istotne ze względów ambicjonalnych – już w roku następnym (1997) wyraźnie wzrosła – do 61 tj. 66,3% uczestników – liczba laboratoriów które uzyskały to wyróżnienie. Od tego czasu mimo zmiany wachlarza ocenianych składników i liczby uczestników programu centralnego wymagania były zmieniane kilkukrotnie, co jest wyrazem zachodzących korzystnych zmian. Gdyby w r.2009 wykorzystać kryteria z r. 1996, to certyfikatu nie dostałoby 12 z 246 laboratoriów (czyli < 5%) i to prawie wyłącznie z powodu zbyt niskiej poprawności nadsyłanych wyników (< 85% poprawnych) – tylko 4 laboratoria (~ 1,6%) nie uzyskało wymaganej wówczas minimalnej oceny precyzji czy ogólnej wiarygodności. Obowiązujące obecnie kryteria uzyskania certyfikatu uczestnictwa dobrane zostały w r. 2007 - > 92,5% wyników kontrolnych uznanych za poprawne oraz średnio > 3,95 pkt. w ocenie precyzji i > 3,4 pkt. w ocenie ogólnej wiarygodności. W r. 2007 kryteria te spełniło 166 z ocenianych 246 laboratoriów (tj. 67,5%), ale w roku 2009 już 205 tj. 83,3% uczestników. Tym samym następuje nadmierne obniżenie wartości certyfikatu, traci on charakter wyróżniający i w r.2010 będzie musiała nastąpić kolejna zmiana wymagań – przypuszczalnie > 94 lub 95% wyników kontrolnych ocenionych jako poprawne i średnio > 4,1-4,2 pkt. w ocenie precyzji i > 3,5-3,6 pkt. w ocenie ogólnej wiarygodności. Te stosunkowo częste, kolejne zaostrzenia wymagań dla uzyskania certyfikatu uczestnictwa najprawdopodobniej związane są przede wszystkim z korzystnymi zmianami wykorzystywanego w laboratoriach wyposażenia. Aczkolwiek można łatwo wykazać, że nowoczesna aparatura nie jest warunkiem wystarczającym do wyznaczenia poprawnych wyników, to jednak bardzo ich uzyskanie ułatwia. Powszechny program chemiczny. Powołanie przez MZiOS w 1978r. Komisji ds. Standaryzacji i Kontroli Jakości Badań Laboratoryjnych i Mikrobiologicznych oraz kilkuletnia bezproblemowa realizacja programu centralnego pozwoliły na wprowadzenie w 1982r. powszechnego programu sprawdzianów chemicznych, potencjalnie obejmującego wszystkie działające w kraju medyczne laboratoria diagnostyczne. To ambitne założenie stało się składową obligatoryjnego standardu laboratoryjnego, wdrożonego od 1.04.2009r. rozporządzeniem Ministra Zdrowia (Dz.U.rozp. 435 z dn.23.03.2006r.). W obecnej formie program jest realizowany od 2001 r. – sprawdzianami 4 x w roku w dwóch materiałach kontrolnych równolegle objętych jest 25 podstawowych oznaczeń chemicznych. Program jest więc niemal bliźniaczy do programu centralnego, a główne różnice to częstotliwość przeprowadzania sprawdzianów (1 x w kwartale, 1 x w mies.) oraz liczba (1750 – 250) i dobór uczestników programu (powszechny – elitarny). Pochodną tych różnic jest nieco odmienny sposób oceny wyników. Kilkukrotnie większa liczba uczestników, a tym samym wyników pozwala w programie powszechnym dołożyć do szeregu wykorzystywanych wartości umownie należnych – średnich ogólnych, średnich metodycznych i średnich metodycznoaparaturowych – kolejną wartość – średnią metodycznoaparaturowo-odczynnikową czyli systemową. Wyodrębnienie grup homogennych wyników, wyznaczonych w bardzo zbliżonych warunkach – tą samą metodą, na takim samym aparacie i takimi samymi odczynnikami – spowodowało wyraźną poprawę ich oceny. Jednocześnie jednak znaczny odsetek wyników jest z możliwości takiej oceny wyłączony. Dotyczy to przede wszystkim wyników uzyskanych mniej popularnymi analizatorami, wykorzystującymi zróżnicowane odczynniki – zebranie min. 6 homogennych wyników może okazać się niemożliwe. Przedstawiono to w tab. VI w kolumnie X – podano w niej odsetek wyników uzyskanych różnymi analizatorami, dla których można było zastosować średnie metodyczno-aparaturowo-odczynnikowe. Z analizatorami Cobas Integra wykorzystywane są wyłącznie odczynniki firmy Roche – w efekcie aż 99,8% z ponad 35 tys. wyników 21 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... wyznaczonych tymi analizatorami mogło być ocenionych vs średnie systemowe. Podobnie jest z szeregiem dalszych analizatorów, wykorzystujących odczynniki producenta (Olympus, Dimension, Advia, Architect czy A15/A25) bądź importera (f-ma Cormay – analizatory Accent 200/300 czy Prestige 24). Jednocześnie szereg analizatorów wykorzystuje bardzo zróżnicowane odczynniki. Zaledwie niewiele ponad 50% z blisko 7,5 tys. wartości wyznaczonych analizatorami Cobas Mira może być ocenionych vs średnie metodyczno-aparaturowo-odczynnikowe (i to nie z odczynnikami Roche) czy 0% z 1200 wyników uzyskanych 20 aparatami Alcyon – wiosną 2009r. do wyznaczenia tymi analizatorami 20 wyników glukozy posłużono się odczynnikami 13 (!) różnych firm. Zróżnicowanie odczynników jest bardzo duże – uczestnicy programu wymienili aż 65 firm producentów/ dystrybutorów. 75% wyników nadesłanych w programie powszechnym w r.2009 zostało uzyskanych produktami 10 firm (Roche – 20,6%, BioSystems – 12,5%, Cormay – 8,3%, α-Diagnostics – 6,4%, Olympus – 6,0%, bioMaxima – 5,9%, Emapol/Human – 4,8%, bioMerieux – 3,7%, Thermo/Kone – 3,5%, HORIBA ABX – 3,3%), a dalszych 18,5% - następnych 10 firm. Wykorzystanie wielu z pozostałych 45 firm jest tak znikome, że może być wynikiem omyłek (czasami ewidentnych – np. oznaczanie glukozy odczynnikami f-my Adel). Ewentualne wyjaśnianie tych pomyłek przekracza możliwości organizatorów – przykładowo latem 2009 z blisko 1700 nadesłanych wyników glukozy aż 135 (!) uzyskanych zostało jako pojedyncze wyniki aparaturowo-odczynnikowe, co uniemożliwia jakąkolwiek ich ocenę porównawczą. W sumie ponad 20% wyników glukozy nadesłanych latem 2009 nie pozwalało na stworzenie homogennych grup metodyczno-aparaturowo-odczynnikowych o wymaganej liczebności n ≥ 6, co wykluczało ich ocenę vs wartości systemowe. Należy uwzględnić, że oznaczanie glukozy jest bardzo popularne, a dla oznaczeń rzadziej wykonywanych sytuacja jest gorsza. Ograniczona liczba wyników kontrolnych, wyznaczanych w ciągu roku przez poszczególnych uczestników dla każde- Tabela V Zestawienie ocen wyników oznaczeń kontrolnych w powszechnym programie sprawdzianów chemicznych w r. 2009. n ocenianych wyników i %% uznanych za poprawne względem ocena regularności n ozn. lab. n wyn. % popr. n wyn. % popr. n wyn. % popr. n wyn. % popr. sód 1257 9537 82,5% 9533 87,1% 8869 90,2% 8329 90,5% 81,0% 6,6% 4,201 potas 1264 9604 89,1% 9582 90,5% 8916 92,4% 8362 93,0% 83,8% 6,4% 4,308 wapń 1279 9682 80,2% 9618 81,7% 8400 84,5% 6767 87,3% 80,9% 8,1% 4,209 magnez 1216 9165 59,8% 9149 64,1% 7849 68,4% 6491 70,6% 65,7% 16,9% 3,660 żelazo 1461 11068 68,9% 11048 73,1% 9666 77,1% 7853 80,3% 71,5% 13,8% 3,906 chlorki 764 5598 82,3% 5578 83,7% 4801 89,9% 4373 91,8% 74,3% 14,3% 3,920 fosforany 994 7500 81,5% 7500 83,2% 6348 87,7% 5085 89,9% 84,6% 7,6% 4,359 osmolalność 56 423 83,4% 421 83,4% 398 85,2% 362 84,8% 80,4% 7,1% 4,232 oceniany składnik vs xog vs xmet vs xmet-ap vs xsyst bdb + db nzd + zła ± pkt białko 1464 11128 69,5% 11126 72,7% 9904 78,3% 8080 82,0% 74,6% 10,2% 4,018 mocznik 1674 12776 86,8% 12730 89,3% 11736 90,3% 9769 91,6% 86,0% 6,2% 4,386 kreatynina 1726 13161 76,0% 13149 80,0% 11677 85,4% 9613 87,2% 91,5% 3,4% 4,633 moczany 1638 12479 83,0% 12477 83,7% 11513 86,5% 9657 88,4% 81,0% 8,8% 4,231 glukoza 1748 13339 90,2% 13303 91,6% 12271 92,3% 10244 93,3% 84,2% 6,7% 4,321 bilirubina 1646 12539 80,9% 12516 82,7% 10445 87,7% 8510 89,1% 79,4% 8,8% 4,170 cholesterol 1718 13103 91,2% 13091 91,8% 12441 92,8% 10487 93,8% 85,5% 5,8% 4,377 HDL-Ch 1460 11029 66,9% 10997 78,2% 8966 83,8% 7375 86,6% 78,3% 9,8% 4,124 triglicerydy 1681 12824 88,6% 12820 89,5% 12080 90,6% 10192 92,2% 86,1% 6,8% 4,391 AST 1709 13046 92,4% 13044 93,2% 11868 94,5% 9970 95,6% 90,6% 3,7% 4,573 ALT 1737 13262 92,4% 13260 92,9% 12078 94,1% 10048 95,1% 91,2% 3,9% 4,579 ALP 1331 10076 73,6% 10064 77,4% 8750 86,1% 7153 88,6% 82,0% 7,4% 4,271 AMY 1441 10913 88,1% 10903 92,9% 9447 96,4% 8014 97,2% 90,4% 5,1% 4,541 AcP 72 452 68,4% 440 69,8% 164 85,4% 100 97,0% 54,2% 30,6% 3,014 CK 880 6590 90,3% 6590 91,3% 5412 93,6% 4712 94,3% 86,7% 6,2% 4,440 GGT 1302 9863 86,8% 9855 90,2% 8764 93,6% 6898 95,6% 90,6% 4,7% 4,578 LD 515 rok 2009 22 3784 5,6% 3784 89,1% 3182 92,8% 2782 94,0% 85,4% 8,9% 4,336 242936 81,0% 242596 84,9% 215945 88,3% 181226 90,1% 83,1% 7,6% 4,296 rok 2007 248220 80,9% 247791 84,0% 223103 86,9% 176917 89,0% 4,210 rok 2005 246783 80,1% 245275 83,4% 220364 85,8% 167392 87,8% 4,055 A.M. Brzeziński i B. Przybył-Hac go ocenianego składnika (4 x 2 = 8 wyników, a nie 12 x 2 = 24 wyniki) uniemożliwia roczną ocenę precyzji i ogólnej wiarygodności pojedynczego laboratorium, wykorzystywaną w programie centralnym. W zamian wprowadzono ocenę uzyskiwanej regularności oznaczeń poszczególnych składników, zależną od liczby „zaliczonych” w ciągu roku sprawdzianów (obydwa równoległe wyniki uznane za poprawne). W tab. V zestawiono dla regularności udział procentowy ocen bardzo dobrych i dobrych oraz niezadowalających i złych, a także średnią ocenę punktową danego oznaczenia. Mimo analogicznej skali punktowej (0 – 5 pkt.) ocena regularności jest zasadniczo różna od ocen wykorzystywanych w programie centralnym. Dane zbiorcze uzyskane w powszechnym programie chemicznym w r.2009 z rozbiciem na poszczególne oceniane składniki, zestawiono w tab. V. Dla porównania podano wyniki uzyskane 2 i 4 lata wcześniej. Poprawa przy ocenie vs xog czy nawet xmet jest znikoma, ale przy ocenie vs xmet-ap czy xsyst jest już zdecydowanie bardziej wyraźna. Przypuszczalnie jest to związane z postępującą korzystną zmianą wyposażenia. Wyraźny jest też wzrost przeciętnej punktowej oceny regularności – z 4,055 pkt. w r. 2005 do 4,296 pkt. w r. 2009. W tab. VI podano wyniki uzyskane najczęściej wykorzystywanymi analizatorami – nie jest to ranking tych aparatów! Wyniki kilku typów analizatorów, zwłaszcza przy ocenie vs xsyst, są wysoce korzystne – 96,8% poprawnych wśród wartości wyznaczonych aparatami Roche Modular, 96,0% - analizatorami Olympus czy 95,5% analizatorami Cobas Integra dobrze świadczą o tych systemach. Niektórymi systemami analitycznymi wyznacza się w materiałach kontrolnych wartości wysoce zbieżne (wysoki procent poprawnych vs xsyst), ale wyliczone średnie systemowe są wyraźnie różne od średnich metodycznych czy ew. średnich ogólnych. W wypadku 8 wykorzystywanych w ciągu roku materiałów kontrolnych najprostszą formą przekazania zintegrowanej informacji jest podanie procentu wyników ocenionych jako poprawne w stosunku do kolejnej przyjętej wartości umownie należnej. Wartości wyznaczane w materiałach kontrolnych analizatorami Vitros są często zdecydowanie odmienne, niż wyznaczone innymi aparatami. W efekcie niewiele ponad połowa wyników kontrolnych uzyskanych aparatami Vitros została oceniona jako poprawne w stosunku do średnich ogólnych z wszystkich nadesłanych wyników. Jednocześnie wyznaczane wartości są zbieżne, co warunkuje wysoką poprawność przy ocenie w stosunku do średnich metodycznych oraz równych im (system zamknięty!) średnich metodyczno-aparaturowych czy metodyczno-aparaturowo-odczynnikowych. Mimo wykorzystywania odpowiednich metod, wartości wyznaczane w materiałach kontrolnych aparatami Dimension są często odmienne od średnich metodycznych. W efekcie z niemal 5 tys. wyników kontrolnych wyznaczonych aparatami Dimension w 2009r. jako poprawne zakwalifikowano tylko 77,6% przy ocenie vs xog , ale już 84,4% vs xmet (= + 6,8%) i 93,3 % (kolejne + 8,9%) przy ocenie vs xmet-ap. Wykorzystywanie w praktyce wyłącznie odczynników firmowych powo- duje nie tylko dla analizatorów Dimension ale i szeregu dalszych (Cobas Integra, Olympus, Accent, Pentra), że średnie systemowe są identyczne ze średnimi metodyczno-aparaturowymi, taka sama jest więc ocena wyznaczanych wartości. Niestety szereg analizatorów wykorzystuje bardzo zróżnicowane odczynniki, co odbija się negatywnie na możliwościach oceny wyznaczanych wartości. Przykładem mogą być dwa analizatory f-my Abbott – wycofany, wg firmy zapomniany Alcyon (w r. 2009 – ciągle ok. 15-18 szt.) i nowoczesny Architect (także ok. 15 szt.). Oznaczenia na Alcyonach prowadzone są z wykorzystaniem odczynników kilkunastu dostawców, co powoduje, że żadnej części z 1200 wyznaczonych w r. 2009 wyników kontrolnych nie można było ocenić wzgledem średnich systemowych. Jednocześnie z analizatorami Architect oznaczenia prowadzone są wyłącznie z odczynnikami dostawcy aparatów i 96,7% z ponad tysiąca wyników mogło zostać ocenionych w stosunku do wysoce korzystnych średnich metodyczno-aparaturowo-odczynnikowych. Jak istotny może być wpływ wykorzystywanych odczynników (i skojarzonych z nimi kalibratorów?) przedstawiono już w ubiegłym roku na przykładzie aparatów Konelab. Z analizatorami tymi wykorzystywane są odczynniki f-my Thermo/ Kone albo bioMerieux (dystrybutor tych analizatorów). Dla wielu oznaczanych składników rodzaj wybranych odczynników wydaje się nie mieć znaczenia, a wyznaczane wartości nie różnią się lub różnią się tylko sporadycznie. Jednak dla niektórych składników sytuacja jest odmienna – w 17 wykorzystanych w latach 2008-2009 materiałach kontrolnych wartości cholesterolu wyznaczone odczynnikami bioMerieux były 17 razy wyższe niż wyznaczone odczynnikami Thermo/ Kone – średnio o + 4,0% (s = 1,01%), z tego 15 razy różnica była statystycznie istotna przy ocenie zarówno testem parametrycznym (test t-Studenta) jak i nieparametrycznym (test U Manna-Whitneya). Podobnie 17 razy odczynnikami (i kalibratorami?) f-my bioMerieux wyznaczono niższe niż odczynnikami Thermo/Kone wartości moczanów (x = - 4,74%, s = 1,7%, 15 x różnica istotna) czy triglicerydów (x = - 4,76%, s = 2,20%, testem U różnice 16 x istotne). Oczywiście w przypadku mniej licznej grupy aparaturowej (aparatów Konelab ok. 100 szt.) i bardziej zróżnicowanych odczynników przeprowadzenie takich porównań nie jest możliwe, jednak przedstawiony przykład wyraźnie obrazuje wpływ odczynników na wyznaczane wartości. Z punktu widzenia organizatorów sprawdzianów pożądana byłaby maksymalna unifikacja zaopatrzenia odczynnikowego. Z wielu przyczyn nie jest to możliwe, istotne jest jednak wyeliminowanie odczynników używanych (lub zgłaszanych pomyłkowo) przez pojedyncze tylko laboratoria, co wyklucza możliwość ich racjonalnej oceny. Sprawdziany hematologiczne. Sprawdziany hematologiczne przeprowadzane są dwukrotnie w ciągu roku, każdorazowo wykorzystując dwa materiały kontrolne. Ocenie podlega 5 składników mierzalnych – hematokryt, stęż. hemoglobiny oraz liczba erytrocytów, krwinek białych i płytek oraz 3 pochodne parametry wyliczane 23 24 BioMerieux/Kone-Konelab Olympus Cormay – Accent 200,300 Roche – Cobas Mira AMP Polska – Flexor Ortho Clin.Diagn. – Vitros Horiba ABX – Pentra 400 Roche – Hitachi serii 9.. Dade Behring – Dimension BioMaxima–Metrolab Cormay – Prestige 24, 24i Bayer – Express Cormay – Lumen, Livia Mindray – BS120-400 Bayer – Advia 1650,1200 Roche – Modular -13-02 -78-01 -18-04 -44-02 -03-01 -35-01 -50-01 -44-05 -19-01 -91-02 -18-03 -08-01 -18-01 -69-01 -08-03 -44-08 Poll Ltd – Epoll Marcel – Euro Pointe – Pointe 180 Analco – Stat Fax -38-01 -31-01 -37-01 -04-01 Foto- i spektrofotometry BioSystems A15, A25 -15-02 02- Roche – Cobas Integra Analizatory nazwa i model aparatu -44-04 01- kod aparatu 29 35 61 196 24 25 26 27 35 38 39 39 47 50 52 53 57 75 89 101 143 238 n apar. 2670 2874 5750 21821 3585 3545 2084 2570 3930 4508 3957 4788 6199 7766 7789 6878 7413 7519 14333 15705 15551 35172 n wyn. 75,5% 79,6% 76,6% 77,2% 85,1% 83,7% 80,2% 82,4% 82,0% 84,9% 77,1% 77,6% 85,6% 84,0% 56,2% 79,3% 83,2% 82,5% 86,8% 84,5% 80,6% 88,2% xog 75,5% 80,1% 77,4% 78,9% 91,8% 87,4% 81,0% 83,4% 82,6% 86,9% 78,3% 84,4% 87,9% 86,2% 93,3% 82,0% 84,3% 84,3% 92,6% 87,2% 81,4% 94,0% xmet 76,8% 80,7% 77,9% 80,3% 96,5% 91,0% 83,6% 84,8% 83,7% 88,2% 80,5% 93,2% 90,3% 89,0% 93,4% 87,2% 85,0% 86,8% 95,9% 91,5% 83,1% 95,4% xmet-ap %% wyników poprawnych vs 83,6% 81,1% 82,4% 82,0% 96,8% 90,9% 91,1% 85,2% 85,9% 88,4% 80,5% 93,3% 93,1% 89,4% 93,4% 90,7% 86,9% 86,9% 96,0% 92,7% 83,8% 95,5% xsyst 14,8% 68,2% 55,5% 82,1% 98,6% 90,8% 30,1% 71,0% 67,1% 93,0% 92,7% 94,4% 74,6% 97,2% 100,0% 54,5% 53,4% 93,9% 98,6% 85,4% 95,6% 99,8% X 374 412 844 2890 522 508 403 348 517 633 629 761 857 970 1035 918 963 1220 1911 2049 2197 4782 n zbior. 67,4% 67,0% 64,2% 72,8% 97,9% 89,8% 74,2% 87,4% 77,2% 81,5% 74,2% 89,1% 89,8% 87,4% 89,2% 81,6% 79,4% 83,8% 96,9% 92,0% 79,9% 93,6% bdb+db 18,4% 15,3% 20,6% 13,1% 0,8% 2,2% 13,9% 5,8% 9,5% 8,4% 11,8% 3,2% 5,8% 3,5% 3,9% 8,2% 8,1% 6,3% 0,5% 2,3% 8,0% 2,7% nzd+zła 3,693 3,760 3,594 3,921 4,831 4,587 3,928 4,388 4,103 4,250 3,946 4,549 4,466 4,497 4,520 4,255 4,202 4,321 4,806 4,612 4,205 4,674 ± pkt. 35 4 6 4 11 12 7 14 4,507 4,784 4,287 4,147 4,231 4,434 4,434 4,406 4,383 3,946 4,183 54 71 51 38 40 25 39 35 6 13 4,300 4,784 2 11 3,928 4,355 2 19 26 25 33 41 4,065 22 4,190 79 3 2 49 80 4,575 141 A 158 Punktowa ocena regularności 4,869 4,692 4,806 4,800 4,707 4,799 4,614 4,776 4,839 4,761 4,848 B Tabela VI Program powszechny 2009. Ocena wyników uzyskanych najczęściej wykorzystywanymi aparatami (n ≥ 25) – podano odsetek wyników uznanych za poprawne vs xog, xmet, vs xmet-ap i vs xsyst, w tym ostatnim wypadku w rubryce X podając odsetek wyników, które mogły zostać ocenione. W drugiej części tabeli podano ocenę regularności – liczbę ocenionych zbiorów, odsetek zbiorów dla których regularność oceniono jako b.dobrą lub dobrą oraz jako niezadowalającą i złą, a na końcu oceniane analizatory rozbito na dwie podgrupy – wykorzystywane przez laboratoria nie biorące (A) lub biorące (B) udział w programie centralnym, w każdej podgrupie poza średnią oceną punktową podając liczbę analizatorów. Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... Orphee Mythic 18 Swelab AC920, 970 CD serii 3... Coulter ACT Diff Advia 120, 2120 Micros 45 Mindray BC2800, 3000, 3200 Nihon Kohden 3diff Celltac Medonic CA 5.. -50-02 -18-03 -12-02 -01-04 -60-02 -08-03 -50-03 -69-01 Coulter Gen S, LH750, 500 CD Ruby ogółem ogółem ogółem -01-06 r. 2009 r. 2008 r. 2007 -60-05 -18-02 -03-01 Pentra 5 diff -01-03 - 13 34 31 - 48 34 70 38 90 40 75 197 117 -40-02 9 25 24 24 20 40 36 50 43 68 64 98 169 188 343 338 Sysmex SF...., XT...., XE...., XS.... CD1600, 1700, 1800 483 513 28 25 22 18 35 34 42 40 45 61 84 92 140 261 338 486 n aparatów J07 J08 J09 kod nazwa aparatu modeli aparatów 08-40-01 Sysmex F-5.., 8.., K1000, 4500, KX21 -50-01 Micros 60 3diff 30700 30580 30970 384 390 400 424 528 624 652 708 720 1032 1360 1568 2376 3888 5400 n wyn. dla składn. 7722 Hct 95,6 96,5 96,9 97,7 99,7 97,0 98,1 93,9 99,2 98,0 94,5 91,0 89,2 95,3 98,5 96,2 98,4 97,8 98,0 a b c 93,6 4,47 97,2 0,63 94,8 3,58 87,4 8,75 97,5 1,02 67,3 28,0 86,1 3,10 79,0 11,9 91,4 3,11 4,4 93,6 93,6 5,61 72,9 21,0 75,9 22,2 94,0 3,00 98,2 1,54 6,2 91,4 88,7 8,35 90,6 5,99 90,3 5,28 93,9 94,6 94,5 96,4 98,5 88,5 95,3 85,8 88,9 95,7 91,2 96,1 82,3 92,6 98,3 92,8 99,2 91,9 98,0 a Hb b c 97,5 0,49 89,4 2,52 99,2 0,07 89,3 3,49 97,6 0,70 89,8 2,72 75,7 6,59 78,6 17,5 89,4 1,83 92,8 2,91 87,0 1,92 81,2 4,55 95,0 0,23 83,0 5,50 94,9 3,59 93,8 2,60 91,5 2,97 92,8 1,78 91,4 2,55 94,6 95,0 95,0 98,4 99,2 93,8 97,2 90,7 95,8 93,2 87,6 96,4 91,5 89,3 96,8 93,2 97,6 94,1 b c 97,6 0,30 93,8 0,26 97,4 0,15 87,2 5,93 95,0 1,79 88,7 0,66 89,2 2,32 94,7 1,67 86,7 0,85 92,0 1,23 95,7 0,16 87,1 3,60 96,9 0,24 87,8 6,00 99,0 0,26 97,9 0,52 93,7 1,32 99,0 0,97 93,6 1,03 RBC 97,9 a 92,6 94,4 93,8 94,5 98,7 82,8 98,1 94,9 91,7 95,1 94,4 92,6 89,7 79,3 92,0 92,2 97,7 93,8 b c 95,1 1,62 93,3 0,43 97,2 0,48 83,6 8,54 91,1 0,89 74,2 5,15 85,3 4,46 88,8 3,89 89,8 4,52 83,7 11,4 90,7 0,97 88,8 6,07 98,1 0 78,2 4,50 78,0 20,8 94,5 0 90,4 3,40 91,8 2,56 88,8 3,77 WBC 96,7 a 80,8 81,1 83,4 87,0 91,0 68,2 80,2 81,6 84,1 85,1 78,2 86,4 74,4 80,3 88,1 81,8 92,0 75,5 b c 87,8 0,26 73,9 1,56 86,0 5,98 78,5 3,33 83,2 4,84 79,9 0,36 70,1 4,36 53,5 32,9 74,0 4,24 47,2 37,9 82,2 1,92 77,8 3,79 57,3 22,9 63,0 5,25 74,9 16,2 74,2 12,8 78,0 5,36 72,6 8,54 73,3 7,46 PLT 88,1 a MCHC a b c 97,1 90,9 6,15 94,6 94,1 0,53 96,8 96,6 0,26 96,4 94,4 2,02 98,8 97,6 1,21 96,2 77,5 18,8 88,6 88,5 0,09 91,0 90,4 0,55 93,1 92,4 0,71 98,5 2,0 96,5 95,7 95,7 0 95,3 87,6 7,66 97,2 77,4 19,8 93,5 93,5 0 99,7 99,7 0 94,5 9,9 84,6 95,8 88,9 6,83 95,9 99,0 5,87 95,0 90,2 4,83 97,9 98,2 97,9 97,4 100 94,2 99,5 97,5 98,9 99,2 95,9 99,4 95,9 97,3 99,6 98,3 99,7 96,4 b c 98,6 0,02 95,8 0,61 99,7 0 98,0 0,34 99,7 0,06 97,0 0,30 96,5 -0,58 97,9 1,52 95,9 0 98,9 0,30 98,2 0,64 97,5 0,01 99,5 0 94,2 0 99,7 0,26 97,7 -0,26 97,3 0,58 97,5 0,64 97,3 0,61 MCH 98,7 a 97,2 97,9 98,2 100 100 98,0 96,9 97,4 98,9 98,8 97,6 91,0 92,9 98,7 98,9 98,8 98,5 98,6 b c 96,3 2,37 98,6 0 96,4 2,08 97,6 1,26 98,0 0,90 78,2 20,4 95,4 -2,51 90,7 0,28 96,3 1,27 3,2 95,6 98,7 0,16 92,8 4,55 65,1 31,8 99,0 -1,00 100 0 2,6 97,4 94,2 4,00 93,5 4,39 94,2 2,99 MCV 98,7 a 93,5 94,2 94,5 95,7 98,4 89,5 95,3 92,1 94,2 95,5 91,6 93,0 88,1 91,1 96,4 93,7 97,5 92,8 b c 94,7 1,96 92,0 0,81 95,9 1,57 89,5 4,21 95,0 1,41 81,6 9,55 85,8 2,23 84,2 8,79 89,5 2,06 53,1 42,4 92,7 1,42 85,8 6,39 83,2 12,1 86,6 2,91 93,0 5,32 59,6 36,1 90,1 4,32 90,4 3,83 89,9 3,56 razem 96,6 a Tabela VII Sprawdziany hematologiczne 2009. Dla poszczególnych składników podano uzyskiwany najczęściej wykorzystywanymi aparatami procent wyników uznanych za poprawne vs średnie aparaturowe (a) i średnie ogólne z wszystkich wyników (b) oraz różnicę między tymi wartościami (c). A.M. Brzeziński i B. Przybył-Hac 25 26 razem aparaty CellDyna CD1600, 1800 CD serii 3... CD Ruby razem aparaty Advia Advia 60 Advia 70 Advia 120, 2120 razem aparaty Orphee-Mythic Mythic 18 Mythic 22 -01-03 -01-04 -01-06 08-08- -08-01 -08-02 -08-03 08-18- -18-03 -18-04 Aparaty ogółem nazwa i model aparatu 08-01- 08- kod aparatu 32 224 256 144 27 96 267 - 204 716 984 37,71 -1,90 39,86 +3,69 39,59 +2,99 33,94 -11,71 40,42 +5,15 38,44 0 36,22 -5,78 - 40,82 +6,19 39,73 +3,36 39,93 +3,88 38,44 32 224 256 144 28 96 268 - 204 716 984 7822 36,48 -2,09 39,13 +5,02 38,80 +4,13 32,99 -11,46 39,31 +5,50 37,40 +0,38 35,23 -5,45 - 39,61 +6,30 38,76 +4,02 38,89 +4,37 37,26 n x Hct Δ%vs xog x Hct n Δ%vs xog 7822 W-08 mat.2 W-08 mat.1 36 256 292 142 32 72 246 36 172 678 924 7684 48,21 -2,98 51,40 +3,44 51,01 +2,66 43,78 -11,89 51,61 +3,86 50,80 +2,23 46,85 -5,72 46,98 -5,45 53,16 +6,98 50,92 +2,48 51,24 +3,12 49,69 n x Hct Δ%vs xog J-08 mat.1 36 256 292 142 32 72 246 36 172 676 924 7682 16,92 -4,57 18,44 +4,00 18,25 +2,93 15,12 -14,72 18,62 +5,02 17,40 -1,86 16,24 -8,40 16,03 -9,59 18,85 +6,32 18,39 +3,72 18,48 +4,23 17,73 n x Hct Δ%vs xog J-08 mat.2 24 344 368 157 20 88 265 80 180 628 948 7881 25,22 -2,85 27,93 +7,59 27,75 +6,90 22,76 -12,33 27,08 +4,31 25,94 -1,08 24,14 -7,01 22,02 -15,18 27,30 +5,16 27,07 +4,28 27,12 +4,47 25,96 n x Hct Δ%vs xog W-09 mat.1 24 344 368 159 20 88 267 80 180 628 948 7883 36,28 -3,25 39,80 +6,13 39,57 +5,52 32,86 -12,37 38,85 +3,60 37,82 +0,85 34,94 -6,83 32,92 -12,21 39,52 +5,39 38,80 +3,47 38,94 +3,84 37,50 n x Hct Δ%vs xog W-09 mat.2 32 336 368 168 24 72 264 112 180 560 904 7842 15,78 -5,40 17,57 +5,34 17,41 +4,38 14,39 -13,73 17,21 +3,18 16,28 -2,40 15,16 -9,12 14,78 -11,39 17,69 +6,06 17,42 +4,44 17,45 +4,62 16,68 n x Hct Δ%vs xog J-09 mat.1 32 336 368 168 24 72 264 112 180 560 904 7841 27,68 -2,30 30,07 +6,14 29,86 +5,40 24,69 -12,85 28,98 +2,29 28,15 -0,64 26,02 -8,15 25,09 -11,44 30,07 +6,14 29,66 +4,69 29,67 +4,73 28,33 n x Hct Δ%vs xog J-09 mat.2 -3,17 +5,17 +4,36 -12,63 +4,81 -0,315 -7,06 -10,88 +6,07 +3,81 +4,16 x 1,2314 1,4304 1,4997 1,1050 1,0942 1,5044 1,3788 3,2243 0,5674 0,7103 0,5269 s opracowanie zbioru 8 wyników Tabela VIII Sprawdziany hematologiczne 2008-2009 w 8 materiałach kontrolnych podano wartości hematokrytu ogółem oraz wyznaczone kilku modelami aparatów 3 producentów a poniżej różnicę procentową w stosunku do średnich ogólnych. W ostatniej kolumnie – wartości średnie. Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... A.M. Brzeziński i B. Przybył-Hac – MCHC, MCH i MCV. Sprawdzianami powinny być objęte wszystkie wykorzystywane przez uczestników programu analizatory/liczniki hematologiczne. Każdym aparatem należy wykonać po dwa niezależne oznaczenia w dwóch kolejnych dniach – średnia z czterech pomiarów jest podstawą oceny błędu systematycznego, natomiast różnica między równoległymi oznaczeniami jednego dnia może być miarą powtarzalności, a w dwu kolejnych dniach – odtwarzalności wyników. Sumarycznie wyniki uzyskane najczęściej wykorzystywanymi aparatami podano w tab.VII. W tabeli podano nr kodowy grupy aparatów wg aktualnego „Przewodnika ...”, hasłową nazwę omawianych aparatów, zmiany ich liczebności w ostatnich latach oraz średnią ocenianą liczbę wyników pojedynczego składnika. Ponieważ w tabeli zestawiono wyniki uzyskane w czterech różnych materiałach kontrolnych wykorzystanych w 2009 r., to jedyną możliwością zintegrowanej oceny było przedstawienie odsetka wyników uznanych za poprawne w stosunku do wartości średnich wyznaczonych danym aparatem (w tabeli kolumny a) bądź średnich ogólnych z wszystkich nadesłanych wyników (w tabeli kolumny b). Poniżej przedstawiono różnicę między tymi wartościami (wartość c). Na dole tabeli podsumowano wyniki uzyskane w r. 2009 w zestawieniu z wynikami w dwu ostatnich latach. Korzystne zmiany są bardzo nieznaczne, należy jednak uwzględnić, że dotyczą bardzo dużych liczebności – w sumie w ciągu roku ocenianych jest niemal 250 tys. wyników. Wartość przedstawionej tabeli podważa obawa o właściwą klasyfikację aparatów. Teoretycznie zróżnicowa- nie aparatów zgłaszanych przez uczestników sprawdzianów jest zaskakująco duże i uwzględnienie wszystkich modeli spowodowałoby stworzenie bardzo znacznej liczby grup, w dużej mierze zbyt mało licznych dla jakiejkolwiek oceny. Bardzo często różnice między poszczególnymi modelami wydają się pozorne, a ich rozdzielanie powoduje tylko szkodliwe mnożenie odrębnych grup o automatycznie zmniejszonej liczebności. Ten proces łączenia/dzielenia poszczególnych modeli jest bardzo trudny, czasem ograniczony jedynie do „5 diff” i „3 diff”. Organizatorzy sprawdzianów niestety nie dysponują wystarczającymi kompetencjami, a tym bardziej dobrą znajomością wszystkich eksploatowanych w Polsce analizatorów/liczników hematologicznych. Przedstawiciele producentów/importerów z różnych przyczyn nie kwapią się z pomocą mimo, że to im przede wszystkim powinno zależeć na korzystnej ocenie rozprowadzanego sprzętu. Skutki nie zróżnicowania aparatów Advia (mod. 60, 70 i 120) omówiono w sprawozdaniu za r.2006, a popełnione błędy zostały wówczas łatwo wychwycone. Nie zawsze sytuacja jest tak oczywista. Z przyczyn technicznych stosunkowo najczęściej występują różnice w wyznaczanych wartościach hematokrytu. Przedstawiono to w tabeli VIII dla 8 materiałów kontrolnych wykorzystanych w latach 2008/2009, zestawiając średnie wartości hematokrytu wyznaczone aparatami 3 firm oraz poszczególnymi modelami tych firm z wartościami hematokrytu z wszystkich nadesłanych wyników (dla każdego materiału 7,5-7,9 tys. wyników), przyjętymi za umownie należne. Jak wynika z tabeli, wyrażone w procentach różnice między tymi Tabela IX Sprawdziany hematologiczne 2008-2009r. Analiza wariancji średnich wartości Hct, Hgb, i RBC, wyznaczonych aparatami Orphee Mythic oraz Mythic 18 i Mythic 22. Test post hoc Tukey’a dla nierównych liczebności. Gwiazdkami zaznaczono istotne różnice w pojedynczym materiale. wartości średnie HCT HGB RBC W-08 J-08 W-09 J-09 mat. 1 mat. 2 mat. 1 mat. 2 mat. 1 mat. 2 mat. 1 mat. 2 {1} {2} {3} Orphee Mythic 39,60 38,77 50,90 18,16 27,68 39,55 17,36 29,73 Orphee Mythic {1} ** **** **** Mythic 18 39,87 39,07 51,29 18,33 27,84 39,75 17,51 29,93 Mythic 18 {2} ** Mythic 22 37,78 36,68 48,14 16,89 25,35 36,68 15,82 27,68 Mythic 22 {3} **** **** **** **** {1} {2} {3} *** *** **** **** **** **** Orphee Mythic 13,26 12,98 17,18 5,88 9,24 13,25 5,61 10,03 Orphee Mythic {1} Mythic 18 13,38 13,13 17,39 5,96 9,29 13,31 5,65 10,09 Mythic 18 {2} *** *** Mythic 22 12,45 11,95 15,75 5,36 8,54 12,30 5,15 9,44 Mythic 22 {3} **** **** **** **** {1} {2} **** **** {3} Orphee Mythic 4,465 4,439 5,938 2,044 3,091 4,492 2,083 3,505 Orphee Mythic {1} ** Mythic 18 4,459 4,437 5,933 2,049 3,095 4,494 2,088 3,509 Mythic 18 {2} ** Mythic 22 4,507 4,456 5,976 2,004 3,033 4,464 2,026 3,455 Mythic 22 {3} ** ** 27 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... wartościami (wiersze dolne każdego pola) są z zasady ukierunkowane, co podsumowano w kolumnie ostatniej (średnia ze zbioru 8 różnic oraz odchylenie standardowe). Różnice między różnymi modelami mogą być nieznacznie lub wysoce istotne, a ich wychwycenie i poprawna ocena zależy od liczebności odpowiednich grup. Zróżnicowanie aparatów Orphee Mythic na modele Mythic 18 i Mythic 22 wprowadzono dopiero w ubiegłym roku, zgodnie z sugestią importera (fma Cormay). Pewnym usprawiedliwieniem opóźnienia/przeoczenia może być bardzo duża różnica liczebności tych modeli – jesienią 2009r. wykorzystywano 84 szt. mod. Mythic 18 i zaledwie 8 szt. mod. Mythic 22. Automatycznie średnie ogólne dla aparatów Orphee Mythic są zależne od wartości wyznaczonych mod. Mythic 18, z wysoce korzystną ich oceną – i automatycznie ze znacznie gorszą oceną stosunkowo nielicznych wyników wyznaczonych ap. Mythic 22. W tabeli IX przedstawiono analizę wariancji wartości trzech składników (hematokrytu, hemoglobiny i RBC), wyznaczonych w 2008/2009r. w 8 materiałach kontrolnych aparatami Orphee Mythic oraz modelami Mythic 18 i Mythic 22. Różnice statystycznie istotne w poszczególnych materiałach zaznaczono gwiazdkami, a duże zróżnicowanie liczebności porównywanych grup (ogółem – ± 92 ap. = 368 wyników, w tym Mythic 18 – 85 aparatów, Mythic 22 – 7 aparatów) wymusiło wykorzystanie do wyznaczania kontrastów test Tukey`a (zamiast normalnie wykorzystywanego testu Scheffego). Jak wynika z tabeli, dla wartości hematokrytu i hemoglobiny istotne róż- nice między wartościami wyznaczonymi poszczególnymi modelami są regułą (8 razy w 8 materiałach), dodatkowo występują dość liczne różnice także dla wartości hemoglobiny wyznaczonych modelem 18, co wynika przede wszystkim z dużej liczebności a małego rozproszenia ocenianych wyników. Powyższy przykład przedstawiono, by zobrazować trudności racjonalnego wyodrębnienia grup homogennych. Pomoc wszystkich uczestników sprawdzianów, a tym bardziej pomoc zespołów serwisowych poszczególnych firm jest wysoce pożądana! Sprawdziany hematologiczne nie mają nawet najprostszej formy okresowej zintegrowanej oceny wyników uzyskiwanych przez poszczególnych uczestników. Wynika to ze zbyt małej liczby różnych materiałów kontrolnych ocenianych w ciągu roku (zaledwie 4), niepewności odnośnie właściwej klasyfikacji analizatorów/liczników hematologicznych oraz nie ustalonych granic dopuszczalnego błędu. W tabeli X zestawiono dla 8 materiałów wykorzystanych w latach 2007/2008 procent wyników uznanych za poprawne zależnie od przyjętych granic dopuszczalnego błędu – podano wartości przyjęte (kolumna zacieniona) oraz granice wyraźnie węższe i szersze. Automatycznie zmienia się ocena nadsyłanych wyników – np. zgodnie z przedstawionymi danymi oznaczania liczby krwinek białych, błędem ≤ 5% obarczonych jest 79% porównywanych wyników, błędem ≤ 10% - 95,3%, a błędem ≤ 15% - 98,1% ocenianych w 8 materiałach kontrolnych wy- Tabela X % wyników poprawnych zależnie od wielkości dopuszczalnego błędu. n = 8 – liczba ocenianych materiałów kontrolnych w latach 2007-2008, x - średni procent wartości poprawnych, s – odchylenie standardowe zbioru 8 wyników. błąd przyjęty! Dopuszczalny błąd ± 4,0% ± 6,0% ± 8,0% ± 10,0% ± 12,0% ± 15,0% Hematokryt ±popr.% n = 8 x s 79,15% 3,15 91,15% 1,91 96,08% 0,94 98,08% 0,50 98,85% 0,20 99,44% 0,14 MCV ±popr.% n = 8 x s 85,51% 1,83 94,44% 0,86 97,52% 0,53 98,70% 0,27 99,18% 0,15 99,60% 0,08 MCH ±popr.% n = 8 x s 85,25% 3,15 94,98% 1,52 98,02% 0,67 99,11% 0,29 99,46% 0,14 99,75% 0,08 x s 77,86% 3,81 90,34% 2,72 95,38% 1,45 97,58% 0,80 98,56% 0,40 99,31% 0,14 ± 3,0% ± 4,0% ± 5,0% ± 6,0% ± 8,0% ± 10,0% MCHC ±popr.% n=8 Dopuszczalny błąd Hemoglobina ±popr.% n = 8 x s 82,71% 3,20 90,01% 3,06 94,26% 2,05 96,56% 1,12 98,56% 0,70 99,26% 0,35 RBC x s 81,31% 3,10 90,34% 1,97 94,79% 1,01 97,29% 1,32 98,80% 0,39 99,41% 0,19 ± 5,0% ± 7,0% ± 8,0% ± 9,0% ± 10,0% ± 12,0% x s 78,96% 4,61 90,38% 2,30 93,46% 2,26 95,29% 1,36 96,70% 0,89 98,09% 0,58 ± 5,0% ± 7,0% ± 10,0% ± 12,0% ± 15,0% ± 18,0% x s 53,71% 8,80 67,52% 9,53 80,95% 8,80 86,61% 7,77 91,78% 6,13 94,86% 4,61 ±popr.% n = 8 Dopuszczalny błąd WBC ±popr.% n = 8 Dopuszczalny błąd PLT 28 ±popr.% n = 8 A.M. Brzeziński i B. Przybył-Hac Rycina 2 Sprawdziany hematologiczne 2006-2009r. (8 sprawdzianów – 16 materiałów). Wpływ stężeń oznaczanych składników na uznaną poprawność wyników. Współczynnik korelacji i linia trendu – aproksymacja funkcją kwadratową. ników. Jednocześnie uzyskiwana poprawność nadsyłanych wyników wydaje się zależeć nie tylko od przyjętych granic dopuszczalnego błędu, lecz także od wartości bezwzględnych ocenianych składników. Przedstawiono to graficznie na ryc. 2 dla trzech składników (Hct, Hgb, RBC) w 16 materiałach kontrolnych wykorzystanych w latach 2006-2009 w postaci linii trendu (aproksymacji funkcji kwadratowej) oraz współczynnika korelacji R – przy 16 ocenionych wartościach korelacja jest niewątpliwie wysoce istotna. Stężenie ocenianych składników jest więc dodatkowym elementem, utrudniającym poprawną ocenę nadsyłanych wyników. Nie ma to żadnego znaczenia dopóki program jest wyłącznie szkoleniowo-informacyjnym. Wymagania mogą być nawet wyraźnie zawyżane, mobilizując do wzmożonych starań. Jeżeli jednak program miałby charakter klasyfikacyjny, potencjalnie dyskwalifikując część wykonawców, wówczas zarówno przyjmowane wartości umownie należne, jak i dopuszczalne granice błędu powinny być dobrane znacznie staranniej i oparte o powszechnie akceptowane ustalenia. Sprawdziany koagulologiczne. W r. 2009 przeprowadzono dwa sprawdziany oznaczeń koagulologicznych (Wiosna-Jesień), każdorazowo wykorzystując dwa materiały kontrolne – z wartościami prawidłowymi i patologicznymi. Porównawczą oceną objęto oznaczenia czasu protrombinowego (PT wsk. i PT-INR), czasu częściowej tromboplastyny po aktywacji (APTT), czasu trombinowego (TT) oraz stężenia fibrynogenu, przyjmując jako wartości umownie należne średnie ogólne z wszystkich nadesłanych wyników oraz średnie aparaturowe – z wyników (n ≥ 6) uzyskanych tym samym modelem wg przyjętej klasyfikacji. Najpopularniejsze było oznaczenie PT (1270 koagulometrów) i APTT (1180 koagulometrów), natomiast oznaczenia TT wykonywane były wręcz sporadycznie na nielicznych tylko aparatach (ok. 75). Duże było zróżnicowanie wykorzystywanych koagulometrów – dla najczęściej oznaczanego czasu protrombinowego korzystano (wg przyjętej w aktualnym „Przewodniku ...” klasyfikacji) 29 modeli koagulometrów 12 producentów (z tego 7 modeli przy n < 6). Ponad 60% wyników wyznaczonych zostało na aparatach produkcji dwóch polskich firm – BioKsel i ELZA bis Kselmed. Jeszcze większe niż aparatów było zróżnicowanie wykorzystywanych odczynników – wiosną 2009 do oznaczania czasu protrombinowego posłużono się odczynnikami 34 producentów/dostawców, choć połowa z nich była deklarowana przez mniej niż 6 laboratoriów (granica oceny). Ponad 6% nadesłanych wyników czasu protrombinowego wyznaczono w pojedynczym układzie aparat/odczynnik, co z góry wykluczało wszelką ocenę. Wydaje się, że część z tych wartości była wynikiem pomyłek – mało prawdopodobne, by wśród 1277 wyników PT zaledwie po jednej wartości wyznaczono odczynnikami jakoby dostarczonymi przez f-mę Trident, MaxMat czy DPC. Najczęściej posługiwano się odczynnikami dostarczonymi przez f-mę BioKsel (395 wyników, 10 różnych modeli), Dade-Behring obecnie Siemens (166 wyników, 10 modeli), ELZA bis Kselmed (118 wyników, 5 modeli), Roche Diagnostics (107 wyników, 8 modeli). Oczywiście możliwości/poprawność oceny są wprost proporcjonalne do wielkości i jednorodności grupy odniesienia. Zestawienie ocen wyników PT-INR oraz APTT, wyznaczonych najczęściej wykorzystywanymi w 2009r. koagulometrami przedstawiono w tabeli XI. Nie jest chyba przypadkiem, że najkorzystniej oceniono wyniki PT-INR wyznaczone aparatami Roche STA, Siemens BCS czy Sysmex CA serii 5.. – zwłaszcza z dwoma pierwszymi 29 30 -26-04 -26-02 -26-01 -44-02 -19-04 -13-01 -19-01 -44-01 -41-02 -40-01 -27-01 Bio-Ksel -41-01 ACL Elite Pro IL ACL 8000-10000 IL ACL 100-7000 IL Start wszystkie Roche Fibrintimer II Dade Behring Option wszystkie bioMerieux BCS Dade Behring STA Compact Roche CC 3002 Bio-Ksel CA serii 5.. Sysmex K3002 wszystkie Eliza bis Kselmed Chrom 7, CC 3003 ogółem nazwa i model aparatu 07- kod aparatu 16 28 40 36 44 56 46 52 25 75 365 363 1270 W-09 24 24 29 38 42 45 49 50 69 87 311 348 1256 J-09 n aparatów n 40 52 69 71 86 101 95 102 94 162 676 711 2526 a/b 70,00% 70,00% 78,85% 78,85% 76,81% 71,01% 80,28% 78,87% 74,42% 73,26% 70,30% 72,28% 86,32% 69,47% 89,22% 87,25% 70,21% 73,40% 87,65% 87,04% 67,60% 67,46% 72,01% 72,01% 73,99% 72,64% mat. N n 40 52 69 71 86 101 95 102 94 162 675 713 2527 a/b 52,50% 7,50% 59,62% 11,54% 63,77% 34,78% 63,38% 30,98% 65,12% 66,28% 48,51% 45,54% 80,00% 72,63% 67,65% 28,43% 62,76% 58,51% 81,48% 77,16% 47,11% 40,89% 70,83% 70,41% 62,05% 53,46% mat. P PT-INR n 80 104 138 142 172 202 190 204 188 324 1351 1424 5083 a/b 61,25% 38,75% 69,23% 45,19% 70,29% 52,90% 71,83% 54,93% 69,77% 69,77% 59,40% 58,91% 83,16% 71,05% 78,43% 57,84% 66,49% 65,96% 84,57% 82,10% 57,36% 54,18% 71,42% 71,21% 67,62% 62,68% razem n 40 52 69 65 80 98 95 102 86 161 606 656 2347 a/b 87,50% 75,00% 82,69% 69,23% 72,46% 71,01% 64,62% 69,29% 60,00% 60,00% 50,00% 56,12% 72,63% 62,10% 80,39% 80,39% 61,63% 55,81% 75,40% 71,43% 55,78% 56,27% 68,44% 67,53% 65,79% 63,53% mat. N n 40 52 69 65 80 98 95 102 86 160 606 656 2346 a/b 32,50% 42,50% 65,38% 42,31% 52,17% 31,88% 43,08% 46,15% 40,00% 27,50% 40,82% 42,85% 67,37% 4,21% 57,84% 31,37% 45,35% 27,91% 52,50% 14,38% 33,83% 31,02% 48,02% 35,21% 45,82% 31,24% mat. P APTT n 80 104 138 130 160 196 190 204 172 321 1212 1312 4693 75,00% 58,75% 74,04% 55,77% 62,32% 51,45% 53,85% 57,69% 50,00% 43,75% 45,41% 49,49% 70,00% 33,16% 69,12% 55,88% 53,49% 41,86% 64,48% 42,99% 44,80% 43,65% 58,23% 51,37% 55,81% 47,39% razem Tabela XI Sprawdziany koagulologiczne 2009. Podano ogółem i dla wybranych aparatów (n > 20) liczbę ocenianych wyników i odsetek wyników uznanych za poprawne w stosunku do wartości średnich ogólnych (a-wiersz górny) a poniżej w stosunku do średnich aparaturowych (b-wiersz dolny) – z rozbiciem na mat. N, mat. P i razem – dla oznaczeń PT-INR oraz APTT. Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... A.M. Brzeziński i B. Przybył-Hac koagulometrami wykorzystywane są wyłącznie odczynniki firmowe (Roche – 100%, Siemens – 98% wyników). W materiałach prawidłowych średnie aparaturowe nie różniły się istotnie od średnich ogólnych, co powodowało zbliżony odsetek wyników uznanych za poprawne przy ocenie wobec tych dwu wartości umownie należnych (ogółem – 72,64% i 73,99%, Sysmex CA serii 5.. – 87,04% i 87,65%, Roche STA – 87,25% i 89,22%). Odmiennie zostały ocenione wyniki wyznaczone na koagulometrach Siemens BCS, którymi w materiale prawidłowym uzyskano wartości wyraźnie wyższe od średnich ogólnych, co zaowocowało stosunkowo niską poprawnością vs xog, przy wyraźnie dobrej ocenie vs xap (69,5% i 86,3% poprawnych, Δ = 16,8%). Zupełnie inna jest ocena wyników wyznaczonych w materiałach patologicznych. Tylko koagulometrami BCS uzyskano przy ocenie vs xog wyniki korzystniejsze niż w materiale prawidłowym, przy nieznacznie gorszej ocenie vs xap („zaledwie” 80% ocen poprawnych, najkorzystniejsze wyniki uzyskano ap. Sysmex CA 5.. – 81,5% poprawnych). Jednak wyniki BCS były wyjątkowe – z zasady wyniki wyznaczone w materiałach patologicznych były zdecydowanie gorsze niż w materiałach prawidłowych, przede wszystkim wobec średnich ogólnych (koagulometry STA – 28,4% poprawnych vs xog i 67,65% vs xap), częściowo tylko kompensowanych wyraźnie korzystniejszymi ocenami vs xap (w przedstawionym przykładzie koagulometrów STA – o niemal 40%!). Wydaje się, że bardzo pilnym zadaniem zarówno dla wykonawców oznaczeń jak i producentów/dystrybutorów wykorzystywanych koagulometrów jest dążenie do unifikacji odczynników, co niewątpliwie poprawi ocenę wyznaczanych wartości, zwłaszcza wobec średnich aparaturowych. Mało prawdopodobne, by zniwelowało to różnice między wartościami wyznaczanymi różnymi koagulometrami w materiałach patologicznych. Warto jednak podkreślić, że częścią nowoczesnych koagulometrów nawet w materiałach patologicznych ocena wyznaczonych wyników nie jest zła – być może należałoby przyjąć szersze granice dopuszczalnego błędu. Oznaczanie czasu trombinowego jest bardzo mało popularne – jesienią 2009 wykonane zostało w zaledwie 77 laboratoriach, w tym tylko dla 55 możliwa była ocena (n aparatów ≥ 6). Wśród ogółem nadesłanych w 2009 r. 300 wyników TT jako poprawne w stosunku do średnich ogólnych oceniono 56,0%, a wobec średnich aparaturowych – 61% wyników. Oznaczenia fibrynogenu wykonywało nieco ponad 700 laboratoriów – wśród ocenianych w 2009r. 2900 wyników za poprawne vs xog uznano 58,8%, a vs xap – 66,2% nadesłanych wyników. Dla oznaczeń fibrynogenu różnice oceny między materiałami N i P były nieznaczne (58,8% i 58,9% oraz 67,9% i 64,6% poprawnych). Należy podkreślić bardzo dobrą ocenę, wyraźnie wyższą od średniej, wyników wyznaczonych aparatami f-my BioKsel model Chrom 7 i CC 3003 – 66,8% poprawnych vs xog i 77,7% vs xap, co przypuszczalnie wynika z faktu, że ponad 93% nadesłanych wartości wyznaczono odczynnikami dostarczonymi przez BioKsel. Są to wyniki nawet korzystniejsze, niż wyznaczone ap. BCS f-my Siemens (70,9% poprawnych) czy STA f-my Roche (73,4% poprawnych vs xap). Wpływ zróżnicowania wykorzystywanych odczynników można zobrazować na przykładzie koagulometru K 3002 f-my ELZA bis Kselmed – 135 wartości wyznaczono korzystając z odczynników aż 15 firm (z tego zaledwie 6 przy n > 6 - 8, 10, 27, 18, 20, 31 = 114 wyników tj. 84,4% nadesłanych), co spowodowało odpowiednie zróżnicowanie wartości aparaturowo-odczynnikowych i zaledwie 47,6% poprawnych vs xap. Niewątpliwie gdyby podobnie jak z aparatami Chrom 7/CC 3003 także z koagulometrami K 3002 wykorzystywane były zunifikowane odczynniki, to wyniki byłyby zdecydowanie korzystniejsze. Wydaje się, że radą/pomocą laboratoriom powinni służyć dostawcy eksploatowanego sprzętu. Sprawdziany immunochemiczne. Zarówno potrzeby kliniczne, jak i szybko korzystnie zmieniające się możliwości techniczne laboratoriów warunkują rosnącą popularność oznaczeń wykonywanych technikami immunochemicznymi, przede wszystkim oznaczeń hormonów, markerów nowotworowych, specyficznych białek czy części leków. Oczywistym następstwem jest konieczność oceny jakości wyznaczanych wartości. Nie jest to łatwe, ponieważ oznaczenia immunochemiczne są z założenia bardzo wrażliwe na tzw. efekt podłoża, czego efektem są bardzo zróżnicowane wartości, wyznaczane w stabilizowanych materiałach kontrolnych różnymi systemami analitycznymi (aparat-odczynnik-kalibratory). Stosunkowo dawno Centralny Ośrodek wykorzystał możliwość oceny pewnych składników oznaczanych metodami immunochemicznymi w „normalnych” materiałach kontrolnych używanych w sprawdzianach chemicznych. Zwykle możliwe są oznaczenia hormonów tarczycy (TSH, FT3, FT4), niektórych innych hormonów (estradiolu, progesteronu, prolaktyny, FSH i LH, a nawet testosteronu i kortyzolu), a także podstawowych markerów nowotworowych (całk. PSA, AFP, CEA) czy ferrytyny. Zaletą tego rozwiązania jest brak dodatkowych kosztów (zrezygnowanie z zasady kosztownych, specjalnych materiałów kontrolnych) oraz ogólna dostępność – każdy uczestnik powszechnego programu chemicznego może dodatkowo poddać ocenie określone oznaczenia immunochemiczne adekwatnie do własnych potrzeb i możliwości. Wady są też bardzo istotne – często spotykane zbyt niskie stężenia oznaczanych składników, utrudniające/uniemożliwiające prawidłową ocenę, ograniczony wachlarz możliwych do oznaczania składników, ścisłe powiązanie wyznaczonych wartości z wykorzystywanym systemem analitycznym (aktualne dla wszystkich sprawdzianów immunochemicznych), co wyklucza ocenę wyników uzyskanych techniką manualną lub bardzo mało popularnymi analizatorami oraz brak informacji o systemowych wartościach należnych, wyznaczonych przez producenta wykorzystywanych materiałów. W sumie jednak zalety przeważają nad wadami i co roku przy okazji sprawdzianów chemicznych przeprowadzane są dwa takie sprawdziany immunochemiczne – w r. 2009 wiosną i jesie31 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... nią, obejmując oceną 18 składników. Najczęściej laboratoria poddawały ocenie oznaczenia TSH (ok. 800 lab.), FT4 (ok. 730 lab.), FT3 (ok. 630 lab.) czy całkowitego PSA (ok. 520 lab.), najrzadziej – oznaczenia TT3, TT4 oraz digoksyny – po ok. 60 lab. W sumie w 2 sprawdzianach w 4 materiałach kontrolnych wyznaczono dla 18 składników ponad 25 tys. wartości. Dobra zgodność oceny poprawności wg średnich ogólnych i systemowych może świadczyć o małych różnicach w wartościach wyznaczanych poszczególnymi systemami – dla TSH z ponad 3100 ocenionych w ciągu roku wyników jako poprawne w stosunku do średnich ogólnych uznano 86,1%, a w stosunku do średnich systemowych – 89,7% (Δ = 3,6%). Na drugim biegunie można umieścić oznaczenia, dla których wartości są bardzo zróżnicowane zależnie od wykorzystywanego systemu analitycznego – np. FT4 (zaledwie 33,8% z 2870 wyników oceniono jako poprawne vs średnie ogólne, a aż 86,5% - vs średnie systemowe, Δ = 52,7%!) czy progesteronu (odpowiednio z 1370 wyników 48,2% poprawnych vs średnie ogólne i 90,8% vs średnie systemowe, Δ = 42,6%!). W sumie wśród ponad 25 tys. ocenianych wyników 18 składników jako poprawne vs xog uznano 55,7%, a vs xsyst – 82,4%. Oczywiście miarodajna jest ocena w stosunku Tabela XII Wyniki sprawdzianu immunochemii poszerzonej w r.2009 - 2 sprawdziany, 6 materiałów kontrolnych. Zestawiono ocenę wszystkich nadesłanych w obydwu sprawdzianach wyników (A) oraz wyników sklasyfikowanych (B). a - liczba ocenianych wyników, b - % wyników ocenionych jako poprawne. oceniany składnik n wykorzystanych A B wszystkie wyniki ocena wyników sklasyfikowanych ocena vs xog vs xog vs xsyst syst. apar. a b a b a b a b estradiol 10 356 2131 66,02% 2062 66,58% 2062 86,87% 1546 84,02% FSH 10 354 2120 80,38% 2039 81,31% 2039 93,28% 1610 90,74% TSH 11 481 2862 71,00% 2770 71,34% 2770 92,67% 2122 87,79% FT3 11 455 2696 66,32% 2621 67,11% 2621 92,71% 2071 89,14% TT3 5 59 344 58,72% 246 58,54% 246 80,08% 192 77,08% FT4 11 476 2839 57,77% 2749 58,20% 2749 92,54% 2165 88,73% vs nom. TT4 5 55 322 71,12% 208 73,08% 208 84,13% 160 76,25% LH 10 310 1851 75,96% 1776 76,69% 1776 94,76% 1393 93,75% GH 2 27 152 71,05% 111 84,68% 111 91,89% 111 85,58% HCG 10 332 1975 61,16% 1921 62,05% 1921 94,06% 1496 91,31% kortyzol 8 138 799 72,84% 727 74,28% 727 86,80% 508 80,90% progesteron 10 311 1867 76,43% 1789 77,08% 1789 90,22% 1396 87,96% prolaktyna 10 394 2334 73,18% 2253 73,72% 2253 87,62% 1663 86,95% testosteron 10 305 1777 68,26% 1699 68,69% 1699 86,76% 1321 80,77% AFP 9 204 1222 89,77% 1138 90,33% 1138 91,92% 844 89,10% CEA 10 333 1960 81,99% 1906 82,84% 1906 97,53% 1457 95,74% CA-125 10 344 2021 86,34% 1970 87,56% 1970 96,85% 1499 95,40% CA15.3 9 160 934 69,38% 879 71,33% 879 95,22% 643 87,25% CA19.9 9 210 1225 58,78% 1171 60,55% 1171 95,73% 897 83,95% t PSA 10 456 2710 58,01% 2626 58,2% 2626 93,03% 2070 95,99% f PSA 8 123 721 67,13% 688 70,06% 688 90,12% 404 87,62% digoksyna 4 65 387 58,40% 237 60,76% 237 82,28% 177 80,22% 9 54 88,89% - - - - - - fenytoina karbama-zepina 3 49 285 81,05% 189 85,18% 189 96,30% 178 89,89% Kwas foliowy 5 74 432 47,68% 358 52,23% 358 77,65% 281 53,74% Kwas walproinowy 4 54 320 84,69% 213 91,08% 213 92,02% 183 92,90% Wit.B12 7 155 905 73,59% 852 74,18% 852 81,92% 651 77,26% ferrytyna 11 215 1261 56,86% 1192 56,88% 1192 64,76% 845 57,75% IgE 9 256 1507 83,88% 1381 86,60% 1381 89,50% 1051 86,96% 23 125 54,40% 21 80,95% 21 95,24% 21 95,24% Zima 09 19830 68,54% 18663 69,31% 18663 90,75% 14604 86,65% Lato 09 20308 72,06% 19129 73,16% 19129 90,80% 14362 87,02% razem 09 40138 70,32% 37792 71,26% 37792 90,78% 28966 86,83% razem 08 39147 68,08% 36484 68,86% 36484 89,44% 31357 86,65% β-2-micro-lobulina 32 A.M. Brzeziński i B. Przybył-Hac do średnich systemowych, ocena w stosunku do średnich ogólnych jest informacją pomocniczą – miarą zróżnicowania wartości wyznaczanych różnymi systemami. Konieczność prawidłowej oceny oznaczeń immunochemicznych związana z ich rosnącym znaczeniem diagnostycznym spowodowała wprowadzenie „dodatkowego” specjalnego programu oceny tych oznaczeń. Program obejmuje dwa sprawdziany w roku, każdorazowo z wykorzystaniem trzech różnych materiałów kontrolnych umożliwiających ocenę co najmniej 30 różnych składników oznaczanych metodami immunochemicznymi. Dodatkowo wykorzystywane materiały w większości mają wyznaczone przez producenta wartości należne do uzyskania najczęściej wykorzystywanymi systemami. Ponieważ nie we wszystkich 3 wykorzystywanych materiałach kontrolnych oraz nie zawsze dla wszystkich popularnych w Polsce systemów producent wyznaczył takie wartości, to w sumie wobec systemowych wartości należnych mogło zostać ocenionych tylko 76,6% nadesłanych przez uczestników programu wyników, najmniej dla wartości fPSA – zaledwie 404 z nadesłanych 721 wartości, tj. 56%. Zestawienie wyników programu immunochemii poszerzonej w r.2009 z rozbiciem na oznaczane składniki zawarto w tab. XII. Podano liczbę systemów wykorzystanych do oznaczania poszczególnych składników oraz liczbę aparatów, całkowitą liczbę nadesłanych wyników oraz ich ocenę vs średnie ogólne, a następnie tylko dla wyników sklasyfikowanych wg określonych systemów analitycznych – odsetek wyników uznanych za poprawne w stosunku do średnich ogólnych, średnich systemowych oraz systemowych wartości należnych wyznaczonych przez producenta wykorzystanych materiałów. Ze względu na koszty liczbę uczestników tego programu ograniczono do 500 laboratoriów, które oznaczały przynajmniej 5 różnych składników. Zwraca uwagę duża zbieżność wyników uzyskanych w dwóch niezależnych sprawdzianach – przy ocenie vs średnie systemowe jako poprawne uznano Zimą 09 – 90,75% wyników, a Jesienią Rycina 3 Zobrazowanie danych z tabeli XII. 33 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... 09 – 90,80% (Δ = 0,05%!), a przy ocenie vs wyznaczone przez producenta systemowe wartości należne – odpowiednio 86,65% i 87,02% ocenianych wartości. Należy ponownie podkreślić, że liczba wyników ocenianych względem podanych w metryczkach systemowych wartości należnych jest wyraźnie mniejsza od ocenianych względem średnich systemowych wg uczestników programu. Jako bardzo korzystną należy ocenić dobrą z zasady korelację oceny vs średnie systemowe i systemowe wartości należne (dwie ostatnie kolumny w tab. XII oraz dodatkowo ryc. 3). Współczynnik korelacji 0,892 przy 29 ocenianych parach wyników jest zdecydowanie istotny (dla α = 0,05 przy n = 30, r krytyczne = 0,3494). Po dodatkowym odrzuceniu wyników trzech oznaczeń, dla których różnica w ocenie wobec średnich systemowych i systemowych wartości należnych jest szczególnie duża (CA 19.9 – 95,73% i 83,95%, Δ = 11,78%; CA 15.3 – 95,22% i 87,25%, Δ = 7,95% oraz kwas foliowy – 77,65% i 53,74%, Δ = 23,9%), wartość współczynnika korelacji wzrasta do 0,963. Trudno dyskutować, dlaczego dla wymienionych trzech składników występują tak nietypowo duże różnice przy ocenie w stosunku do tych dwóch przyjmowanych układów wartości należnych. Oczywiście podane różnice są wartościami średnimi z wyznaczonych w 6 wykorzystanych materiałach kontrolnych. Nie można zakładać błędów producenta, choć wzbudza poważne wątpliwości, jeśli z wyliczonych 6 średnich 4 lub 5 jest wysoce zgodnych z systemowymi wartościami metrykalnymi, natomiast 1 lub 2 – wyraźnie odmienne. Błędne wyniki uczestników programu też muszą być rozważone, choć trudno wytłumaczyć, dlaczego np. zła kalibracja miałaby dotyczyć tych trzech składników – i to w różnych systemach, przy użyciu różnych kalibratorów. Oczywiście wyniki uległyby wyraźnej poprawie przy przyjęciu szerszych granic dopuszczalnego błędu – obecny szkoleniowo-informacyjny charakter programu umożliwia przyjęcie bardziej restrykcyjnych kryteriów oceny. W tab. XIII zestawiono wyniki uzyskane najbardziej w Pol- sce rozpowszechnionymi systemami immunochemicznymi. Podano nazwę systemu, liczbę składników oznaczanych danym systemem, liczbę ocenianych wyników oraz ich ocenę w stosunku do średnich ogólnych (tylko jako informacja dodatkowa) i średnich systemowych, a następnie liczbę wyników, które mogły być ocenione w stosunku do wyznaczonych przez producenta wartości należnych oraz liczbę i odsetek wyników uznanych za poprawne. Zbiorczo podane wyniki są oczywiście zgodne z wynikami zebranymi dla poszczególnych składników w poprzedniej tabeli, jednak zaznaczają się różnice między systemami, zarówno w odsetku wyników możliwych do oceny vs systemowe wartości należne (100% wyników wyznaczonych aparatami Modular E170 czy Immulite 2000 do zaledwie 93,2% wyników wyznaczonych aparatem Access), jak i oceny poprawności – od 83,6% aż do 94,3% poprawnych z 1148 wyników wyznaczonych systemem Modular. Należy żałować, że producent wykorzystywanych materiałów kontrolnych nie podaje wartości należnych dla nadspodziewanie obecnie popularnych w Polsce analizatorów Cobas 6000/Cobas e601. Jednak wg otrzymanej ostatnio z firmy Roche Diagnostics informacji, ze względu na te same odczynniki i kalibratory uzyskiwane wartości powinny być analogiczne do wyznaczonych aparatem Modular – i w „Przewodniku ...” na r. 2010 obie te grupy analizatorów połączono, co niewątpliwie ułatwi ocenę. Markery kardiologiczne W 2008r. rozpoczęto nowy program sprawdzianów, obejmujący oznaczenia akt. CK całk., akt. CK-MB, CK-MBmass., troponiny I, troponiny T, mioglobiny, homocysteiny, peptydu natriuretycznego typu B oraz jego NT-końcowego fragmentu ProBNP, a więc oznaczenia wykorzystywane w diagnostyce martwicy mięśnia sercowego oraz niewydolności krążenia. Powszechność i skutki chorób układu krążenia decydują o wadze tego programu, do udziału w którym zaproszono tych uczestników programu powszechnego, którzy wy- Tabela XIII Ocena wyników uzyskanych poszczególnymi systemami analitycznymi w sprawdzianach immunochemii poszerzonej w r. 2009. Podano liczbę składników oznaczanych poszczególnymi systemami, liczbę wykorzystanych aparatów w sprawdzianach Zima 09 i Lato 09 oraz liczby ocenianych wyników i procent wyników uznanych za poprawne w różnych układach odniesienia. system analityczny n n apar. n wyników i % poprawnych n wyn. vs xog vs xsyst n wyn. nom. n wyn. i %popr. skł. Z09 L09 Abbott-AxSym 27 51 50 4173 2543- 60,9% 3639- 87,2% 4079 3424- 83,9% Abbott-Architect 23 24 29 2259 1395- 61,8% 2068- 91,5% 2175 1910- 87,8% Bayer-Advia Centaur 22 24 28 2185 1470- 67,3% 1900- 87,0% 2164 1817- 84,0% Beckman-Access 21 20 23 1716 1112- 64,8% 1560- 90,9% 1600 1338- 83,6% bioMerieux-Vidas 22 71 78 5680 3928- 69,2% 5038- 88,7% 5434 4770- 87,8% Roche-Elecsys 25 96 88 7020 5598- 79,7% 6389- 91,0% 6988 6196- 88,7% Roche-Modular E170 20 13 13 1148 947- 82,5% 1091- 95,0% 1148 1082- 94,3% Roche-Cobas 6000 25 87 106 7978 6617- 82,9% 7512- 94,2% DPC-Immulite 1000 18 31 30 1808 1034- 57,2% 1602- 88,6% 1786 1502- 84,1% DPC-Immulite 2000 23 razem r. 2009 34 vs nom. 34 33 3031 1704- 56,2% 2770- 91,4% 3031 2567- 84,7% 451 478 36998 26348- 71,2% 33569- 90,7% 28405 24606- 86,6% A.M. Brzeziński i B. Przybył-Hac konywali oznaczanie którejś z troponin – I lub T, w sumie 450 laboratoriów. Niestety okazało się, że zakres badań wykonywanych przez te laboratoria był bardzo ograniczony. Oczywiście wszyscy oznaczali troponinę I (70%) lub T (30%), ale już tylko 85% - akt. całk. CK, 65% - akt. CK-MB, a 25% - stęż. CK-MBmass. Pozostałe badania wykonywane były przez bez mała pojedyncze placówki – mioglobina – 26 lab., homocysteina – 24 lab., BNP – 23 lab., ProBNP – 31 laboratoriów. To ostatnie badanie wykazuje zresztą bardzo znaczną dynamikę wzrostu – Zimą 08 - 31 lab., Zimą 09 - 60 lab., Zimą 10 - 82 lab. W roku 2009 ze względu na zmniejszenie przez Ministerstwo Zdrowia budżetu Centralnego Ośrodka przeprowadzono tylko 1 sprawdzian kardiologiczny zamiast planowanych 2, oceniając w sumie 2469 wyników, z których 57,6% oceniono jako poprawne względem mało miarodajnych średnich ogólnych. Zasadniczą wadą przeprowadzanych sprawdzianów jest ogromne zróżnicowanie wykorzystywanej do oznaczeń aparatury. Nawet dla formalnie bardzo podstawowego oznaczania aktywności całkowitej kinazy kreatynowej 345 laboratoriów zgłosiło wykorzystywanie aż 22 modeli analizatorów i 8 modeli spektrofotometrów, z czego tylko 13 modeli analizatorów i 1 spektrofotometr reprezentowane były przez co najmniej 6 egzemplarzy (w sumie 310 szt. tj. 90% oznaczających) – najczęściej analizatory Cobas Integra (89 szt.). Konelab (51 szt.), Olympus (43 szt.), Vitros (20 szt.) i Pentra (19 szt.). Dodatkowo poza analizatorami Cobas Integra, Dimension i Vitros z pozostałymi analizatorami wykorzystywano różne odczynniki – czasem zróżnicowanie było symboliczne (Olympus – 42 x Olympus, 1 x bioMerieux), ale czasem istotne (Konelab – 30 x bioMerieux, 3 x BioSystems, 1 x α-Diagnostics, 17 x Thermo/ Kone). W sumie w homogennych zbiorach aparaturowo-odczynnikowych o n ≥ 6 można było ocenić 79% nadesłanych wyników całk. CK. Jeszcze trudniejsza była ocena oznaczeń mniej popularnych – w sprawdzianie Zima 09 akt. CK-MB oznaczało 247 laboratoriów, wykorzystując tak jak dla akt. CK te same 22 modele analizatorów i 10 modeli spektrofotometrów. W liczbie co najmniej 6 egzemplarzy występowało 7 analizatorów i 1 spektrofotometr (Epoll – 10 szt.), razem 190 aparatów (77% wykorzystywanych), natomiast w homogenne grupy aparaturowo-odczynnikowe o n ≥ 6 można było zestawić tylko 65% nadesłanych wyników. Oczywiście ujemnym skutkiem tak znacznego zróżnicowania aparaturowego jest znaczne zróżnicowanie systemowych wartości średnich, wyznaczanych w wykorzystywanych stabilizowanych materiałach kontrolnych. Zestawiono to na ryc. 4 dla trzech oznaczanych składników w dwóch materiałach kontrolnych – tj. oznaczeń troponiny I, troponiny T i ProBNP. Dla troponiny I, oznaczanej różnymi systemami, uzyskano w jednym materiale wartości średnie od 0,09 μg/l 21 analizatorami Architect do 0,60 μg/l 20 aparatami Immulite 1000 (i odpowiednio 0,41 μg/l i 2,09 μg/l w drugim materiale). Przeprowadzona analiza wariancji wykazała bardzo liczne istotne różnice występujące między systemami. Troponina T oznaczana jest wyłącznie analizatorami f-my Roche i mimo ew. różnic między poszczególnymi systemami (Elecsys, Modular E170 czy Cobas 6000/e601) zwykle nie są to różnice istotne. W związku z rosnącym rozpowszechnieniem wyposażenia f-my Roche liczba oznaczeń troponiny I nieznacznie spada (Zimą 08 – 270, Zimą 09 – 259 lab.), a troponiny T rośnie (Zimą 08 – 122, Zimą 09 – 140 lab.). Na tej samej rycinie 4 zestawiono wartości uzyskiwane dla oznaczenia bardzo istotnego dla oceny stopnia niewydolności krążenia, tj. NT fragmentu propeptydu natriuretycznego typu B (ProBNP). Należy zwrócić uwagę, że to cenne badanie bardzo zyskuje na popularności – Zimą 08 wykonywało je 31 laboratoriów, Zimą 09 – 60 laboratoriów, a wg zdobytych informacji Zimą 10 – już 82 laboratoria, a więc w ciągu 2 lat wzrost ponad 2,5-krotny. Rośnie także, choć mniej wyraźnie, popularność oznaczania samego peptydu natriuretycznego typu B – Zimą 08 – 23 lab., Zimą 09 – 32 lab. Niestety również występuje duże zróżnicowanie między wartościami wyznaczonymi różnymi systemami. Zimą 2009 dla wartości BNP uzyskano (podano system, n egzemplarzy oraz średnie i odchylenia standardowe uzyskane w materiale 1 i 2) – AxSym, n = 16, x1 = 40,17 ng/l, s1 = 14,13 i x2 = 207,6 ng/l, s2 = 61,61; Architect, n = 8, x1 = 15,85 ng/l, s1 = 6,61 i x2 = 116,7 ng/l, s2 = 16,26 oraz Immulite 1000, n = 5, x1 = 128,6 ng/l, s1 = 46,29 i x2 = 318,0 ng/l, s2 = 62,76. Jak widać, różnice między systemami są bardzo znaczne, a wysokie wartości odchyleń standardowych informują o znacznym zróżnicowaniu wartości składających się na poszczególne średnie, co warunkuje niską poprawność ocen nawet względem średnich systemowych (średnio zaledwie ok. 25% poprawnych). Byłoby bardzo interesujące móc ocenić, czy i jakie różnice wyznaczonych wartości występują między wykorzystywanymi systemami przy oznaczeniach przeprowadzonych w rutynowo oznaczanym świeżym materiale biologicznym, pozbawionym efektu podłoża. Niestety wymagałoby to znalezienia odpowiednich pacjentów (łatwiejsze) i uzyskanie zgody Komisji Etyki na pobranie wystarczającej próbki krwi (znacznie trudniejsze!). W sumie dla 9 ocenianych składników w sprawdzianie Zima 09 wyznaczono 2469 wartości, z których 57,5% oceniono jako poprawne względem średnich ogólnych (mało miarodajne!). Wobec średnich systemowych można było ocenić tylko 2128 wartości (tj. 86%), z których jako poprawne uznano zaledwie 1728 tj. 81,2%, najwięcej dla oznaczeń akt. całk. CK (88,0%), a najmniej dla omawianego oznaczenia BNP. Oznaczana przez 24 laboratoria mioglobina żadnym analizatorem nie była oznaczana w co najmniej 6 laboratoriach, a więc nie mogła zostać oceniona w stosunku do średnich systemowych – poprawność oceniana względem średnich ogólnych wynosiła 72,9% (w sprawdzianie Lato 2008 – 72,7%). Sprawdziany kardiologiczne są merytorycznie bardzo istotne, choć chwilowo ich użyteczność jest ograniczona małą liczbą uczestników. Wydaje się jednak, że popularność najważniejszych oznaczeń będzie rosła (CK-MBmass, BNP, ProBNP, chyba także troponiny), co automatycznie będzie zwiększało możliwości oceny wyznaczanych wartości. 35 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... Rycina 4 Sprawdzian markerów kardiologicznych Zima 2009 – Różnice wyznaczanych wartości zależnie od systemu analitycznego – przedstawione graficznie oraz w analizie wariancji (post hoc Scheffe’go * - różnica istotna). Sprawdziany oznaczeń równowagi kwasowo-zasadowej. Sprawdziany oznaczeń parametrów równowagi kwasowo-zasadowej prowadzone są w Polsce od ponad 30 lat. Centralny Ośrodek obecnie realizuje te sprawdziany 2 x w ciągu roku przy użycie 3 sztucznych materiałów kontrolnych – normal, acidosis i alkalosis. Oceną powinny być objęte nie laboratoria, a wszystkie wykorzystywane przez uczestników programu analizatory rkz – Latem 2009 było to 661 aparatów. Poza oznaczeniami typowych parametrów rkz (pH, PCO2, PO2) uczestnicy proszeni są o jednoczesne oznaczenia elektrolitów met. ISE, jeżeli użytkowany analizator rkz oferuje takie możliwości, a laboratoria je wykorzystują. 36 Oczywiście oznaczenia te nie zastępują oceny oznaczeń elektrolitów (sodu, potasu, wapnia, chlorków) w surowicach kontrolnych oznaczanych w powszechnych sprawdzianach chemicznych. Zbiorcze wyniki wszystkich oznaczanych składników w trzech materiałach kontrolnych zestawiono w górnej części tabeli XIV. W części dolnej tej samej tabeli zestawiono wyniki (tylko parametrów rkz) uzyskane najczęściej wykorzystywanymi analizatorami, dwóch przede wszystkim firm – Siemens/Bayer – 237 egz. (36%) i Roche/AVL – 274 egz. (41%). Jak zawsze należy przypomnieć, że podane dane nie są podstawą do formalnego rankingu aparatów – wyniki uzyskiwano w różnych laboratoriach, w nieporównywalnych warunkach. Tym niemniej wyraźnie wyróżniają się 1318 1319 1029 1035 429 71 60,0 170,0 120,0 6,70 85,0 2,00 1,90 PO2 Na + + Cl – Ca ++ + n * bardzo znaczne różnice między dwoma materiałami ** tylko jeden materiał 21 03-42-04 Radiometer ABL serii 500 22 21 03-42-07 Radiometer ABL serii 800 27 57 03-44-03 AVL serii Omni 19 87 03-08-02 Rapidlab 348 03-26-02 Gem Premier 3000 29 90 03-42-06 Radiometer ABL serii 700 137 106 03-44-04 Cobas b 121,b 221 03-44-01 AVL Compact 1,2,3 20 22 54 87 83 661 150 642 154 71 431 462 1039 1033 1327 1327 1333 n apar. 1,10 1,20 98,0 4,60 135,0 110,0 40,0 7,40 c ogółem 49,3 80,6 85,1 91,8 85,3 92,9 92,6 88,9 C 03-08-01 Rapidlab 238,248,278,280,288 56,5 85,4 78,3 93,5 88,9 94,5 96,1 95,1 B L-09 40,8 82,5 59,8 90,6 83,3 92,6 93,5 89,7 A acidosis Z-09 tylko parametry rkz II Li 458 1324 7,10 pH PCO2 K n c składnik I 123 123 147 150 327 519 518 727 907 3892 n 62,0 88,6 73,4 94,2 87,2 66,6 96,5 91,7 A normal 96,8 100,0 94,6 95,3 99,1 94,6 88,6 97,0 88,3 93,4 B pH 63,8 91,3 86,2 95,2 94,0 87,5 97,0 94,4 B 94,3 100,0 96,6 98,2** 97,6 52,2* 74,7 95,4 77,8 82,2 C 56,5 71,3 82,4 94,8 91,2 75,6 89,4 85,4 C 123 123 147 150 327 519 518 727 907 3883 n 0,70 0,50 115,0 2,70 160,0 80,0 15,0 7,70 c 95,1 99,2 96,6 96,7 97,2 96,7 88,4 97,8 93,5 94,8 B PCO2 71 425 460 1036 1030 1319 1319 1325 n 93,5 99,2 98,0 98,8** 96,3 57,2* 86,7 97,9 92,5 88,6 C 42,2 51,1 66,5 79,1 86,7 59,6 89,1 73,8 A alkalosis 123 123 147 150 327 519 519 727 907 3884 n 50,7 59,6 83,0 80,6 90,3 82,4 91,2 90,7 B 88,6 97,6 95,2 91,3 83,5 91,9 89,6 82,7 88,4 88,2 B PO2 47,8 50,1 80,9 78,8 88,8 74,8 83,7 72,2 C 87,0 96,8 95,2 89,7 80,8 59,5* 87,5 79,5 84,7 80,9 C 213 1285 1380 3110 3092 3965 3964 3982 n 369 369 441 450 982 1557 1555 2181 2721 11659 n 46,4 74,2 66,6 88,0 85,7 86,2 93,0 B 93,5 98,9 95,5 94,4 93,3 94,4 88,9 92,5 90,1 92,1 B razem 57,0 78,8 82,5 88,8 91,2 88,2 94,8 93,4 razem 85,1 A 91,6 98,6 96,6 95,8** 91,6 56,3 83,0 91,0 95,0 83,9 C 51,2 67,4 73,8 88,5 88,4 80,9 88,6 82,2 C Tabela XIV Sprawdziany parametrów równowagi kwasowo-zasadowej w r.2009. I – zestawienie oznaczanych składników: c- orientacyjne stężenie; n- liczba ocenianych wyników, a następnie podano odsetek wyników poprawnych względem średnich ogólnych (A), średnich aparaturowych (B) i nominału wg producenta (C); II – ocena tylko parametrów rkz wybranymi aparatami – n, B, C jak w części I. A.M. Brzeziński i B. Przybył-Hac 37 Programy sprawdzianów międzylaboratoryjnych realizowane przez Centralny Ośrodek Badań Jakości w Diagnostyce ... wyniki uzyskane niezbyt licznymi analizatorami ABL serii 700 f-my Radiometer – z 369 wyników pH, PCO2 i PO2 aż 98,9% oceniono jako poprawne wobec średnich aparaturowych, a 98,6% - wobec wyznaczonych przez producenta (f-ma Medriv) aparaturowych wartości należnych. Zaskakuje niska poprawność wobec wartości należnych wg producenta wyników uzyskanych analizatorami Rapidlab 348. Wynikała ona z dużej niezgodności ocen w dwóch przeprowadzonych w ciągu roku sprawdzianach – w jednym ocena była porównywalna z innymi analizatorami, natomiast w drugim – bardzo niska, co może sugerować błąd/pomyłkę metrykacji. Teoretycznie ocena zbiorcza wyników r.2009 wydaje się w miarę korzystna – ponad 92% wyników ocenionych jako poprawne wobec średnich aparaturowych. Jeżeli jednak uwzględnić, że oznaczenia dotyczą tzw. parametrów krytycznych, o podstawowym znaczeniu przy prowadzeniu ciężko chorych pacjentów, to ocena nie jest tak pozytywna. Wydaje się, że celowe byłoby zwiększenie liczby sprawdzianów do przynajmniej 4 w ciągu roku, z wprowadzeniem wyraźnej klasyfikacji wyników. Przeszkodą jest wykorzystywany materiał kontrolny, tak zdecydowanie odmienny od rutynowo oznaczanego materiału biologicznego. Uwagi końcowe Szczegółowe omówienie wszystkich uzyskanych w ciągu roku wyników oznaczeń kontrolnych nie jest możliwe. Należy pamiętać, że każdy z 750 tys. wyników kontrolnych nadesłanych w 2009r. skojarzony jest z kilku istotnymi informacjami pomocniczymi – kto, co, jaką metodą, z wykorzystaniem jakiego analizatora, odczynników, kalibratorów czy w jakich seriach. Każdego roku tworzy to ogromną bazę kilku milionów informacji. Merytoryczne, a nie wyłącznie formalne opanowanie tej bazy danych, możliwość/umiejętność kompleksowej wielokierunkowej oceny, a tym bardziej wyciągnięcie odpowiednich wniosków i adekwatnych do nich propozycji staje się niemal niemożliwe. Naturalnym prostym rozwiązaniem jest przygotowanie zindywidualizowanych szczegółowych ocen dla poszczególnych uczestników programów na tle wyników pozostałych laboratoriów, uwzględniając wysoce zróżnicowane warunki wyznaczania wartości oznaczeń kontrolnych. Poważnym ograniczeniem wartości tych ocen indywidualnych są liczne niestety informacje błędne, przekazywane przez wykonawców, a dotyczące zarówno warunków prowadzenia oznaczenia jak i wyznaczanych wartości (jednostki, przecinek, znaczne błędy przypadkowe). Te informacje błędne czasami są oczywiste (wykorzystanie do oznaczeń glukozy analizatora rkz czy oznaczanie analizatorem Vitros z odczynnikami Roche itp.), czasami przez swoją unikalność są wysoce prawdopodobne (tylko 1 z 1700 laboratoriów oznacza glukozę odczynnikami danej firmy), a często są w ogóle nie do uchwycenia, co nie znaczy, że nie wpływają negatywnie na ocenę wyników. Dodatkowo samo wychwycenie błędów/pomyłek nie wystarcza, w każdym wypadku należałoby przeprowadzić szybkie i efektywne postępowanie wyjaśniająco-kory38 gujące. Niestety przyjęcie takiego rozwiązania przekracza – czasowo i finansowo – możliwości techniczne Centralnego Ośrodka i najczęściej nie jest prowadzone, z oczywistymi negatywnymi skutkami. Podobnie tylko sporadycznie wyjaśniane są wartości znacznie odbiegające od pozostałych, w rzeczywistości nie należące do ocenianego zbioru. Jednocześnie takie wartości błędne wpływają negatywnie nie tylko na ocenę wyników autora (co nie budzi sprzeciwu), ale także na ocenę pozostałych uczestników sprawdzianu czy na opinię o określonym sprzęcie. W sprawdzianie markerów kardiologicznych Zima 2009 troponinę T w mat. 1 wyznaczono 92 analizatorami Elecsys, przy czym wynik przedostatni od góry wynosił 0,056 μg/l, a ostatni – 0,26 μg/l (niemal 5 x więcej). Charakterystyka zbioru wyjściowego: n = 92, x = 0,035 μg/l, s = 0,025 (nieprawdopodobnie duże, sugerujące ogromny rozrzut wartości wyznaczanych ap. Elecsys), a po odrzuceniu 1 wyniku: n = 91, x = 0,033 μg/l, s = 0,0089. Jednocześnie jednak początkowo nieistotna różnica w stosunku do wartości wyznaczonych analizatorami Modular/Cobas 6000 po korzystnym zmniejszeniu odchylenia standardowego stałą się istotna. Odrębną sprawą jest rzeczywista istotność merytoryczna występujących różnic. W programach międzylaboratoryjnych, przy dużych liczebnościach porównywanych zbiorów, a jednocześnie przy często spotykanej dużej zbieżności wyników (szczególnie po oczyszczeniu pierwotnych zbiorów), klasyczne metody oceny statystycznej okazują się zbyt czułe, wykazując istotność naprawdę znikomych różnic, nie mających żadnego znaczenia praktycznego. Problem w rzeczywistości nie został rozwiązany, utrudniając ocenę przyjmowanych wartości umownie należnych rożnego szczebla. Dodatkową trudnością jest obciążający wykorzystywane stabilizowane materiały kontrolne efekt podłoża, bardzo wyraźnie modyfikujący wyniki uzyskiwane poszczególnymi metodami czy analizatorami. Co gorsza, nawet ewentualne wykorzystanie trudno dostępnych i kosztownych stabilizowanych materiałów kontrolnych z wyznaczonymi wartościami definitywnymi/referencyjnymi problemu nie rozwiązuje. Odrębnym zagadnieniem jest przyjęcie odpowiednich granic dopuszczalnego błędu, zależnych zarówno od wiarygodności będących podstawą oceny wartości umownie należnych, jak i celu prowadzonych sprawdzianów. Przyjęty informacyjno-szkoleniowy tryb sprawdzianów jest prosty, nie jest konfliktogenny i nie wzbudza emocji, ale i nie wymusza wystarczających starań o poprawność uzyskiwanych/przesyłanych danych. Dodatkowo często powoduje dyskomfort świadomości świadczenia usług przez placówki, których działalność powinna być co najmniej ograniczona. Rozwiązanie tych – i dalszych – problemów przekracza zarówno kompetencje jak i uprawnienia zespołu Centralnego Ośrodka. Aktualnym pozostaje postulat utworzenia pod egidą Ministerstwa Zdrowia zespołu z udziałem wszystkich potencjalnie zainteresowanych – wykonawców i odbiorców wyników, organizatorów ochrony zdrowia, producentów/dystrybutorów sprzętu czy odczynników, orga- A.M. Brzeziński i B. Przybył-Hac nizacji i korporacji pracowników – z zadaniem ustalenia/ unowocześnienia trybu, wymagań i ew. konsekwencje realizowanych w Polsce programów sprawdzianów międzylaboratoryjnych. Adres Autorów: Centralny Ośrodek Badań Jakości w Diagnostyce Laboratoryjnej 90-613 Łódź, ul. Gdańska 80 (Praca wpłynęła do Redakcji: 2010-05-20) (Praca przekazana do opublikowania: 2010-05-24) 39