SYMULACJE NUMERYCZNE W OCENIE RYZYKA

Transkrypt

SYMULACJE NUMERYCZNE W OCENIE RYZYKA
SYMULACJE NUMERYCZNE W OCENIE RYZYKA
Dr Marek Biesiada
Instytut Medycyny Pracy i Zdrowia Środowiskowego, Sosnowiec
Główną trudnością metodologiczną w procesie ocen ryzyka zdrowotnego jest złożoność
oddziaływań środowiska na zdrowie populacji ludzkich. Złożoność ta posiada kilka
aspektów: z jednej strony dany reprezentant narażonej populacji jest narażony na dużą
liczbę czynników szkodliwych, nawet w ramach narażenia na jeden tylko czynnik szkodliwy np. na ołów, jego pobranie może nastąpić jedną z trzech dróg narażenia (inhalacyjnie, drogą pokarmową lub poprzez wchłonięcie przez skórę lub błony śluzowe). Narażona
populacja ludzka jest z kolei zróżnicowana pod względem płci i wieku jak również innych
czynników określających szczególnie wrażliwe podgrupy. Wiek i płeć są bardzo ważnymi
cechami określającymi podstawowe parametry (takie jak wentylacja dobowa płuc, dobowa
konsumpcja wody pitnej i pokarmów itp.), od których zależy wielkość dawki pobranej.
Złożoność procesu oddziaływania środowiska na zdrowie spowodowała, że w naturalny
sposób pojawiła się konieczność stosowania symulacji komputerowych w ocenie ryzyka
zdrowotnego. Przy pomocy symulacji numerycznych staje się możliwe prowadzenie analiz
czułości wyniku końcowego ze względu na drogi narażenia, tzn. wykazywanie, które z
dróg narażenia mają dominujący wkład do wypadkowego ryzyka i w konsekwencji, na
których drogach narażenia powinna się skupić uwaga badacza.
Zastosowanie metod numerycznych umożliwia też prowadzenie analizy niepewności wyniku końcowego. Jest rzeczą oczywistą, że wypadkowe ryzyko zdrowotne ponoszone przez
narażoną populację ludzką będzie wielkością rozmytą w związku z wyżej wspomnianym
zróżnicowaniem narażonej populacji pod względem fizjologicznych czynników narażenia.
Uchwycenie tej składowej niepewności jest obecnie możliwe przy zastosowaniu symulacji
Monte Carlo w ramach tzw. probabilistycznego podejścia do oceny ryzyka zdrowotnego.
Krótkiej prezentacji tej metodologii poświęcony jest niniejszy referat.
Konwencjonalna procedura oceny ryzyka opiera się na tzw. ocenach „punktowych” polegających na tym, że do odpowiednich formuł matematycznych (wzorów na dawkę pobraną, ryzyko czy iloraz zagrożenia) podstawia się konkretne („punktowe”) wartości liczbowe
zmiennych i parametrów, np. stężenie szkodliwej substancji, masę ciała, dobową wentylację płuc itd. Owe zmienne i parametry posiadają w istocie pewne rozkłady w populacjach
ludzkich (ściśle mówiąc są one zmiennymi losowymi scharakteryzowanymi przez pewne
funkcje rozkładu). Toteż za wartości liczbowe wykorzystywane w ocenie ryzyka przyjmuje się np. średnie, wartości maksymalne, medianę itp. (zależnie od przyjętych konwencji). W procedurze ocen „punktowych” utrudniona jest dyskusja niepewności uzyskanego
wyniku (jego rozrzut).
W podejściu probabilistycznym (metoda Monte Carlo) zmienne i parametry modelu narażenia opisuje się przy pomocy odpowiednich rozkładów. Daje to możliwość uwzględnienia
zmienności rozważanych czynników narażenia. Wynik w postaci rozkładu ryzyka dostar115
cza więcej informacji z punktu widzenia oceny niepewności - daje obrazowy pogląd, w
jakim stopniu niepewna jest prognoza. Ideę podejścia probabilistycznego obrazuje poniższy rysunek.
IDEA SYMULACJI MONTE CARLO
Czynniki narażenia
x
y
50
100
z
x
y
z
75
I(x,y,z)
NARAŻENIE
5 ⋅10 -4
RYZYKO
I(x,y,z)
Metoda symulacji Monte Carlo pozwala także na uwidocznienie, jaka jest dystrybucja ryzyka w rozważanej populacji i daje możliwość wyliczenia, jaki procent populacji ponosi
ryzyko na różnym poziomie. Informacje te mogą być przedstawione np. przez podanie
wartości kolejnych percentyli ryzyka indywidualnego (lub ilorazu zagrożenia HQ).
Tytułem ilustracji podane zostaną poniżej główne założenia poczynione w trakcie probabilistycznej oceny ryzyka w ramach projektu, który posłużył jako źródło przykładu praktycznej oceny ryzyka.
W celu uwzględnienia zmienności międzyosobniczej fizjologicznych czynników narażenia
oraz zmienności przestrzennej stężeń szkodliwych substancji w powietrzu atmosferycznym, zastosowano metodę probabilistyczną wykorzystując symulacje Monte Carlo w opar-
116
ciu o odpowiednie wzory. We wzorach tych traktowano zmienne Csa,n – stężenie substancji
szkodliwej w powietrzu, Inhi – wielkość dobowej wentylacji płuc oraz masę ciała - M.C.i
(i =0-6,7-19,m,k) jako zmienne losowe o zadanych rozkładach prawdopodobieństwa. Natomiast rolę parametrów modelu odgrywały dawki referencyjne RfD, wskaźniki siły działania kancerogennego oraz odpowiednie elementy struktury demograficznej.
Fizjologiczne czynniki narażenia dla poszczególnych subpopulacji odzwierciedlających
faktyczną strukturę demograficzną dopasowano adekwatnie do wieku i płci opierając się
na danych antropometrycznych i modelowano przy pomocy opisanych poniżej funkcji rozkładu prawdopodobieństwa.
Rozkłady mas w grupach dzieci aproksymowano jako jednorodne pomiędzy 5 i 95 percentylem odpowiednich krańców wiekowych, w grupie mężczyzn i kobiet zaś jako obcięte
rozkłady normalne.
Wentylację dobową płuc aproksymowano w poszczególnych grupach wiekowych rozkładami normalnymi o wartościach średnich i odchyleniach standardowych wynikających z
danych antropometrycznych, oraz obciętych na 5 i 95 percentylu wg antropometrii.
Poniżej zestawiono założenia odnośnie rozkładów poszczególnych fizjologicznych czynników narażenia.
Wentylacja dobowa płuc:
Inh0-6 – rozkład normalny N(5 m3/d ; 3 m3/d) zawężony do przedziału [2 m3/d; 20 m3/d];
Inh7-19 – rozkład normalny N(17 m3/d ; 5 m3/d) zawężony do przedziału [12 m3/d ; 40
m3/d]; Inhk,m – rozkład normalny N(20 m3/d ; 15 m3/d) zawężony do przedziału [13 m3/d ;
60 m3/d].
Masa ciała:
M.C.0-6 – rozkład jednorodny w przedziale [3 kg ; 28 kg];
M.C.7-19 – rozkład jednorodny w przedziale [19 kg ; 80 kg];
M.C.k – rozkład normalny - N(60 kg ; 10 kg) zawężony do przedziału [47 kg ; 87 kg];
M.C.m – rozkład normalny - N(74 kg ; 11 kg) zawężony do przedziału [57 kg ; 95 kg].
Rysunki ilustrujące powyższe założenia są przedstawione poniżej (w formie wydruku raportu z programu komputerowego wykonującego symulacje).
117
Assumption:
Uniform distribution with
Minimum
Maximum
3,00
28,00
BW1
Mean = 15,50
3,00
9,25
15,50
Assumption:
BW2
Uniform distribution with
t
Minimum
Maximum
21,75
28,00
19,00
80,00
BW2
Mean = 49,50
19,00
34,25
49,50
Assumption:
BW
Normal distribution with
Mean
Standard Dev.
64,75
80,00
74,00
11,00
Selected range is from 57,00 to
95 00
BWm
Mean = 74,68
41,00
118
57,50
74,00
90,50
107,00
Assumption:
I h1
Normal distribution with
Mean
Standard Dev.
[
5,00
3,00
Selected range is from 2,00 to
20 00
Inh1
Mean = 5,86
-4,00
0,50
5,00
9,50
14,00
Assumption:
Normal distribution with
t
Mean
Standard Dev.
17,00
5,00
Selected range is from 12,00 to
40 00
Inh2
Mean = 18,44
2,00
9,50
Assumption:
I h3
Normal distribution with
t
Mean
Standard Dev.
17,00
24,50
32,00
20,00
15,00
Selected range is from 13,00 to
60 00
[
Assumption: Inh3
(
'd)
Inh3
Mean = 27,69
119
W celu wygenerowania rozkładu wskaźników ryzyka nienowotworowego oraz indywidualnego ryzyka nowotworowego metodą Monte Carlo, wykonywano 10 000 prób na każdą
symulację.
Przykładowe wyniki symulacji ryzyka i ilorazu zagrożenia wraz z ich interpretacją przedstawione są w referacie omawiającym przykład praktyczny oceny ryzyka.
Metoda symulacji Monte Carlo jest bardzo ważnym narzędziem posiadającym wiele zastosowań w różnych działach nauki i praktyki. W kontekście oceny ryzyka zdrowotnego pozwala ona na uchwycenie w sensie ilościowym niepewności wyniku wynikającej ze zróżnicowania narażonej populacji pod względem jej wrażliwości na szkodliwe substancje
chemiczne w środowisku. Wiarygodność metody Monte Carlo zależy jednak od rodzaju
poczynionych założeń odnośnie rozkładów wejściowych parametrów narażenia. Poniżej
podane są wskazówki praktyczne, jakimi należy się kierować podejmując decyzję odnośnie wyboru postaci funkcji rozkładu do zastosowania w symulacjach Monte Carlo.
Wskazówki praktyczne do stosowania metody Monte Carlo
Rozkładami normalnymi (lub log-normalnymi) modelujemy
Parametry fizjologiczne
• masa ciała
• wentylacja dobowa
• powierzchnia ciała
Rozkładami dopasowanymi do istniejących danych modelujemy
• konsumpcję dobowa wody
• spożycie przypadkowe gleby i kurzu
• częstość kontaktu ze skażonym medium
•
•
•
stężenie zanieczyszczeń w powietrzu (rozkład log-normalny dopasowany do danych)
stężenie zanieczyszczeń w wodzie
stężenie zanieczyszczeń w glebie
W sytuacji gdy znamy jedynie:
• wartość średnią
• wartość minimalną
• wartość maksymalną
stosujemy rozkład trójkątny.
Gdy wszystkie wartości od minimalnej do maksymalnej są równouprawnione stosujemy
rozkład jednorodny.
120