1.1 Chemometria. - Wydział Chemii UMK

Transkrypt

1.1 Chemometria. - Wydział Chemii UMK
1.1 Chemometria.
W 1974 roku młody pracownik Institue of Chemistry Umea University Svante
Wold napisał następująco: Umiejętność wyciągania chemicznie istotnych informacji z
przeprowadzonego chemicznego eksperymentu jest zwana chemometrią. Chemometria
jest nauką zależną od różnych rodzajów matematycznych narzędzi m.in. statystyki,
metod numerycznych. Dlatego chemometria nie może być oddzielną gałęzią chemii,
musi pozostać integralną częścią chemii i matematyki. Celem chemometrii jest zatem
uzyskanie jak największej liczby informacji z eksperymentu chemicznego. Możliwe jest
to do osiągnięcia poprzez zastosowanie odpowiednich metod matematycznych
pozwalających na wyeliminowanie wpływu różnych odchyleń od właściwego pomiaru
(wyniku). Nasuwa się przy tym pytanie: co kryje się pod pojęciem właściwy pomiar?
Istotną rzeczą w chemii analitycznej, chemii instrumentalnej jest znajomość budowy
i zasady działania przyrządu pomiarowego. Należy przed przystąpieniem do wykonania
analizy zadać sobie istotne dla każdego chemika pytania: Co chcemy uzyskać
z przeprowadzonego eksperymentu, co chcemy zmierzyć, czy dana metoda jest
odpowiednia i stosowana do badanej substancji? Analogiczne pytania mogą być zadane
przed przystąpieniem do matematycznej obróbki uzyskanych wyników. W przypadku
tym sztuką jest wyciągnięcie jak największej liczby cennych informacji chemicznych,
jednocześnie eliminując tak dalece jak to możliwie, tzw. hałasy, szumy, zaburzenia, itp.
Pod tymi pojęciami należy rozumieć wszelkie czynniki wpływające na przebieg
doświadczenia i otrzymane wyniki (temperatura, ciśnienie, niepoprawne działanie
instrumentu, zaburzenia spowodowane ograniczeniami stosowalności niektórych praw
chemicznych i fizycznych np. prawo Beera, Debya – Hűckla).
Chemometria może być traktowana jako nauka dostarczająca narzędzi pomagających
rozwiązywać problemy związane z interpretacją uzyskanych wyników. Jednocześnie,
należy pamiętać, że matematyczne metody nieznajdujące zastosowania w chemii mają
mniejsze znaczenie dla eksperymentatora. Kluczem do zrozumienia, chemometrii nie
jest poznanie różnych metod matematycznych, lecz poznanie właściwego zastosowania
odpowiedniego modelu matematycznego do rozwiązania problemu. Np. w przypadku
spektroskopii chemometria stosuje metody pomagające rozwiązywać problemy
kalibracyjne i interpretacji widm. Niektóre metody są względnie proste, podczas gdy
inne wymagają bardziej zaawansowanych metod matematycznych. Jednak, te wszystkie
4
metody posiadają jedną wspólną cechę tj. wszystkie rozwiązują indywidualne problemy
i nie istnieje uniwersalna metoda matematycznej obróbki danych doświadczalnych.
1.2 Modele.
Jakikolwiek pomiar w chemii (jak również w fizyce, biologii, geologii,...) jest
nieprecyzyjny. Wyniki i pomiary obarczone są szumem, zaburzeniami będącymi
wynikiem wpływu czynników aparaturowych i czynników związanych z pracą
i
przebiegiem
eksperymentu.
Statystyka
jest
nauką
korzystającą
z
metod
matematycznych do wyciągania wniosków, z uprzednio przetworzonych wyników.
Odchylenie pomiędzy mierzoną wartością i naszym teoretycznym modelem zależy, co
najmniej od trzech źródeł.
Pierwszym źródłem jest to brak pełnej kontroli warunków doświadczalnych
(temperatury, pH, itp.), co uniemożliwiają wykonanie drugiego pomiaru w warunkach
początkowych. Można określić warunki doświadczalne w taki sposób, aby temperatura
wynosiła 298 K, pH = 4 a stężenie 0,1 mol/dm3. Częściowy brak kontroli może
spowodować, że temperatura będzie się wahać w granicach 297,96 K – 298,02 K,
pH = 4,02 – 3,97 itd. Stąd drugi pomiar będzie wykazywał nieznaczne odchylenia od
pomiaru pierwszego itd.
Drugim źródłem odchyleń jest nasz instrument (spektrofotometr, chromatograf)
niepozwalający na wykonanie dokładnie stałych wyników pomiaru. Czynnikami
wpływającymi na działanie instrumentu są: ciśnienie, temperatura, wilgotność
powietrza, spadek napięcie w obwodach itp.
Trzecim źródłem odchyleń jest model stosowany do interpretacji wyników
np. mechanizm reakcji, prawo Beera, prawo Debya – Hűckela, itp. Błędne wyniki,
jakiekolwiek odchylnie, traktowane są często jako błąd pomiaru a nie jako braki
modelu.
5
1.3 Przetwarzanie danych.
Przetwarzanie wstępne danych jest bardzo ważną częścią eksperymentu.
Obróbka danych ma na celu usunięcie lub zmniejszenie zakłóceń, odchyleń wyników,
z którymi instrument nie może sobie poradzić. Przetwarzanie wyników może
pozytywnie lub negatywnie wpływać na wynik analizy. Wybieranie sposobu
przetwarzania może wymagać powtórzenia kroku pomiędzy pierwotną analizą
i stopniem przetwarzania danych. Chociaż postępowanie takie jest często praktykowane
to najlepiej, jeśli narzędzie przetwarzania jest wybierane na podstawie znanej
właściwości danych.
Sygnał będący wynikiem pomiaru fizykochemicznego składa się z prawdziwego
sygnału i szumu, który stanowi wynik zakłócający przebieg analizy i interpretacje
otrzymanych wyników. Charakter szumu zależy od rodzaju eksperymentu i wyboru
warunków działania instrumentu. Zadaniem matematycznych narzędzi jest, zatem jego
redukowanie a co za tym idzie zwiększenie stosunku sygnału do szumu. Szum
charakteryzuje się wyższą częstością od sygnału pomiaru fizykochemicznego. Źródła
szumu wnoszące udział do sygnału, który jest wyższej częstości, często jest trudno
matematycznie usunąć bez usuwania właściwej „informacji fizykochemicznej”.
Najczęstszą metodą stosowaną do usuwania szumów i zaburzeń z widm
spektroskopowych jest metoda wygładzania. Wygładzanie wyników opierają się na
teoretycznym i fenomenologicznym zdefiniowaniu pomiaru jako wyniku sumowania
prawdziwej wartości pomiaru i dowolnego szumu. Nakładanie się linii spektralnych
i szumy uważa się za dwie najpoważniejsze przeszkody utrudniające interpretację
widm.
Metody
wygładzania
posługują
się
tzw.
„oknem”,
które
może
być
interpretowane jako obszar napływu informacji. Wszystkie punkty w oknie są
wykorzystane do określenia wartości środka okna, co oznacza, że szerokość okna
bezpośrednio wpływa na rezultaty wygładzenia. Spośród wielu metod wygładzania,
w niniejszej pracy zostaną omówione te, które należą do metod najczęściej
stosowanych, tj. metody wykorzystujące technikę „okna” oraz metodzie opartej na
Transformacie Fouriera. Do metod wykorzystujących „okno” należą:
-
metoda średniej (mean smoother),
-
metoda ruchomej średniej (running mean smoother),
6
-
metoda ruchomej mediany (running median smoother),
-
metoda wielomianu gładzącego.
Ostatnie z metod, tj. metoda wielomianu gładzącego, dzieli się na szereg innych metod,
co związane jest z rodzajem stosowanego wielomianu. Z matematycznego punktu
widzenia każdy wielomian ma charakterystyczne dla siebie własności. Istnieje, bowiem
cała rodzina wielomianów ortogonalnych doskonale nadająca się do interpolacji
i ekstrapolacji danych. Piąta metoda nie używa okna jako obszaru napływu informacji.
Metoda ta zwana jest jako Transformacja Fouriera.
Niezależnie od rozwoju metodą wygładzania danych (krzywych, itp.) i ich
różnorodności, podstawową metodą pozostaje obecnie metoda znana pod nazwą Filtr
Savitzky’ego i Golaya [1].
1.4 Cel pracy.
Tzw. cyfrowe filtry gładzące uważane są za wyjątkowe przydatne w przypadku
konieczności polepszenia stosunku sygnału do szumu spektrofotometru. Z tego względu
w większości spektrofotometrów stosuje się odpowiednio dobrane wielomianowe filtry
gładzące. Celem pracy jest przedstawienie metod wygładzania z zastosowaniem do
obróbki wyników pomiaru spektrofotometrycznego. Zawarte w pracy przykłady są
własnymi pomiarami doświadczalnymi, które zostają przetworzone za pomocą metod
matematycznych opisanych w niniejszej pracy.
Najbardziej popularnym filtrem używanym w instrumentach analitycznych jest Filtr
Savitzky’ego i Golaya, który omówiony jest szczegółowo w dalszych częściach pracy.
Działanie filtru SG polega na wygładzaniu danych za pomocą wielomianu otrzymanego
metodą najmniejszych kwadratów.
Zgodnie z powyższym planem w dużym stopniu zostały w pracy opisane matematyczne
podstawy wygładzanie danych w celu usunięcia jak największej ilości szumów, aby
eksperymentator mógł z większą łatwością wyciągać dla niego cenne informacje od
uzyskanych widm. W głównej mierze będzie poruszony temat filtru Savitzky’ego
i Golaya.
7