pobierz plik referatu
Transkrypt
pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Rozdział 13 w Normalizacja relacji z atrybutami rozmytymi poziomu drugiego w 1 Wstęp da .b w Streszczenie. Temat rozdziału jest związany z projektowaniem schematów relacyjnych w rozmytych bazach danych. Uwzględnienie nieprecyzyjnych wartości atrybutów wymagało rozszerzenia definicji stosowanych powszechnie pojęć. Do opisu wartości atrybutów zastosowano zbiory rozmyte poziomu drugiego. Ich elementami są klasyczne zbiory rozmyte, dla których określono stopień przynależności do definiowanego pojęcia. Stopień zależności funkcyjnej między atrybutami został określony za pomocą pary liczb z przedziału [0, 1] stanowiących miary konieczności i możliwości. Zdefiniowane w ten sposób zależności podlegają rozszerzonym regułom Armstronga. Sformułowano definicje rozmytych postaci normalnych schematów relacyjnych. pl s. Podczas projektowania bazy danych powstaje problem odpowiedniego wyboru różnych schematów relacji. Właściwy projekt powinien zapewnić możliwość zapisywania danych bez redundancji oraz łatwe wyszukiwanie żądanych informacji. Najważniejszą metodą prowadzącą do uzyskania projektu o korzystnych właściwościach jest procedura normalizacji. Polega ona na projektowaniu relacji spełniających warunki zawarte w definicjach odpowiednich postaci normalnych. Konieczne są przy tym dodatkowe informacje o modelowanym wycinku rzeczywistości. Są to nałożone na dane więzy zwane zależnościami funkcyjnymi. Muszą one zostać zidentyfikowane podczas projektowania. W konwencjonalnych bazach danych zależność funkcyjna X → Y między atrybutami X i Y oznacza, że każda wartość atrybutu X identyfikuje dokładnie jedną wartość atrybutu Y. Odpowiada to założeniu, że równość wartości atrybutów można opisać formalnie za pomocą logiki dwuwartościowej. Zagadnienie staje się bardziej złożone, jeśli nasza wiedza dotycząca modelowanej rzeczywistości nie jest pełna. W takich przypadkach istnieje konieczność zastosowania narzędzi umożliwiających przedstawienie niekompletnej informacji [6], [8]. Jednym z nich jest teoria zbiorów rozmytych [5], [12]. Procedura normalizacji musi zostać rozszerzona tak, aby mogła uwzględniać nieprecyzyjne wartości atrybutów. W szczególności inaczej powinno być rozumiane pojęcie zależności funkcyjnej [2], podstawowe pojęcie procedury normalizacji. W rozmytych bazach danych istnieje możliwość oceny stopnia bliskości porównywanych wartości. Pojęcie zależności funkcyjnej wymaga więc modyfikacji. Istnienie takiej zależności oznacza, że bliskim Krzysztof Myszkorowski Politechnika Łódzka, Instytut Informatyki, ul.Wólczańska 215, 93-005 Łódź, Polska email:[email protected] (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 K. Myszkorowski w wartościom atrybutu X odpowiadają bliskie wartości atrybutu Y. Rozszerzenie pojęcia postaci normalnych relacji było przedmiotem wielu prac (np. [2], [10]). Formułowane definicje musiały być zgodne z zastosowanym podejściem do modelowania rozmytych baz danych. Najczęściej spotykane opisy bazują na teorii możliwości lub na teorii podobieństwa. W niniejszym rozdziale do opisu atrybutów zastosowano zbiory rozmyte poziomu drugiego [11]. Definicja takiego zbioru zawiera klasyczne zbiory rozmyte, którym przyporządkowano liczby z przedziału [0, 1] określające stopień ich przynależności do definiowanego pojęcia. Tak opisywane atrybuty będziemy nazywać rozmytymi atrybutami poziomu drugiego. W punkcie drugim sformułowano definicję zależności funkcyjnej między atrybutami, których wartości są reprezentowane za pomocą rozkładu możliwości. Pojęcie to zostało następnie zastosowane w punkcie trzecim dla atrybutów poziomu drugiego. Punkt czwarty zawiera definicje rozszerzonych postaci normalnych, w których wykorzystano opisane wcześniej pojęcia. w 2 Rozmyte zależności funkcyjne w da .b Przy rozmytych wartościach atrybutów X i Y istnienie zależności funkcyjnej X → Y wiąże się z koniecznością odpowiedzi na pytanie, w jakim stopniu atrybut X decyduje o wartości atrybutu Y. Można więc mówić o pewnym poziomie zależności. W celu jego określenia trzeba dysponować miarą pozwalającą ocenić stopień równości wartości atrybutów oraz odpowiednio rozszerzoną definicją implikacji. W dalszych rozważaniach przyjmiemy, że wartości atrybutów są określone za pomocą rozkładu możliwości [13]. Definicja 1. Przyjmijmy następujące oznaczenia: ℜ – obszar odniesienia, X – zmienna określona na ℜ, F – zbiór rozmyty w ℜ z funkcją przynależności µF (x). Rozkładem możliwości zmiennej X w obszarze ℜ względem F nazywamy zbiór πX (x) = {πX (x) / x: x ∈ ℜ i πX (x) = µF (x) }. (1) gdzie πX (x) oznacza miarę możliwości przyjęcia przez zmienną X wartości x: πX (x) = Poss (X = x). pl s. Miara bliskości rozkładów możliwości π1 oraz π2 wyraża się wzorem: Poss(π1 =π2) = supx min (π1 (x),π2 (x)). (2) Wartość uzyskana na podstawie wzoru 2 określa ocenę stopnia przekonania o możliwości wystąpienia równych wartości atrybutów. Pełniejszą informację można uzyskać za pomocą miary konieczności: Nec(π1 =π2) = 1 – supx ≠ y min(π1(x), π2(y)). (3) Ocenę równości rozkładów możliwości będziemy określać za pomocą pary liczb a = (α, β) należących do przedziału [0, 1]. Przyjmiemy, że pierwsza z nich jest miarą konieczności, a druga miarą możliwości. Zgodnie z teorią rozkładu możliwości α ≤ β. W logice dwuwartościowej operator implikacji I (będziemy go nazywać implikatorem) jest odwzorowaniem: {0, 1} × {0, 1} → {0, 1}. Parze liczb (a, b) należących do {0, 1} odpowiada wartość I (a, b), taka że I (a, b) = 1 dla dowolnych wartości a i b, poza przypadkiem, gdy a =1 i b = 0 – wtedy I (a, b) = 0. Zaproponowano różne wersje rozszerzenia implikacji do postaci [0, 1] × [0, 1] → [0, 1] (np. [1], [3]). Jednym z nich jest implikator Gödela IG. Jego definicję można przedstawić formalnie w sposób podobny do 170 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Normalizacja relacji z atrybutami rozmytymi poziomu drugiego zapisu definicji implikacji klasycznej, z tą różnicą, że obie liczby a i b mogą przyjmować dowolne wartości z przedziału [0, 1]: IG (a, b) = 1 dla a ≤ b oraz IG (a, b) = b dla a > b. (4) w Dokonywanie oceny stopnia równości ma podstawie miar konieczności i możliwości wymaga dalszego rozszerzenia operatora implikacji. Jego argumentami są pary liczb a = (aN, aΠ) i b = (bN, bΠ) z przedziału [0, 1]. Wynikiem działania tak rozszerzonego implikatora Gödela – oznaczmy go przez ĨG – jest para liczb ĨG (a, b) = (ĨG (a, b)N , ĨG (a, b)Π) z przedziału [0, 1], które wyrażają się wzorami [7]: ĨG (a, b)Π = 1 jeśli aΠ ≤ bΠ i ĨG (a, b)Π = bΠ jeśli aΠ > bΠ (5) w ĨG (a, b)N = 1 jeśli aN ≤ bN i aΠ ≤ bΠ , ĨG (a, b)N = bΠ jeśli aN ≤ bN i aΠ > bΠ i (6) ĨG (a, b)N = bN jeśli aN > bN w Zależność funkcyjną między atrybutami wyrażonymi za pomocą rozkładów możliwości można sformułować następująco (poniższa definicja stanowi rozszerzenie definicji podanej przez Chena w [2]): da .b Definicja 2. Niech R(X1, X2, … , Xn) będzie schematem relacyjnym oraz niech X i Y będą podzbiorami zbioru atrybutów: X, Y ⊆ U, gdzie U = {X1, X2, … , Xn}. Niech Π(X) i N(X) oznaczają miary możliwości i konieczności tego, że wartości atrybutu X w krotkach t i t’ relacji R o schemacie R są sobie równe Podzbiór Y jest funkcyjnie zależny od podzbioru X w stopniu (α, β), co oznaczamy przez X → α, β Y, wtedy i tylko wtedy, gdy dla każdej relacji R o schemacie R jest spełniony następujący warunek: min t, t’∈ R I( (N(X), Π(X)), (N(Y), Π(Y)) N ≥ α , (7) min t, t’∈ R I( (N(X), Π(X)), (N(Y), Π(Y)) Π ≥ β , (8) gdzie I jest rozszerzonym operatorem Gödela. P pl s. Tabela 1. Relacja PZ1 – przykład 1 Z t1 1/1200 t2 {1/1200, 0.6/1250} {0.8/8, 1/8.5} t3 {1/1500, 0.5/1600} {0.5/9.5, 1/10} t4 {0.6/1500, 1/1600} {1/10, 0.6/10.5} 1/8 Przykład 1. Relacja PZ1 przedstawia związek między pojemnością samochodu P oraz zużyciem paliwa Z. Atrybuty relacji PZ spełniają zależność P →0, 0.8 Z. Mamy bowiem: Nt1, t2(P) = 0.4, Πt1, t2(P) = 1, Nt1, t2(Z) = 0, Πt1, t2(Z) = 0.8, Nt3, t4(P) = 0, Πt3, t4(P) = 0.6, Nt3, t4(Z) = 0.4, Πt3, t4(Z) = 1. 171 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 K. Myszkorowski 3 Zależności funkcyjne między atrybutami poziomu drugiego Zbiór rozmyty poziomu drugiego stanowi rozszerzenie pojęcia klasycznego zbioru rozmytego nazywanego również zbiorem pierwszego typu. Funkcja przynależności jest odwzorowaniem µǍ : Ψ (ℜ) → [0, 1], gdzie Ψ(ℜ) oznacza rodzinę zbiorów rozmytych pierwszego typu określonych na obszarze odniesienia ℜ. Elementami zbioru rozmytego poziomu drugiego są więc zbiory rozmyte typu pierwszego [11]. w Definicja 3. Niech ℜ oznacza obszar odniesienia. Zbiorem rozmytym poziomu drugiego Ǎ elementów obszaru ℜ o funkcji przynależności µǍ nazywamy zbiór uporządkowanych par: w Ǎ = {< A, µǍ (A) >: µǍ : Ψ (ℜ) → [0, 1], A ∈ Ψ (ℜ)} (9) gdzie Ψ (ℜ) oznacza rodzinę zbiorów rozmytych pierwszego typu określonych na ℜ. w da .b Za pomocą tak zdefiniowanej konstrukcji można przedstawić ocenę możliwości wystąpienia określonych zdarzeń. Przykładowo zbiór Ž1 = {0.5/Z7.5, 1/Z8, 0.3/Z8.5}, odnoszący się do zużycia paliwa pewnego samochodu, oznacza, że jest całkowicie możliwe, iż wynosi ono około 8 litrów. Pozostałe warianty uzyskały niższą ocenę. Do określenia zbioru Ž1 zostały wykorzystane odpowiednio zdefiniowane zbiory rozmyte pierwszego typu Z7.5, Z8 i Z8.5. Zbiory te są przykładami liczb rozmytych – zbiorów rozmytych określonych na zbiorze liczb rzeczywistych [14]. Wykresy ich funkcji przynależności mają często kształt trójkąta lub trapezu (rys. 1). Takie liczby rozmyte nazywamy trójkątnymi lub trapezoidalnymi. Na rys. 1 przedstawiono wykresy funkcji przynależności dla dwóch różnych interpretacji pojęcia „Liczba rzeczywista około 8”. Funkcję przynależności można przedstawić za pomocą czterech wartości określających położenie wykresu. W tym celu wystarczy podać odcięte początku i końca górnej podstawy trapezu oraz odległości między początkami i końcami obydwóch podstaw. Dla liczb rozmytych z rysunku 1 są to: (8, 8, 0.4, 0.4) oraz (7.8, 8.2, 0.2, 0.2). Jedną z interpretacji zbioru rozmytego poziomu drugiego – którą będziemy przyjmować w niniejszym rozdziale – jest więc rozkład możliwości zbudowany z zastosowaniem klasycznych zbiorów rozmytych. Szczegóły modelowania niepełnych informacji za pomocą zbiorów rozmytych poziomu drugiego zostały omówione w pracy [11]. µ 1 1 0 7.6 8 8.4 Rys. 1. Liczba rzeczywista około 8 x 0 pl s. µ 7.6 7.8 8.2 8.4 x Ocena równości rozkładów możliwości dokonywana na podstawie wzorów 2 i 3 nie uwzględnia stopnia bliskości elementów rozważanej przestrzeni. Przy zbiorach rozmytych poziomu drugiego może mieć to szczególnie istotne znaczenie. Porównajmy podany wyżej rozkład możliwości Ž1 z rozkładem Ž2 = {0.5/Z7.7, 1/Z8.2, 0.3/Z8.7}. Na podstawie wzorów 2 i 3 otrzymujemy Poss = Nec = 0. Przyjmijmy, że występujące w Ž1 i Ž2 liczby rozmyte 172 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Normalizacja relacji z atrybutami rozmytymi poziomu drugiego w są określone następująco: µZ7.5 = (7.5, 7.5, 0.2, 0.2), µZ7.7 = (7.7, 7.7, 0.2, 0.2), µZ8 = (7.9, 8.1, 0.2, 0.2), µZ 8.2 = (8.2, 8.2, 0.2, 0.2), µZ 8.5 = (8.5, 8.5, 0.2, 0.2), µZ 8.7 = (8.7, 8.7, 0.2, 0.2). Widać więc, że rozpatrywane rozkłady nie są od siebie zbyt odległe. Wystąpienie w dużym stopniu sobie równych liczb rozmytych Z8 i Z8.2 jest w obu rozkładach całkowicie możliwe (w stopniu 1). Opis zbioru rozmytego poziomu drugiego można uzupełnić za pomocą relacji bliskości Rc. Jest to relacja zwrotna i symetryczna. Jej elementy są równe miarom bliskości zastosowanych zbiorów rozmytych typu pierwszego. Ocenę stopnia bliskości zbiorów A i B można dokonać na podstawie wysokości ich iloczynu [2]: ≈ (A, B) = supx min (µA (x), µB (x)) (10) w Dla zbiorów z przykładu 3 relacja bliskości została przedstawiona w tabeli 2. Tabela 2. Relacja bliskości w Z7.5 1 0.5 0 0 0 0 Z8 0 0.5 1 0.75 0 0 Z8.2 0 0 0.75 1 0.25 0 Z8.5 0 0 0 0.25 1 0.5 Z8.7 0 0 0 0 0.5 1 da .b Z7.5 Z7.7 Z8 Z8.2 Z8.5 Z8.7 Z7.7 0.5 1 0.5 0 0 0 Bliskość zbiorów rozmytych typu pierwszego można uwzględnić przez wprowadzenie do wzorów 2 i 3 relacji bliskości [9]: Poss (π1 =π2) = supx,y min (µRc(x, y), π1 (x), π2 (y)) (11) Nec (π1 =π2) = 1 - supx,y min ((1 – µRc(x, y)), π1 (x), π2 (y)) (12) pl s. Dla zbiorów Ž1 i Ž2 otrzymujemy Nec = 0.5 i Poss = 0.75. Ocena równości znacznie się powiększyła, co było do przewidzenia ze względu na podobnie zdefiniowane zbiory Z8 i Z8.2, których wystąpienie w obydwóch rozkładach jest całkowicie możliwe. Przykład 2. Rozważmy relację PZ2 przedstawioną w tabeli 3. Wartości pojemności i zużycia paliwa przedstawiono za pomocą zbiorów rozmytych poziomu drugiego. Występujące w relacji liczby rozmyte są określone następująco: µP1200 = (1200, 1200, 100, 100), µP1250 = (1250, 1250, 100, 100), µP1500 = (1500, 1550, 0, 100), µP1600 = (1600, 1600, 100, 0), µZ8 = (8, 8, 0.5, 0.5), µZ8.5 = (8.5, 8.5, 0.5, 0.5), µZ9.5 = (9.5, 9.5, 0.5, 0.5), µZ8 = (10, 10, 0.5, 0.5), µZ10.5 = (10.5, 10.5, 0.5, 0.5). Odpowiadające im wyrazy macierzy bliskości Rc przyjmują następujące wartości: Rc (P1200, P1250) = 0.75, Rc (P1500, P1600) = 0.75, Rc (Z8, Z8.5) = 0.5, Rc (Z9.5, Z10) = 0.5, Rc (Z10, Z10.5) = 0.5. Atrybuty relacji PZ spełniają zależność P →0.5, 0.8Z. Mamy bowiem: Nt1, t2(P) = 0.75, Πt1, t2(P) = 1, Nt1, t2(Z) = 0.5, Πt1, t2(Z) = 0.8, Nt3, t4(P) = 0.75, Πt3, t4(P) = 0.75, Nt3, t4(Z) = 0.5, Πt3, t4(Z) = 1. 173 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 K. Myszkorowski Tabela 3. Relacja PZ2 – przykład 3 w P Z t1 1/P1200 1/Z8 t2 {1/P1200, 0.6/P1250} {0.8/Z8, 1/Z8.5} t3 {1/P1500, 0.5/P1600} {0.5/ Z9.5, 1/ Z10} t4 {0.6/ P1500, 1/ P1600} {1// Z10, 0.6/ Z10.5,} w 4 Rozmyte postacie normalne R1: R2: R3: R4: R5: R6: R7: da .b w Rozważania niniejszego rozdziału dotyczą relacji, w których wartości atrybutów są wyłącznymi rozkładami możliwości. Oznacza to, że atrybut może przyjąć dokładnie jedną wartość ze swojej dziedziny. Relacje takie występują w pierwszej rozmytej postaci normalnej (F1NF). Wyższe postacie normalne dla tak zdefiniowanych relacji były przedmiotem prac Chena. W tym punkcie dokonamy ich rozszerzenia uwzględniając zastosowanie zbiorów rozmytych poziomu drugiego przy określaniu wartości atrybutów. Dalsza normalizacja polega na analizie zależności funkcyjnych, których stopień jest określony za pomocą pary liczb z przedziału [0, 1]. Przydatne są przy tym rozszerzone reguły Armstronga. W pracy [7] wykazano, ze są one spełnione dla zależności zdefiniowanych za pomocą rozszerzonego implikatora Gödela: Y ⊆ X ⇒ X →α ,β Y dla dowolnych α i β , X →α ,β Y ⇒ XZ →α ,β YZ X →φ1, φ2 Y ∧ Y →λ1, λ2 Z⇒ X →γ1, γ2 Z, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) . X →φ1, φ2 Y ∧ X →λ1, λ2 Z⇒ X →γ1, γ2 YZ, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) . X →φ1, φ2 Y ∧ WY →λ1, λ2 Z⇒ XW →γ1, γ2 Z, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) . X →α ,β Y ∧ Z ⊆ Y ⇒ X →α ,β Z X →φ1, φ2 Y ⇒ X →γ1, γ2 Y, gdzie γ1 ≤ φ1, γ2 ≤ φ2 pl s. Druga postać normalna dotyczy zależności poszczególnych atrybutów od klucza. Przy rozmytych wartościach atrybutów możemy mówić o pewnym poziomie klucza, czyli o stopniu, w jakim krotki relacji są przez niego identyfikowane. Jest to stopień zależności K →α, βU, gdzie K oznacza klucz relacji, a U jest zbiorem jej atrybutów. Zgodnie z pojęciem klucza zależność K →α, βU musi być pełna, co oznacza, że nie istnieje podzbiór K’⊂ K, taki że K →α, βU. Atrybuty należące do K nazywamy (α, β)-kluczowymi. Poziom zależności K →α, βU jest określony przez dwa składniki. Wartość β określa możliwość identyfikacji krotek przez atrybut K. Sama miara możliwości nie zawiera wystarczającej informacji. Istotna jest także ocena możliwości zdarzenia przeciwnego, czyli tego że K nie identyfikuje krotek. Niewielka jej wartość zwiększa stopień przekonania o roli atrybutu K jako klucza relacji. Odejmując uzyskaną ocenę od 1 otrzymujemy miarę konieczności, która jest równa mierze braku możliwości wystąpienia zdarzenia przeciwnego. Pełna zależność K →α, βU nie implikuje pełnej zależności od klucza poszczególnych atrybutów. Może bowiem istnieć atrybut A ∈ U, dla którego zależność K →α, βA jest co prawda spełniona, ale jej lewa strona może zawierać nadmiarowe elementy. Druga postać 174 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 Normalizacja relacji z atrybutami rozmytymi poziomu drugiego normalna eliminuje istnienie niepełnych zależności od klucza poszczególnych atrybutów relacji. w Definicja 4. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej drugiej postaci normalnej ((α, β)-F2NF), jeżeli dla każdego atrybutu (α, β)-niekluczowego A jest spełniona zależność K →α, β A i jest to zależność pełna. Kolejny etap normalizacji dotyczy zależności przechodnich, czyli takich, które wynikają z trzeciej reguły Armstronga. Zależności takie nie mogą istnieć w relacjach o schematach spełniających warunki definicji trzeciej postaci normalnej, która wymaga, by atrybuty (α, β) - niekluczowe nie identyfikowały innych atrybutów niekluczowych. w w Definicja 5. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej trzeciej postaci normalnej ((α, β)-F3NF), jeżeli dla każdej zależności funkcyjnej X →α, β Y, gdzie X, Y ⊆ U, U = {X1, X2, … , Xn} oraz Y ∉ X, X zawiera (α, β)-klucz relacji lub Y jest atrybutem (α, β)-kluczowym. Jeżeli zażądamy, by po lewej stronie zależności funkcyjnej mogły występować tylko klucze, to otrzymamy postać normalną Boyce’a-Codda. da .b Definicja 6. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej postaci normalnej Boyce’aCodda ((α, β)-BCNF), jeżeli dla każdej zależności funkcyjnej X →α, β Y, gdzie X, Y ⊆ U, U = {X1, X2, … , Xn} oraz Y ∉ X, X zawiera (α, β)-klucz relacji. Przykład 3. Rozważmy relację R opisującą własności pewnego zbioru samochodów. Jej atrybutami są: P – pojemność, W – wiek samochodu, Z – zużycie paliwa, V – maksymalna szybkość, C – cena i K – koszty eksploatacji. Istnieją między nimi następujące zależności: P →0.5, 0.8Z, P →0.6, 1V, PW →0.7, 1C, WZ →0.8, 1K. Kluczem jest PW. Na podstawie reguł Armstronga mamy bowiem: pl s. P →0.5, 0.8 Z ⇒ PW →0.5, 0.8Z (reguły R2 i R6) P →0.6, 1V ⇒ PW →0.6, 1V (reguły R2 i R6) PW →0.5, 0.8Z ∧ WZ →0.8, 1K ⇒ PW →0.5, 0.8K (reguła R5) Jest to klucz na poziomie (0.5, 0.8). Istnienie zależności P →0.5, 0.8Z i P →0.6, 1V jest niezgodne z warunkami definicji trzeciej (także i drugiej) postaci normalnej. W celu ich spełnienia należy wykonać rozkład na relacje o schematach: PZV(P, Z, V) – postać (0.5, 0.8)-BCNF, WZK(W, Z, K) – postać (0.8, 1)-BCNF i PWC(P, W, C) – postać (0.7, 1)BCNF. 4 Zakończenie Przedstawione w rozdziale definicje postaci normalnych stanowią rozszerzenie definicji sformułowanych dla rozmytych baz danych z atrybutami o wartościach modelowanych za pomocą klasycznych zbiorów rozmytych. Jest to konsekwencja zastosowania do opisu wartości atrybutów bardziej złożonych konstrukcji, jakimi są zbiory rozmyte poziomu drugiego. Zmodyfikowano również definicję rozmytej zależności funkcyjnej, której poziom jest 175 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008 Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008 K. Myszkorowski określony za pomocą pary liczb z przedziału [0, 1]. Zastosowano przy tym rozszerzony implikator Gödela. Literatura 1. w Alcalde C., Burusco A., Fuentes-Gonzalez R.: A constructive method for the definition of interval-valued fuzzy implication operators. Fuzzy Sets and Systems, 153, 2005. Chen G.Q.: Fuzzy logic in Data Modeling – semantics, constraints and database design. Kluwer, Boston, 1998. Deschrijver G., Kerre E.E.: Implicators based on binary aggregation operators in interval-valued fuzzy set theory. Fuzzy Sets and Systems, 152, 2005. Elmasri R., Navathe S.B.: Wprowadzenie do systemów baz danych. Wydawnictwo Helion, Gliwice 2005. Fedrizzi M., Kacprzyk J.: A Brief Introduction to Fuzzy Sets. In Studies in Fuzziness: Fuzziness in Database Management Systems, P.Bosc and J. Kacprzyk (Eds.) Physica Verlag, 1995. Łachwa A.: Rozmyty świat zbiorów, liczb, relacji, faktów, reguł i decyzji. Akademicka Oficyna Wydawnicza EXIT, Warszawa 2001. Nakata M.: On Inference Rules of Dependencies in Fuzzy Relational Data Models: Functional Dependencies. In Studies in Fuzziness and Soft Computing: Knowledge Management in Fuzzy Databases, Pons O., Vila M., Kacprzyk J. (Eds.), Physica Verlag, 2000. Petry F.: Fuzzy Databases: Principles and Applications. Kluwer Academic Publishers, 1996. Prade H., Testemale C.: Generalizing Database Relational Algebra for the Treatment of Incomplete or Uncertain Information and Vague Queries. Information Science, 34: 115-143, 1984. Shenoi S., Melton A., Fan L.T.: Functional Dependencies and Normal Forms in the Fuzzy Relational Database Model. Information Sciences, 60, 1992. de Tre G., de Caluwe R.: Level-2 fuzzy sets and their usefulness in object-oriented database modeling. Fuzzy Sets and Systems, 140, 2003. Zadeh L. A.: Fuzzy sets. Information and Control 8, 1965. Zadeh L. A.: Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems, 1, 1978. Zadrożny S.: Zapytania nieprecyzyjne i lingwistyczne podsumowania baz danych. Akademicka Oficyna Wydawnicza EXIT, Warszawa 2006. 2. 3. 5. 6. 7. 10. 11. 12. 13. 14. da .b 8. 9. w w 4. pl s. 176 (c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008