pobierz plik referatu

Transkrypt

pobierz plik referatu
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Rozdział 13
w
Normalizacja relacji z atrybutami rozmytymi
poziomu drugiego
w
1 Wstęp
da
.b
w
Streszczenie. Temat rozdziału jest związany z projektowaniem schematów
relacyjnych w rozmytych bazach danych. Uwzględnienie nieprecyzyjnych
wartości atrybutów wymagało rozszerzenia definicji stosowanych powszechnie pojęć. Do opisu wartości atrybutów zastosowano zbiory rozmyte poziomu
drugiego. Ich elementami są klasyczne zbiory rozmyte, dla których określono
stopień przynależności do definiowanego pojęcia. Stopień zależności funkcyjnej między atrybutami został określony za pomocą pary liczb z przedziału
[0, 1] stanowiących miary konieczności i możliwości. Zdefiniowane w ten
sposób zależności podlegają rozszerzonym regułom Armstronga. Sformułowano definicje rozmytych postaci normalnych schematów relacyjnych.
pl
s.
Podczas projektowania bazy danych powstaje problem odpowiedniego wyboru różnych
schematów relacji. Właściwy projekt powinien zapewnić możliwość zapisywania danych
bez redundancji oraz łatwe wyszukiwanie żądanych informacji. Najważniejszą metodą prowadzącą do uzyskania projektu o korzystnych właściwościach jest procedura normalizacji.
Polega ona na projektowaniu relacji spełniających warunki zawarte w definicjach odpowiednich postaci normalnych. Konieczne są przy tym dodatkowe informacje o modelowanym wycinku rzeczywistości. Są to nałożone na dane więzy zwane zależnościami funkcyjnymi. Muszą one zostać zidentyfikowane podczas projektowania.
W konwencjonalnych bazach danych zależność funkcyjna X → Y między atrybutami
X i Y oznacza, że każda wartość atrybutu X identyfikuje dokładnie jedną wartość atrybutu
Y. Odpowiada to założeniu, że równość wartości atrybutów można opisać formalnie za pomocą logiki dwuwartościowej. Zagadnienie staje się bardziej złożone, jeśli nasza wiedza
dotycząca modelowanej rzeczywistości nie jest pełna. W takich przypadkach istnieje konieczność zastosowania narzędzi umożliwiających przedstawienie niekompletnej informacji [6], [8]. Jednym z nich jest teoria zbiorów rozmytych [5], [12].
Procedura normalizacji musi zostać rozszerzona tak, aby mogła uwzględniać nieprecyzyjne wartości atrybutów. W szczególności inaczej powinno być rozumiane pojęcie zależności funkcyjnej [2], podstawowe pojęcie procedury normalizacji. W rozmytych bazach danych istnieje możliwość oceny stopnia bliskości porównywanych wartości. Pojęcie zależności funkcyjnej wymaga więc modyfikacji. Istnienie takiej zależności oznacza, że bliskim
Krzysztof Myszkorowski
Politechnika Łódzka, Instytut Informatyki, ul.Wólczańska 215, 93-005 Łódź, Polska
email:[email protected]
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
K. Myszkorowski
w
wartościom atrybutu X odpowiadają bliskie wartości atrybutu Y. Rozszerzenie pojęcia
postaci normalnych relacji było przedmiotem wielu prac (np. [2], [10]). Formułowane definicje musiały być zgodne z zastosowanym podejściem do modelowania rozmytych baz danych. Najczęściej spotykane opisy bazują na teorii możliwości lub na teorii podobieństwa.
W niniejszym rozdziale do opisu atrybutów zastosowano zbiory rozmyte poziomu drugiego [11]. Definicja takiego zbioru zawiera klasyczne zbiory rozmyte, którym przyporządkowano liczby z przedziału [0, 1] określające stopień ich przynależności do definiowanego
pojęcia. Tak opisywane atrybuty będziemy nazywać rozmytymi atrybutami poziomu drugiego. W punkcie drugim sformułowano definicję zależności funkcyjnej między atrybutami, których wartości są reprezentowane za pomocą rozkładu możliwości. Pojęcie to zostało
następnie zastosowane w punkcie trzecim dla atrybutów poziomu drugiego. Punkt czwarty
zawiera definicje rozszerzonych postaci normalnych, w których wykorzystano opisane
wcześniej pojęcia.
w
2 Rozmyte zależności funkcyjne
w
da
.b
Przy rozmytych wartościach atrybutów X i Y istnienie zależności funkcyjnej X → Y wiąże
się z koniecznością odpowiedzi na pytanie, w jakim stopniu atrybut X decyduje o wartości
atrybutu Y. Można więc mówić o pewnym poziomie zależności. W celu jego określenia
trzeba dysponować miarą pozwalającą ocenić stopień równości wartości atrybutów oraz
odpowiednio rozszerzoną definicją implikacji. W dalszych rozważaniach przyjmiemy, że
wartości atrybutów są określone za pomocą rozkładu możliwości [13].
Definicja 1. Przyjmijmy następujące oznaczenia: ℜ – obszar odniesienia, X – zmienna
określona na ℜ, F – zbiór rozmyty w ℜ z funkcją przynależności µF (x). Rozkładem
możliwości zmiennej X w obszarze ℜ względem F nazywamy zbiór
πX (x) = {πX (x) / x: x ∈ ℜ i πX (x) = µF (x) }.
(1)
gdzie πX (x) oznacza miarę możliwości przyjęcia przez zmienną X wartości x: πX (x) = Poss
(X = x).
pl
s.
Miara bliskości rozkładów możliwości π1 oraz π2 wyraża się wzorem:
Poss(π1 =π2) = supx min (π1 (x),π2 (x)).
(2)
Wartość uzyskana na podstawie wzoru 2 określa ocenę stopnia przekonania o możliwości wystąpienia równych wartości atrybutów. Pełniejszą informację można uzyskać za pomocą miary konieczności:
Nec(π1 =π2) = 1 – supx ≠ y min(π1(x), π2(y)).
(3)
Ocenę równości rozkładów możliwości będziemy określać za pomocą pary liczb a = (α, β)
należących do przedziału [0, 1]. Przyjmiemy, że pierwsza z nich jest miarą konieczności,
a druga miarą możliwości. Zgodnie z teorią rozkładu możliwości α ≤ β.
W logice dwuwartościowej operator implikacji I (będziemy go nazywać implikatorem)
jest odwzorowaniem: {0, 1} × {0, 1} → {0, 1}. Parze liczb (a, b) należących do {0, 1}
odpowiada wartość I (a, b), taka że I (a, b) = 1 dla dowolnych wartości a i b, poza
przypadkiem, gdy a =1 i b = 0 – wtedy I (a, b) = 0. Zaproponowano różne wersje
rozszerzenia implikacji do postaci [0, 1] × [0, 1] → [0, 1] (np. [1], [3]). Jednym z nich jest
implikator Gödela IG. Jego definicję można przedstawić formalnie w sposób podobny do
170
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Normalizacja relacji z atrybutami rozmytymi poziomu drugiego
zapisu definicji implikacji klasycznej, z tą różnicą, że obie liczby a i b mogą przyjmować
dowolne wartości z przedziału [0, 1]:
IG (a, b) = 1 dla a ≤ b oraz IG (a, b) = b dla a > b.
(4)
w
Dokonywanie oceny stopnia równości ma podstawie miar konieczności i możliwości
wymaga dalszego rozszerzenia operatora implikacji. Jego argumentami są pary liczb
a = (aN, aΠ) i b = (bN, bΠ) z przedziału [0, 1]. Wynikiem działania tak rozszerzonego
implikatora Gödela – oznaczmy go przez ĨG – jest para liczb ĨG (a, b) = (ĨG (a, b)N , ĨG (a,
b)Π) z przedziału [0, 1], które wyrażają się wzorami [7]:
ĨG (a, b)Π = 1 jeśli aΠ ≤ bΠ
i ĨG (a, b)Π = bΠ jeśli aΠ > bΠ
(5)
w
ĨG (a, b)N = 1 jeśli aN ≤ bN i aΠ ≤ bΠ ,
ĨG (a, b)N = bΠ jeśli aN ≤ bN i aΠ > bΠ i
(6)
ĨG (a, b)N = bN jeśli aN > bN
w
Zależność funkcyjną między atrybutami wyrażonymi za pomocą rozkładów możliwości
można sformułować następująco (poniższa definicja stanowi rozszerzenie definicji podanej
przez Chena w [2]):
da
.b
Definicja 2. Niech R(X1, X2, … , Xn) będzie schematem relacyjnym oraz niech X i Y będą
podzbiorami zbioru atrybutów: X, Y ⊆ U, gdzie U = {X1, X2, … , Xn}. Niech Π(X) i N(X)
oznaczają miary możliwości i konieczności tego, że wartości atrybutu X w krotkach
t i t’ relacji R o schemacie R są sobie równe Podzbiór Y jest funkcyjnie zależny od podzbioru X w stopniu (α, β), co oznaczamy przez X → α, β Y, wtedy i tylko wtedy, gdy dla każdej
relacji R o schemacie R jest spełniony następujący warunek:
min t, t’∈ R I( (N(X), Π(X)), (N(Y), Π(Y)) N ≥ α ,
(7)
min t, t’∈ R I( (N(X), Π(X)), (N(Y), Π(Y)) Π ≥ β ,
(8)
gdzie I jest rozszerzonym operatorem Gödela.
P
pl
s.
Tabela 1. Relacja PZ1 – przykład 1
Z
t1
1/1200
t2
{1/1200, 0.6/1250}
{0.8/8, 1/8.5}
t3
{1/1500, 0.5/1600}
{0.5/9.5, 1/10}
t4
{0.6/1500, 1/1600}
{1/10, 0.6/10.5}
1/8
Przykład 1. Relacja PZ1 przedstawia związek między pojemnością samochodu P oraz
zużyciem paliwa Z. Atrybuty relacji PZ spełniają zależność P →0, 0.8 Z. Mamy bowiem:
Nt1, t2(P) = 0.4, Πt1, t2(P) = 1, Nt1, t2(Z) = 0, Πt1, t2(Z) = 0.8, Nt3, t4(P) = 0, Πt3, t4(P) = 0.6,
Nt3, t4(Z) = 0.4, Πt3, t4(Z) = 1.
171
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
K. Myszkorowski
3 Zależności funkcyjne między atrybutami poziomu drugiego
Zbiór rozmyty poziomu drugiego stanowi rozszerzenie pojęcia klasycznego zbioru rozmytego nazywanego również zbiorem pierwszego typu. Funkcja przynależności jest odwzorowaniem µǍ : Ψ (ℜ) → [0, 1], gdzie Ψ(ℜ) oznacza rodzinę zbiorów rozmytych pierwszego
typu określonych na obszarze odniesienia ℜ. Elementami zbioru rozmytego poziomu drugiego są więc zbiory rozmyte typu pierwszego [11].
w
Definicja 3. Niech ℜ oznacza obszar odniesienia. Zbiorem rozmytym poziomu drugiego
Ǎ elementów obszaru ℜ o funkcji przynależności µǍ nazywamy zbiór uporządkowanych
par:
w
Ǎ = {< A, µǍ (A) >: µǍ : Ψ (ℜ) → [0, 1], A ∈ Ψ (ℜ)}
(9)
gdzie Ψ (ℜ) oznacza rodzinę zbiorów rozmytych pierwszego typu określonych na ℜ.
w
da
.b
Za pomocą tak zdefiniowanej konstrukcji można przedstawić ocenę możliwości wystąpienia określonych zdarzeń. Przykładowo zbiór Ž1 = {0.5/Z7.5, 1/Z8, 0.3/Z8.5}, odnoszący
się do zużycia paliwa pewnego samochodu, oznacza, że jest całkowicie możliwe, iż wynosi ono około 8 litrów. Pozostałe warianty uzyskały niższą ocenę. Do określenia zbioru Ž1
zostały wykorzystane odpowiednio zdefiniowane zbiory rozmyte pierwszego typu Z7.5, Z8
i Z8.5. Zbiory te są przykładami liczb rozmytych – zbiorów rozmytych określonych na zbiorze liczb rzeczywistych [14]. Wykresy ich funkcji przynależności mają często kształt trójkąta lub trapezu (rys. 1). Takie liczby rozmyte nazywamy trójkątnymi lub trapezoidalnymi.
Na rys. 1 przedstawiono wykresy funkcji przynależności dla dwóch różnych interpretacji
pojęcia „Liczba rzeczywista około 8”. Funkcję przynależności można przedstawić za pomocą czterech wartości określających położenie wykresu. W tym celu wystarczy podać
odcięte początku i końca górnej podstawy trapezu oraz odległości między początkami
i końcami obydwóch podstaw. Dla liczb rozmytych z rysunku 1 są to: (8, 8, 0.4, 0.4) oraz
(7.8, 8.2, 0.2, 0.2). Jedną z interpretacji zbioru rozmytego poziomu drugiego – którą będziemy przyjmować w niniejszym rozdziale – jest więc rozkład możliwości zbudowany z zastosowaniem klasycznych zbiorów rozmytych. Szczegóły modelowania niepełnych informacji
za pomocą zbiorów rozmytych poziomu drugiego zostały omówione w pracy [11].
µ
1
1
0
7.6
8
8.4
Rys. 1. Liczba rzeczywista około 8
x
0
pl
s.
µ
7.6
7.8
8.2
8.4
x
Ocena równości rozkładów możliwości dokonywana na podstawie wzorów 2 i 3 nie
uwzględnia stopnia bliskości elementów rozważanej przestrzeni. Przy zbiorach rozmytych
poziomu drugiego może mieć to szczególnie istotne znaczenie. Porównajmy podany wyżej
rozkład możliwości Ž1 z rozkładem Ž2 = {0.5/Z7.7, 1/Z8.2, 0.3/Z8.7}. Na podstawie wzorów
2 i 3 otrzymujemy Poss = Nec = 0. Przyjmijmy, że występujące w Ž1 i Ž2 liczby rozmyte
172
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Normalizacja relacji z atrybutami rozmytymi poziomu drugiego
w
są określone następująco: µZ7.5 = (7.5, 7.5, 0.2, 0.2), µZ7.7 = (7.7, 7.7, 0.2, 0.2), µZ8 = (7.9,
8.1, 0.2, 0.2), µZ 8.2 = (8.2, 8.2, 0.2, 0.2), µZ 8.5 = (8.5, 8.5, 0.2, 0.2), µZ 8.7 = (8.7, 8.7, 0.2,
0.2). Widać więc, że rozpatrywane rozkłady nie są od siebie zbyt odległe. Wystąpienie
w dużym stopniu sobie równych liczb rozmytych Z8 i Z8.2 jest w obu rozkładach całkowicie
możliwe (w stopniu 1).
Opis zbioru rozmytego poziomu drugiego można uzupełnić za pomocą relacji bliskości
Rc. Jest to relacja zwrotna i symetryczna. Jej elementy są równe miarom bliskości zastosowanych zbiorów rozmytych typu pierwszego. Ocenę stopnia bliskości zbiorów A i B można
dokonać na podstawie wysokości ich iloczynu [2]:
≈ (A, B) = supx min (µA (x), µB (x))
(10)
w
Dla zbiorów z przykładu 3 relacja bliskości została przedstawiona w tabeli 2.
Tabela 2. Relacja bliskości
w
Z7.5
1
0.5
0
0
0
0
Z8
0
0.5
1
0.75
0
0
Z8.2
0
0
0.75
1
0.25
0
Z8.5
0
0
0
0.25
1
0.5
Z8.7
0
0
0
0
0.5
1
da
.b
Z7.5
Z7.7
Z8
Z8.2
Z8.5
Z8.7
Z7.7
0.5
1
0.5
0
0
0
Bliskość zbiorów rozmytych typu pierwszego można uwzględnić przez wprowadzenie
do wzorów 2 i 3 relacji bliskości [9]:
Poss (π1 =π2) = supx,y min (µRc(x, y), π1 (x), π2 (y))
(11)
Nec (π1 =π2) = 1 - supx,y min ((1 – µRc(x, y)), π1 (x), π2 (y))
(12)
pl
s.
Dla zbiorów Ž1 i Ž2 otrzymujemy Nec = 0.5 i Poss = 0.75. Ocena równości znacznie się
powiększyła, co było do przewidzenia ze względu na podobnie zdefiniowane zbiory
Z8 i Z8.2, których wystąpienie w obydwóch rozkładach jest całkowicie możliwe.
Przykład 2. Rozważmy relację PZ2 przedstawioną w tabeli 3. Wartości pojemności
i zużycia paliwa przedstawiono za pomocą zbiorów rozmytych poziomu drugiego. Występujące w relacji liczby rozmyte są określone następująco: µP1200 = (1200, 1200, 100, 100),
µP1250 = (1250, 1250, 100, 100), µP1500 = (1500, 1550, 0, 100), µP1600 = (1600, 1600, 100, 0),
µZ8 = (8, 8, 0.5, 0.5), µZ8.5 = (8.5, 8.5, 0.5, 0.5), µZ9.5 = (9.5, 9.5, 0.5, 0.5), µZ8 = (10, 10, 0.5,
0.5), µZ10.5 = (10.5, 10.5, 0.5, 0.5). Odpowiadające im wyrazy macierzy bliskości
Rc przyjmują następujące wartości: Rc (P1200, P1250) = 0.75, Rc (P1500, P1600) = 0.75,
Rc (Z8, Z8.5) = 0.5, Rc (Z9.5, Z10) = 0.5, Rc (Z10, Z10.5) = 0.5. Atrybuty relacji PZ spełniają
zależność P →0.5, 0.8Z. Mamy bowiem: Nt1, t2(P) = 0.75, Πt1, t2(P) = 1, Nt1, t2(Z) = 0.5,
Πt1, t2(Z) = 0.8, Nt3, t4(P) = 0.75, Πt3, t4(P) = 0.75, Nt3, t4(Z) = 0.5, Πt3, t4(Z) = 1.
173
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
K. Myszkorowski
Tabela 3. Relacja PZ2 – przykład 3
w
P
Z
t1
1/P1200
1/Z8
t2
{1/P1200, 0.6/P1250}
{0.8/Z8, 1/Z8.5}
t3
{1/P1500, 0.5/P1600}
{0.5/ Z9.5, 1/ Z10}
t4
{0.6/ P1500, 1/ P1600}
{1// Z10, 0.6/ Z10.5,}
w
4 Rozmyte postacie normalne
R1:
R2:
R3:
R4:
R5:
R6:
R7:
da
.b
w
Rozważania niniejszego rozdziału dotyczą relacji, w których wartości atrybutów są wyłącznymi rozkładami możliwości. Oznacza to, że atrybut może przyjąć dokładnie jedną wartość
ze swojej dziedziny. Relacje takie występują w pierwszej rozmytej postaci normalnej
(F1NF). Wyższe postacie normalne dla tak zdefiniowanych relacji były przedmiotem prac
Chena. W tym punkcie dokonamy ich rozszerzenia uwzględniając zastosowanie zbiorów
rozmytych poziomu drugiego przy określaniu wartości atrybutów.
Dalsza normalizacja polega na analizie zależności funkcyjnych, których stopień jest
określony za pomocą pary liczb z przedziału [0, 1]. Przydatne są przy tym rozszerzone reguły Armstronga. W pracy [7] wykazano, ze są one spełnione dla zależności zdefiniowanych za pomocą rozszerzonego implikatora Gödela:
Y ⊆ X ⇒ X →α ,β Y dla dowolnych α i β ,
X →α ,β Y ⇒ XZ →α ,β YZ
X →φ1, φ2 Y ∧ Y →λ1, λ2 Z⇒ X →γ1, γ2 Z, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) .
X →φ1, φ2 Y ∧ X →λ1, λ2 Z⇒ X →γ1, γ2 YZ, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) .
X →φ1, φ2 Y ∧ WY →λ1, λ2 Z⇒ XW →γ1, γ2 Z, gdzie γ1 = min(φ1, λ1), γ2 = min(φ2, λ2) .
X →α ,β Y ∧ Z ⊆ Y ⇒ X →α ,β Z
X →φ1, φ2 Y ⇒ X →γ1, γ2 Y, gdzie γ1 ≤ φ1, γ2 ≤ φ2
pl
s.
Druga postać normalna dotyczy zależności poszczególnych atrybutów od klucza. Przy
rozmytych wartościach atrybutów możemy mówić o pewnym poziomie klucza, czyli
o stopniu, w jakim krotki relacji są przez niego identyfikowane. Jest to stopień zależności
K →α, βU, gdzie K oznacza klucz relacji, a U jest zbiorem jej atrybutów. Zgodnie z pojęciem klucza zależność K →α, βU musi być pełna, co oznacza, że nie istnieje podzbiór K’⊂
K, taki że K →α, βU. Atrybuty należące do K nazywamy (α, β)-kluczowymi. Poziom
zależności K →α, βU jest określony przez dwa składniki. Wartość β określa możliwość
identyfikacji krotek przez atrybut K. Sama miara możliwości nie zawiera wystarczającej informacji. Istotna jest także ocena możliwości zdarzenia przeciwnego, czyli tego że K nie
identyfikuje krotek. Niewielka jej wartość zwiększa stopień przekonania o roli atrybutu
K jako klucza relacji. Odejmując uzyskaną ocenę od 1 otrzymujemy miarę konieczności,
która jest równa mierze braku możliwości wystąpienia zdarzenia przeciwnego.
Pełna zależność K →α, βU nie implikuje pełnej zależności od klucza poszczególnych
atrybutów. Może bowiem istnieć atrybut A ∈ U, dla którego zależność K →α, βA jest co
prawda spełniona, ale jej lewa strona może zawierać nadmiarowe elementy. Druga postać
174
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
Normalizacja relacji z atrybutami rozmytymi poziomu drugiego
normalna eliminuje istnienie niepełnych zależności od klucza poszczególnych atrybutów
relacji.
w
Definicja 4. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej drugiej postaci normalnej
((α, β)-F2NF), jeżeli dla każdego atrybutu (α, β)-niekluczowego A jest spełniona zależność
K →α, β A i jest to zależność pełna.
Kolejny etap normalizacji dotyczy zależności przechodnich, czyli takich, które wynikają
z trzeciej reguły Armstronga. Zależności takie nie mogą istnieć w relacjach o schematach
spełniających warunki definicji trzeciej postaci normalnej, która wymaga, by atrybuty (α,
β) - niekluczowe nie identyfikowały innych atrybutów niekluczowych.
w
w
Definicja 5. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej trzeciej postaci normalnej
((α, β)-F3NF), jeżeli dla każdej zależności funkcyjnej X →α, β Y, gdzie X, Y ⊆ U,
U = {X1, X2, … , Xn} oraz Y ∉ X, X zawiera (α, β)-klucz relacji lub Y jest atrybutem
(α, β)-kluczowym.
Jeżeli zażądamy, by po lewej stronie zależności funkcyjnej mogły występować tylko
klucze, to otrzymamy postać normalną Boyce’a-Codda.
da
.b
Definicja 6. Schemat R(X1, X2, … , Xn) jest w (α, β)-rozmytej postaci normalnej Boyce’aCodda ((α, β)-BCNF), jeżeli dla każdej zależności funkcyjnej X →α, β Y, gdzie X, Y ⊆ U,
U = {X1, X2, … , Xn} oraz Y ∉ X, X zawiera (α, β)-klucz relacji.
Przykład 3. Rozważmy relację R opisującą własności pewnego zbioru samochodów. Jej
atrybutami są: P – pojemność, W – wiek samochodu, Z – zużycie paliwa, V – maksymalna
szybkość, C – cena i K – koszty eksploatacji. Istnieją między nimi następujące zależności:
P →0.5, 0.8Z, P →0.6, 1V, PW →0.7, 1C, WZ →0.8, 1K. Kluczem jest PW. Na podstawie reguł
Armstronga mamy bowiem:
pl
s.
P →0.5, 0.8 Z ⇒ PW →0.5, 0.8Z (reguły R2 i R6)
P →0.6, 1V ⇒ PW →0.6, 1V (reguły R2 i R6)
PW →0.5, 0.8Z ∧ WZ →0.8, 1K ⇒ PW →0.5, 0.8K (reguła R5)
Jest to klucz na poziomie (0.5, 0.8). Istnienie zależności P →0.5, 0.8Z i P →0.6, 1V jest
niezgodne z warunkami definicji trzeciej (także i drugiej) postaci normalnej. W celu ich
spełnienia należy wykonać rozkład na relacje o schematach: PZV(P, Z, V) – postać (0.5,
0.8)-BCNF, WZK(W, Z, K) – postać (0.8, 1)-BCNF i PWC(P, W, C) – postać (0.7, 1)BCNF.
4 Zakończenie
Przedstawione w rozdziale definicje postaci normalnych stanowią rozszerzenie definicji
sformułowanych dla rozmytych baz danych z atrybutami o wartościach modelowanych za
pomocą klasycznych zbiorów rozmytych. Jest to konsekwencja zastosowania do opisu wartości atrybutów bardziej złożonych konstrukcji, jakimi są zbiory rozmyte poziomu drugiego. Zmodyfikowano również definicję rozmytej zależności funkcyjnej, której poziom jest
175
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008
Rozdział monografii: 'Bazy Danych: Rozwój metod i technologii', Kozielski S., Małysiak B., Kasprowski P., Mrozek D. (red.), WKŁ 2008
K. Myszkorowski
określony za pomocą pary liczb z przedziału [0, 1]. Zastosowano przy tym rozszerzony
implikator Gödela.
Literatura
1.
w
Alcalde C., Burusco A., Fuentes-Gonzalez R.: A constructive method for the definition of
interval-valued fuzzy implication operators. Fuzzy Sets and Systems, 153, 2005.
Chen G.Q.: Fuzzy logic in Data Modeling – semantics, constraints and database design. Kluwer,
Boston, 1998.
Deschrijver G., Kerre E.E.: Implicators based on binary aggregation operators in interval-valued
fuzzy set theory. Fuzzy Sets and Systems, 152, 2005.
Elmasri R., Navathe S.B.: Wprowadzenie do systemów baz danych. Wydawnictwo Helion,
Gliwice 2005.
Fedrizzi M., Kacprzyk J.: A Brief Introduction to Fuzzy Sets. In Studies in Fuzziness: Fuzziness
in Database Management Systems, P.Bosc and J. Kacprzyk (Eds.) Physica Verlag, 1995.
Łachwa A.: Rozmyty świat zbiorów, liczb, relacji, faktów, reguł i decyzji. Akademicka Oficyna
Wydawnicza EXIT, Warszawa 2001.
Nakata M.: On Inference Rules of Dependencies in Fuzzy Relational Data Models: Functional
Dependencies. In Studies in Fuzziness and Soft Computing: Knowledge Management in Fuzzy
Databases, Pons O., Vila M., Kacprzyk J. (Eds.), Physica Verlag, 2000.
Petry F.: Fuzzy Databases: Principles and Applications. Kluwer Academic Publishers, 1996.
Prade H., Testemale C.: Generalizing Database Relational Algebra for the Treatment of
Incomplete or Uncertain Information and Vague Queries. Information Science, 34: 115-143,
1984.
Shenoi S., Melton A., Fan L.T.: Functional Dependencies and Normal Forms in the Fuzzy
Relational Database Model. Information Sciences, 60, 1992.
de Tre G., de Caluwe R.: Level-2 fuzzy sets and their usefulness in object-oriented database
modeling. Fuzzy Sets and Systems, 140, 2003.
Zadeh L. A.: Fuzzy sets. Information and Control 8, 1965.
Zadeh L. A.: Fuzzy sets as a basis for a theory of possibility. Fuzzy Sets and Systems, 1, 1978.
Zadrożny S.: Zapytania nieprecyzyjne i lingwistyczne podsumowania baz danych. Akademicka
Oficyna Wydawnicza EXIT, Warszawa 2006.
2.
3.
5.
6.
7.
10.
11.
12.
13.
14.
da
.b
8.
9.
w
w
4.
pl
s.
176
(c) Copyright by Politechnika Śląska, Instytut Informatyki, Gliwice 2008

Podobne dokumenty