postgresql – praktyczne podejście

Transkrypt

postgresql – praktyczne podejście
POSTGRESQL – PRAKTYCZNE PODEJŚCIE
WYŻSZA SZKOŁA BIZNESU – NATIONAL-LOUIS UNIVERSITY
KOŁO NAUKOWE SYSTEMÓW OPEN SOURCE
ŁUKASZ CPAK
PIOTR LEŚNIAK
NOWY SĄCZ, 2007
Temat: Baza danych sklepu.
Sklep sprzedaje towary podzielone na kategorie i dostawców. W bazie powinni być również klienci wraz z
dokonanymi zakupami. Raporty powinny zawierać przychody i koszty ze sprzedaży z podziałem na klientów,
dostawców oraz kategorie produktów.
Projekt wykonany z wykorzystaniem wyłącznie narzędzi OpenSource przez co wykonanie takiej bazy w
rzeczywistości jest o wiele tańsze (i lepsze??) niż rozwiązania komercyjne. Filarem jest serwer PostgreSQL v8.1.5
działający na platformie Gentoo Linux.
W ramach projektu wykonaliśmy także procedurę tworzenia kopii zapasowej bazy danych. Informacje na ten temat
znajdują się w rozdziale „Backup bazy danych”.
Zaproponowaliśmy także rozwiązania sprzętowe mające na celu zabezpieczenie danych przy użyciu macierzy
dyskowych (rozdział „Bezpieczeństwo dzięki RAID”).
Oprogramowanie bazy danych opisane jest dokładnie w rozdziale „O bazie/omówienie poszczególnych
elementów”.
Nie zapomnieliśmy o mechanizmie replikacji bazy danych (rozdział „Replikacja”).
Elementy, których nie udało nam się wykonać, a powinny znaleźć się w wersji finalnej opisaliśmy w rozdziale
„Dodatkowe.”
Zapraszamy do lektury!
Narzędzia wykorzystywane przy tworzeniu bazy:
pgAdmin3:
Kpogre:
Schemat bazy (DbVisualizer):
Konsola systemu Linux :)
O bazie:
Baza danych ma umożliwiać przechowywanie danych oraz ułatwiać ich wykorzystanie zgodnie z ideą
działania sklepu.
Baza została zaprojektowana do przechowywania informacji o sprzedawanych towarach umożliwiając
podzielenie ich na kategorie, dostawcach towarów, klientach oraz fakturach, a także firmach wysyłkowych
dostarczających towary do klientów. Na każdej fakturze możliwe jest umieszczenie wielu pozycji odpowiadających
sprzedawanym towarom. Jedna faktura nie może być wystawiona dla więcej niż jednego klienta. Nie można także
umieścić na niej więcej niż jednej pozycji dotyczącej tego samego towaru. Wszystkie pola z przedrostkiem ID w
nazwie (IDTowaru, IDDostawcy itd.) są numerowane automatycznie z jednostkowym przyrostem zaczynając od 1.
Dzięki takiemu podejściu nie tracimy informacji dotyczących przeszłości działania firmy, a także możemy zdjąć z
użytkownika bazy obowiązek dbania o niepowtarzalność tych pól. Oprogramowanie bazy ma także umożliwiać
łatwy dostęp do informacji o najlepszych klientach, a także automatycznie obliczać rabaty do faktur na podstawie
wartości wcześniejszych zakupów danego klienta, jak i automatycznie wyliczać wartość do zapłaty na fakturze. Jest
także zaimplementowana prosta obsługa magazynu polegająca na automatycznej zmianie wartości odpowiadających
ilości towarów na magazynie lub w zamówieniach u dostawców o odpowiednią wartość pobraną z dodawanych do
faktur pozycji. Zarówno tworzenie nowych faktur jak i dodawanie do nich pozycji zrealizowane jest za pomocą
procedur sprawdzających spełnienie odpowiednich warunków i wypełniających automatycznie wybrane pola tak, aby
zminimalizować możliwość błędnego wprowadzenia danych przezużytkownika.
Baza zawiera 7 tabel.
–
Dane zostały rozmieszczone tak, aby uniknąć powtórzeń.
–
Kluczami głównymi są automatycznie numerowanepola ID.
–
Między tabelami utworzone są więzy na pola ID, dzięki czemu nie ma potrzeby powtarzania innych danych w
tabelach.
Powiązania między tabelą Towary a tabelami Kategorie i Dostawcy popierają założenie podzielenia towarów
na kategorie i dostawców oraz uniemożliwiają dodanie towaru dla nieistniejącej kategorii lub dostawcy. Tabela
PozycjeFaktur ma dwa klucze główne, aby możliwe było tworzenie wielu pozycji dla jednej faktury. Zgodnie z
logiką nie jest możliwe stworzenie na jednej fakturze więcej niż jednej pozycji dotyczącej tego samego towaru.
Powiązania między tabelami Faktury i PozycjeFaktur uniemożliwiają stworzenie pozycji dla nieistniejącej
faktury. Tabela PozycjeFaktur powiązana jest także z tabelą Towary, aby uniemożliwić wpisanie na fakturę
nieistniejącego towaru.
Tabela Faktury powiązana jest z tabelami Wysylka oraz Klienci co uniemożliwia stworzenie faktury dla
klienta i wysyłki, które nie istnieją w bazie.
W tablicy Towary pole CenaKupna zawiera cenę towaru u dostawcy, CenaSprzedaży to cena wyjściowa (bez
zniżek) dla klienta. Pole IloscWmagazynie zawiera liczbę reprezentującą ilość danego towaru w magazynie, a pole
IloscWzamówieniach liczbę reprezentującą ilość danego towaru, który należy zamówić u dostawcy.
Omówienie poszczególnych elementów:
1. WIDOKI
TrzechNajlepszych:
CREATE OR REPLACE VIEW trzechnajlepszych AS
SELECT f.idklienta, sum(pf.ilosc * t.cenasprzedazy) AS suma
FROM pozycjefaktur pf
JOIN towary t ON pf.idtowaru = t.idtowaru
JOIN faktury f ON pf.idfaktury = f.idfaktury
GROUP BY f.idklienta
ORDER BY sum(pf.ilosc * t.cenasprzedazy) DESC
LIMIT 3;
wyświetla IDKlienta oraz sumę wszystkich zamówien dla trzech najlepszych klientów sklepu. IDKlienta, które
widok ten wyświetla umożliwia uzyskanie wszelkich danych o klientach, którzy zostawili najwięcej pieniędzy w
sklepie.
Wspolnemiasto:
CREATE OR REPLACE VIEW wspolnemiasto AS
SELECT d.nazwadostawcy, d.adres AS "Adres dostawcy", d.telefon AS
"Tel dostawcy",k.nazwaklienta, k.adres AS "Adres klienta", k.miasto, k.kodpocztowy
FROM dostawcy d JOIN klienci k ON d.kodpocztowy::text = k.kodpocztowy::text;
wyświetla dostawców i klientów pochodzących z tego samego miasta wraz z ich danymi adresowymi. Widok ten
może być pomocny w redukcji kosztów zamówienia (jeżeli dostawca i klient są z tego samego miasta to może nie
być konieczne wysyłanie towaru ze sklepu).
Wyswietldostawcow:
CREATE OR REPLACE VIEW wyswietldostawcow AS
SELECT d.iddostawcy, d.nazwadostawcy, d.miasto, d.adres, d.kodpocztowy, d.telefon,
t.nazwatowaru,
t.idtowaru, k.nazwakategorii, k.idkategorii, t.cenakupna AS cena,
t.iloscwzamowieniach
FROM dostawcy d
JOIN towary t ON d.iddostawcy = t.iddostawcy
JOIN kategorie k ON t.idkategorii = k.idkategorii;
wyświetla najważniejsze dane związane ze wszystkimi dostawcami w bazie. Daje szybki dostęp do wszystkich
informacji o towarach, w jakie zaopatrzają sklep, ilości zamówionych u nich towarów oraz dane potrzebne do
ewentualnego kontaktu lub dalszego poszukiwania informacji.
WyswietlFaktury:
CREATE OR REPLACE VIEW wyswietlfaktury AS
SELECT f.idfaktury, k.nazwaklienta, f.idklienta, f.data, ( SELECT count(*) AS count
FROM pozycjefaktur pf
WHERE pf.idfaktury = f.idfaktury) AS "Ilosc pozycji na fakturze"
FROM faktury f
JOIN klienci k ON f.idklienta = k.idklienta;
wyświetla podstawowe informacje o wszystkich fakturach w bazie. Wyświetlane dane zawierają IDFaktury, nazwę
klienta, jego ID, datę utworzenia faktury oraz liczbę pozycji, które dana faktura zawiera.
Zamowionetowary:
CREATE OR REPLACE VIEW zamowionetowary AS
SELECT t.nazwatowaru, t.idtowaru, d.nazwadostawcy, t.iddostawcy, k.nazwakategorii,
t.idkategorii, t.iloscwzamowieniach AS "Zamowiona ilosc"
FROM towary t
JOIN dostawcy d ON t.iddostawcy = d.iddostawcy
JOIN kategorie k ON t.idkategorii = k.idkategorii
WHERE t.iloscwzamowieniach > 0;
wyświetla towary, na które złożone jest zamówienie i których tym samym nie ma w magazynie. Widok wyświetla
także kategorię, do której należy dany towar oraz zamówioną ilość i dostawcę, u którego jest zamówiony. Widok
może być często wykorzystywany, np. jako podstawa udzielenia klientowi informacji o przewidywanym czasie
realizacji zamówienia.
2. Funkcje ( w PostgreSQL nie ma typowych procedur, zastępujemy je funkcjami zwracającymi VOID)
gettimestamp:
CREATE FUNCTION "gettimestamp" ( ) RETURNS timestamp AS '
DECLARE
cur_time timestamp;
BEGIN
cur_time = ''now'';
RETURN cur_time;
END;
Służy do pobierania daty dla funkcji dodajfakture
dodajDoFaktury:
CREATE OR REPLACE FUNCTION dodajdofaktury(int4, int4, int4)
RETURNS void AS
$BODY$
BEGIN
IF EXISTS(SELECT * FROM Faktury WHERE IDFaktury=$1)
THEN
IF EXISTS(SELECT * FROM Towary WHERE IDTowaru=$2)
THEN
INSERT INTO PozycjeFaktur (IDFaktury, IDTowaru, Ilosc) VALUES($1,$2,$3);
ELSE
RAISE EXCEPTION "Towar o podanym IDTowaru nie istnieje!";
END IF;
ELSE
RAISE EXCEPTION "Faktura o podanym IDFaktury nie istnieje!";
END IF;
END;
wstawia do faktury nową pozycję. Pobiera od użytkownika IDFaktury, do której pozycja ma być dodana, ID oraz
ilość towaru, którego pozycja ma dotyczyć. Następnie sprawdzane jest istnienie faktury oraz towaru o podanych ID.
Jeśli wszystko jest w porządku nowa pozycja zostaje dopisana do faktury. Procedura ułatwia użytkownikowi obsługę
dodawania nowych pozycji faktur i minimalizuje ryzyko błędu przy wprowadzaniu danych.
Dodajfakture:
CREATE OR REPLACE FUNCTION dodajdofaktury
(IDFaktury_ integer,IDTowaru_ integer,Ilosc_ integer) RETURNS void
AS'
BEGIN
IF EXISTS(SELECT * FROM Faktury WHERE IDFaktury=IDFaktury_)
THEN
IF EXISTS(SELECT * FROM Towary WHERE IDTowaru=IDTowaru_)
THEN
INSERT INTO PozycjeFaktur (IDFaktury, IDTowaru, Ilosc)
VALUES(IDFaktury_,IDTowaru_,Ilosc_);
--ELSE
--RAISE EXCEPTION "Towar o podanym IDTowaru nie istnieje!";
END IF;
--ELSE
-- RAISE EXCEPTION "Faktura o podanym IDFaktury nie istnieje!";
END IF;
END;'
dodaje nową fakturę. Pobiera od użytkownika IDKlienta, którego faktura ma dotyczyć oraz IDWysylki, którą towar
ma być wysłany. Następnie sprawdza istnienie klienta i wysyłki o podanym ID. Jeżeli wszystko jest w porządku do
tabeli wstawiana jest nowa faktura zawierająca IDKlienta, IDWysylki, datę pobraną poprzez getdate() oraz rabat
obliczony przy użyciu funkcji PoliczRabat(IDKlienta_). Procedura ogranicza udział użytkownika do podania dwóch
wartości i uzupełnia pozostałe upraszczając proces, przez co zmniejsza się ryzyko błędu i ruch w sieci.
Policzrabat:
CREATE OR REPLACE FUNCTION policzrabat(idklienta_ int4)
RETURNS float8 AS
DECLARE temp numeric;
DECLARE rabat float = 0.0;
BEGIN
temp=(SELECT SUM(Ilosc*CenaSprzedazy) FROM PozycjeFaktur pf
JOIN Towary t ON pf.IDTowaru=t.IDTowaru
JOIN Faktury f ON pf.IDFaktury=f.IDFaktury
WHERE f.IDKlienta=IDKlienta_);
IF (temp>=1000 AND temp<3000) THEN
rabat=0.05;
END IF;
IF (temp>=3000 AND temp<10000) THEN
rabat=0.07;
END IF;
IF (temp>=10000) THEN
rabat=0.1;
END IF;
RETURN rabat;
END;
oblicza rabat dla klienta o zadanym IDKlienta. Jest wykorzystywana w funkcji WyswietlFakture. Rabat obliczany jest
na podstawie wartości wszystkich zamówień klienta według następujących kryteriów:
dla 1000 - 3000 PLN rabat 5%
dla 3000 - 10000 PLN rabat 7%
dla 10000 i więcej rabat 10%
wartoscFaktury:
CREATE OR REPLACE FUNCTION wartoscfaktury(idfaktury_ int4)
RETURNS int4 AS
DECLARE Suma integer;
BEGIN
Suma=(SELECT SUM(Ilosc*CenaSprzedazy) FROM PozycjeFaktur pf JOIN Towary t
ON t.IDTowaru=pf.IDTowaru
WHERE pf.IDFaktury=IDFaktury_
GROUP BY IDFaktury );
RETURN Suma;
END;
oblicza wartość faktury o podanym IDFaktury sumując wartości wszystkich jej pozycji. Jest wykorzystywana w
funkcji WyswietlFakture.
WyswietlFakture:
CREATE OR REPLACE FUNCTION wyswietlfakture(idfaktury_ int4)
RETURNS void AS
DECLARE temp_wartosc numeric;
DECLARE temp_rabat float;
DECLARE temp_rabat_percent int;
DECLARE do_zaplaty numeric;
BEGIN
IF EXISTS(SELECT * FROM Faktury WHERE IDFaktury=IDFaktury_)
THEN
temp_wartosc= (SELECT WartoscFaktury(IDFaktury_));
temp_rabat= (SELECT Rabat FROM Faktury WHERE IDFaktury=IDFaktury_);
temp_wartosc = temp_wartosc - temp_wartosc * temp_rabat;
temp_rabat_percent=temp_rabat*100;
do_zaplaty= (SELECT KosztWysylki FROM Wysylka JOIN Faktury
ON Wysylka.IDWysylki=Faktury.IDWysylki
WHERE Faktury.IDFaktury=IDFaktury_);
do_zaplaty = do_zaplaty + temp_wartosc;
SELECT IDFaktury, Faktury.IDKlienta, NazwaKlienta, NazwaWysylki,
WartoscFaktury(IDFaktury_) AS "Wartosc faktury",
temp_rabat_percent AS "Rabat %",
temp_wartosc AS "Wartosc z rabatem",
KosztWysylki, do_zaplaty AS "Do zaplaty",
Data
FROM Faktury JOIN Klienci ON Faktury.IDKlienta=Klienci.IDKlienta
JOIN Wysylka ON Faktury.IDWysylki=Wysylka.IDWysylki
WHERE Faktury.IDFaktury=IDFaktury_;
ELSE
RAISE EXCEPTION "Faktura o podanym IDFaktury nie istnieje!";
END IF;
END;
wyświetla fakturę o podanym przez użytkownika IDFaktury. Po sprawdzeniu czy zadana faktura istnieje wyświetlane
są wszystkie dotyczące jej informacje wraz z obliczonymi: rabatem, wartością faktury, wartością po zastosowaniu
rabatu oraz kwotą do zapłaty uwzględniającą także koszty wysyłki. Procedura ta w znaczący sposób upraszcza prace
z bazą. Wykonuje większość pracy na serwerze zmniejszając ruch w sieci.
WyswietlpozycjeFaktury:
CREATE OR REPLACE FUNCTION wyswietlpozycjefaktury(idfaktury_ int4)
RETURNS void AS
BEGIN
IF EXISTS (SELECT * FROM Faktury WHERE IDFaktury=IDFaktury_)
THEN
SELECT pf.IDfaktury, pf.IDTowaru, t.NazwaTowaru, pf.Ilosc,
t.CenaSprzedazy AS "Cena jednostki"
FROM PozycjeFaktur pf JOIN Towary t ON pf.IDTowaru=t.IDTowaru
WHERE pf.IDFaktury=IDFaktury_;
ELSE
RAISE EXCEPTION "Faktura o podanym IDFaktury nie istnieje!";
END IF;
END;
wyświetla wszystkie pozycje faktury o podanym IDFaktury. Funkcja ułatwia pracę z bazą i ułatwia pozyskiwanie
informacji.
3. Triggery
Triggery w PostgreSQL różnią się od tych w MSSQL. W ciele triggera podajemy warunki przy jakich trigger ma
wykonywać tzw. Trigger Function.
magazynzamowienia:
CREATE TRIGGER magazynzamowienia
AFTER UPDATE
ON towary
FOR EACH ROW
EXECUTE PROCEDURE mag_zam();
CREATE OR REPLACE FUNCTION mag_zam()
RETURNS "trigger" AS
DECLARE IDTowaru int;
BEGIN
IDTowaru=(SELECT IDTowaru FROM Inserted);
IF (SELECT IloscWmagazynie FROM Towary WHERE Towary.IDTowaru=IDTowaru)<0
THEN
UPDATE Towary
SET IloscWzamowieniach=IloscWzamowieniach-IloscWmagazynie WHERE IDTowaru IN
(SELECT IDTowaru FROM Inserted);
UPDATE Towary
SET IloscWmagazynie=0 WHERE IDTowaru IN
(SELECT IDTowaru FROM Inserted);
END IF;
END;
uaktualnia pole IloscWzamowieniach w tablicy Towary dla towaru, dla którego IloscWmagazyniespadła poniżej
zera. Wartość w polu IloscWzamowieniach zwiększanajest w takiej sytuacji o wartość jaka jest „na minusie” w polu
IloscWmagazynie. Na koniec pole IloscWmagazynie ustawiane jest na 0 tak, aby nie było tam już wartości ujemnej.
Dodajpunkty:
CREATE TRIGGER punkty
AFTER INSERT OR UPDATE
ON faktury
FOR EACH ROW
EXECUTE PROCEDURE dodaj_punkt();
CREATE OR REPLACE FUNCTION dodaj_punkt()
RETURNS "trigger" AS'
begin
UPDATE KLIENCI SET punkty=punkty+1 WHERE IDKlienta IN (SELECT IDKlienta FROM
Faktury
WHERE Data=gettimestamp());
RETURN NEW;
end;
zwiększa wartość pola Punkty w tabeli Klienci dla klienta, na którego wystawiana jest nowa faktura. Dzięki wartości
w polu Punkty można łatwo stwierdzić, którzy klienci robią najczęściej zakupy.
Zabierzzmagazynu:
CREATE TRIGGER zabierzzmagazynu
AFTER INSERT
ON pozycjefaktur
FOR EACH ROW
EXECUTE PROCEDURE zabierz();
CREATE OR REPLACE FUNCTION zabierz()
RETURNS "trigger" AS'
DECLARE Ilosc integer;
DECLARE IDTowaru_ integer;
BEGIN
Ilosc=(SELECT Ilosc FROM pozycjefaktur JOIN faktury
ON pozycjefaktur.IDFaktury=Faktury.IDFaktury);
IDTowaru_=(SELECT Idtowaru FROM pozycjefaktur JOIN faktury
ON pozycjefaktur.IDFaktury=Faktury.IDFaktury);
UPDATE Towary SET IloscWmagazynie=IloscWmagazynie-Ilosc
WHERE IDTowaru=IDTowaru_;
RETURN NEW;
END;'
uaktualnia pole IloscWmagazynie w tabeli Towary odejmując ilość danego towaru, na który wystawiana jest nowa
pozycja faktury.
Backup bazy danych:
Pracując nad naszym projektem nie zapomnieliśmy oczywiście o zaimplementowaniu procedury backup'owania
naszej bazy danych. Do tego celu wykorzystaliśmy konsolowe narzędzia o nazwie pg_dump oraz psql.
Pierwsze z nich służy do backup'owania bazy danych do pliku wyjściowego będącego skryptem sql zawierającym
zestaw poleceń, który może służyć do odzyskania całej bazy danych.
Składnia polecenia prezentuje się następująco: 'pg_dump nazwa_bazy > backup.out
postgres$ pg_dump pbd2v2 > pbd2v2.out
Istnieje również możliwość wykonania kopii zapasowej wszystkich baz danych znajdujących się na serwerze.
Można to osiągnąć przy użyciu narzędzia o nazwie pg_dumpall
postgres$ pg_dumpall > backup.out
Po wykonaniu powyższego polecenia w pliku backup.out znajdzie się kopia wszystkich baz danych z serwera.
Nawet najlepsze narzędzie służące do wykonywania backup'u bazy danych jest jednak niewiele warte jeśli przy
wykonywaniu każdej kopii wymaga udziału administratora.
Z tego właśnie powodu postanowiliśmy zautomatyzować ten proces. I tutaj znów z pomocą przyszła nam szeroka
elastyczność OpenSource. Napisaliśmy skrypt powłoki wykonujący backup istniejących na serwerze baz danych za
nas. Kopie baz danych zapisywane są w osobnych plikach po kompresji gzip'em. Nazwy plików odpowiadają nazwą
baz danych na serwerze „nazwa_bazy.out.gz”
A oto skrypt:
#!/bin/bash
DIR=/backups/postgres/
[ ! $DIR ] && mkdir -p $DIR || :
LIST=$(psql -l -t | awk '{ print $1}' | grep -vE '^-|^List|^Name|template[0|1]')
for d in $LIST
do
pg_dump $d | gzip -c > $DIR/$d.out.gz
done
I sposób jego wykonania:
postgres$ sh nazwa_pliku_ze_skryptem
Bez zagłębiania się w szczegóły, skrypt pobiera nazwy istniejących baz danych z narzędzia psql i tworzy pliki o
odpowiednich nazwach w katalogu /backups/postgres , który w razie potrzeby tworzy.
Wykonanie tak przygotowanego skryptu możemy bez problemu zautomatyzować w systemie tak aby wykonywał się
co jakiś czas lub/i w przypadku zdarzeń takich jak np przechwyceniezdefiniowanego komunikatu w logach.
To tyle na temat wykonywania kopii zapasowej, a teraz o jej przywracaniu.
Do odzyskania bazy danych z wykonywanego wcześniej backup'u używamywspomnianego już wyżej narzędzia
psql.
W przypadku gdy chcemy odzyskać pojedynczą bazę używamy następującej składni:
'psql -d nazwa_bazy -f plik_z_backupem'
postgres$ psql -d pbd2v2 -f pbd2v2.out
W przypadku odzyskiwania więcej niż jednej bazy z pliku utworzonego przy użyciu pg_dumpall używamy polecenia
w formie: 'psql -f plik_z_backupami'
postgres$ psql -f backup.out
!UWAGA!
W razie konieczności wykonania, któregokolwiek z wyżej wymienionych poleceń z konta innego niż postgres lub
gdy właścicielem bazy jest inny użytkownik należy użyć przełącznika -U 'nazwa_wlasciciela_bazy'. Oczywiście
należy pamiętać o konieczności posiadania odpowiednich uprawnień.
root# pg_dump -U ''postgres'' pbd2v2 > pbd2v2.out
Bezpieczeństwo dzięki RAID:
Do zmniejszenia ryzyka utraty danych spowodowanego fizyczną awarią dysku twardego proponujemy zastosowanie
na serwerze macierzy dyskowej RAID6 składającej się z 4 napędów.
Wybór uzasadniamy faktem, że mimo wolniejszego zapisu w stosunku do najczęściej stosowanego RAID5
odporność na awarię systemu w wersji 6 jest dużo wyższa.
W implementacji tej generowany jest drugi blok parzystości co wymaga stosowania nie jednego a dwóch dysków
nadmiarowych. Korzyści płynących z tego rozwiązania jest kilka.
Po pierwsze w razie awarii jednego z dysków nie jest konieczna natychmiastowa wymiana napędu i jego odbudowa
gdyż macierz może pracować z pełną wydajnością, będąc jednocześnie wystarczająco bezpiecznym. Dzięki temu
możemy odłożyć odbudowę na czas mniejszego obciążenia systemu.
Co więcej w przypadku RAID6 w czasie trwania odbudowy uszkodzonego napędu cały system jest mniej obciążony
gdyż na potrzeby obsługi przychodzących zapytań dostępnych jest więcej dysków. Jest to bardzo ważne szczególnie
w czasach gdy pojemności dysków są coraz większe, a sam proces odbudowy zajmuje coraz więcej czasu. Nie
zapominajmy że w 3-napędowym RAID5 nie możemy pozwolić sobie na awarię drugiego dysku przed
zakończeniem odbudowy wcześniej uszkodzonego napędu.
Na korzyść RAID6 przemawia dodatkowo fakt, że coraz częściej w miejsce szybkich dysków SCSI czy FC wstawia
się tańsze i pojemniejsze, ale za to wolniejsze i bardziej awaryjne dyski SATA.
Replikacja:
Postanowiliśmy przetestować system replikacji (Slony1) na naszej bazie. W tym celu dodaliśmy do bazy 4 tabele (dla
celów testowych do replikacji):
history
accounts
branches
tellers
Na początku definiujemy nowe zmienne systemowe:
#!/bin/bash
export CLUSTERNAME=klaster
export MASTERDBNAME=pbd2v2
export SLAVEDBNAME=pbd2v2_slave
export MASTERHOST=localhost
export SLAVEHOST=localhost
export REPLICATIONUSER=lesiu
export PBD2V2USER=lesiu
W systemie mamy już bazę MASTER, następnym krokiem jest utworzenie bazy SLAVE:
gentoo# createdb -O $PBD2V2USER -h $SLAVEHOST $SLAVEDBNAME
gentoo# pgbench -i -s 1 -U $PBD2V2USER -h $MASTERHOST $MASTERDBNAME
Standardowo Slony-I nie kopiuje sobie bazy MASTER więc na początku należy ją skopiować do SLAVE:
gentoo#pg_dump -s -U $REPLICATIONUSER -h $MASTERHOST $MASTERDBNAME |
psql -U $REPLICATIONUSER -h $SLAVEHOST $SLAVEDBNAME
Następnie konfigurujemy naszą bazę do obsługi replikacji ( posłuży nam do tego skrypt 'slonik'):
#!/bin/sh
slonik <<_EOF_
cluster name = $CLUSTERNAME;
node 1 admin conninfo = 'dbname=$MASTERDBNAME host=$MASTERHOST
user=$REPLICATIONUSER';
node 2 admin conninfo = 'dbname=$SLAVEDBNAME host=$SLAVEHOST user=$REPLICATIONUSER';
init cluster ( id=1, comment = 'Master Node');
table add key (node id = 1, fully qualified name = 'public.history');
create set (id=1, origin=1, comment='All pgbench tables');
set add table (set id=1, origin=1, id=1, fully qualified name
table');
set add table (set id=1, origin=1, id=2, fully qualified name
table');
set add table (set id=1, origin=1, id=3, fully qualified name
table');
set add table (set id=1, origin=1, id=4, fully qualified name
table', key = serial);
= 'public.accounts', comment='accounts
= 'public.branches', comment='branches
= 'public.tellers', comment='tellers
= 'public.history', comment='history
store node (id=2, comment = 'Slave node');
store path (server = 1, client = 2, conninfo='dbname=$MASTERDBNAMEhost=$MASTERHOST
user=$REPLICATIONUSER');
store path (server = 2, client = 1, conninfo='dbname=$SLAVEDBNAME host=$SLAVEHOST
user=$REPLICATIONUSER');
store listen (origin=1, provider = 1, receiver =2);
store listen (origin=2, provider = 2, receiver =1);
_EOF_
Po wykonaniu powyższego skryptu mamy gotowe dwie bazy, wystarczy teraz uruchomić demony replikacji:
na serwerze MASTER wpisujemy:
gentoo#slon $CLUSTERNAME "dbname=$MASTERDBNAME user=$REPLICATIONUSER
host=$MASTERHOST"
a na SLAVE:
gentoo#slon $CLUSTERNAME "dbname=$SLAVEDBNAME user=$REPLICATIONUSER
host=$SLAVEHOST"
(W naszym testowym przypadku jest to jedna i ta sama maszyna)
Powinno pojawić się nam coś jak to:
Uruchamiamy replikacje poprzez skrypt:
#!/bin/sh
slonik <<_EOF_
cluster name = $CLUSTERNAME;
node 1 admin conninfo = 'dbname=$MASTERDBNAME host=$MASTERHOST user=$REPLICATIONUSER';
node 2 admin conninfo = 'dbname=$SLAVEDBNAME host=$SLAVEHOST user=$REPLICATIONUSER';
subscribe set ( id = 1, provider = 1, receiver = 2, forward = no);
_EOF_
Demony replikacji nasłuchały:
W celu sprawdzenia czy bazy są jednakowe po replikacji wykonujemy skrypt:
#!/bin/sh
echo -n "**** comparing sample1 ... "
psql -U $REPLICATIONUSER -h $MASTERHOST $MASTERDBNAME >dump.tmp.1.$$ <<_EOF_
select 'accounts:'::text, aid, bid, abalance, filler
from accounts order by aid;
select 'branches:'::text, bid, bbalance, filler
from branches order by bid;
select 'tellers:'::text, tid, bid, tbalance, filler
from tellers order by tid;
select 'history:'::text, tid, bid, aid, delta, mtime, filler,
"_Slony-I_${CLUSTERNAME}_rowID"
from history order by "_Slony-I_${CLUSTERNAME}_rowID";
_EOF_
psql -U $REPLICATIONUSER -h $SLAVEHOST $SLAVEDBNAME >dump.tmp.2.$$ <<_EOF_
select 'accounts:'::text, aid, bid, abalance, filler
from accounts order by aid;
select 'branches:'::text, bid, bbalance, filler
from branches order by bid;
select 'tellers:'::text, tid, bid, tbalance, filler
from tellers order by tid;
select 'history:'::text, tid, bid, aid, delta, mtime, filler,
"_Slony-I_${CLUSTERNAME}_rowID"
from history order by "_Slony-I_${CLUSTERNAME}_rowID";
_EOF_
if diff dump.tmp.1.$$ dump.tmp.2.$$ >$CLUSTERNAME.diff ; then
echo "Bazy są identyczne!! :)."
rm dump.tmp.?.$$
rm $CLUSTERNAME.diff
else
echo "bląd, w pliku $CLUSTERNAME.diff możesz sprawdzić jakie są różnice"
fi
Wszystko działa, jak dodamy nowe wiersze w MASTER to w SLAVE zostaną natychmiast skopiowane.
Dodatkowe:
Ze względu na trud jaki podjęliśmy, tworząc bazę przy użyciu narzędzi nie znanych nam wcześniej w obsłudze, nie
udało nam się zaimplementować kilku mechanizmów, które w finalnej wersji bazy znaleźć się powinny. Jednak
satysfakcja z nauczenia się czegoś nowego i zrobienia tego w tak bardzo cenionej przez nas idei otwartego
oprogramowania rekompensuje te niedostatki :)
A oto one:
–
Baza nie jest zabezpieczona przed umyślnym usuwaniem z niej wpisów poza sytuacją, gdy nie pozawalają na to
więzy integralności.
–
Baza danych nie przewiduje możliwości zapamiętywania zmian cen towarów w czasie.

Podobne dokumenty