Projekt bazy danych sygnałów akustycznych i

Transkrypt

Projekt bazy danych sygnałów akustycznych i
PROJEKT BAZY DANYCH SYGNAŁÓW AKUSTYCZNYCH I POZAAKUSTYCZNYCH
NIEZBĉDNYCH PRZY BUDOWIE ALGORYTMÓW
AUTOMATYCZNEJ DETEKCJI ZAKŁÓCEē
WOJCIECH BATKO, BARTŁOMIEJ BORKOWSKI
Streszczenie
W artykule przedstawiono koncepcje bazy danych, która posłuĪyü
ma do gromadzenia i opisu sygnałów akustycznych i pozaakustycznych niezbĊdnych
do budowy algorytmów automatycznej detekcji zakłóceĔ. Omówiona została koncepcja systemu, sposób gromadzenia i opisu danych, oraz wybór sposobu zabezpieczenia przed dostĊpem osób niepowołanych. Z uwagi na cel zastosowaĔ, rozwaĪania
obejmują równieĪ sposób wyboru systemu dostĊpu do danych. Artykuł stanowi realizacjĊ jednego z zadaĔ projektu badawczego „Projekt zintegrowanego systemu monitoringu akustycznego z automatyczną detekcją zakłóceĔ”
Słowa kluczowe: bazy danych, monitoring, zakłócenia, akustyka, bezpieczestwo
1. Wprowadzenie
Wykonujc cigły monitoring okrelonego terenu, napotykamy na problem duej iloci zebranych danych, bardzo czsto reprezentujcych informacje niezwizane z badanym ródłem. Zweryfikowanie danych pochodzcych z wielogodzinnych rejestracji w sposób manualny jest procesem
czasochłonnym, a co za tym idzie kosztownym. W zwizku z tym podjto prób zautomatyzowania tego procesu, a zarejestrowane sygnały niezbdne bd do stworzenia algorytmów auto detekcji. Z uwagi na cel zastosowa, wykorzystane bd sprawdzone rozwizania OpenSource oraz metody publikacji i dostpu przez Internet 0 (PHP, HTML itp.). Open Source (otwarte oprogramowanie), to odłam ruchu wolnego oprogramowania, który dy do tego, aby istniał swobodny i wolny
dostp do oprogramowania dla wszystkich uytkowników. Open Source jest oprogramowaniem,
którego licencja pozwala na legalne i darmowe kopiowane, kodu wynikowego, ródłowego oraz na
dowolne jego modyfikacje.
Z uwagi na multimedialny charakter danych, istotnym jest zapewnienie odpowiedniej wydajnoci serwerów i oprogramowania. Podsumowujc celem zadania opisanego w niniejszym artykule
było opracowanie struktury bazy danych, która wykorzystana bdzie do przechowywania
i udostpniania zarejestrowanych, pozyskanych z monitoringu cigłego, sygnałów audio zawierajcych zakłócenia (przejazd pocigu, przelot samolotu, sygnał karetki pogotowia itp.). W ramach
realizacji prac opracowano struktur bazy oraz dokonano doboru serwera, co zostało opisane
w artykule.
16
Wojciech Batko, Bartłomiej Borkowski
Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych …
2. ZałoĪenia
Realizacja celu dotyczy budowy dedykowanych baz danych, niezbdnych przy przetworzeniach wielowymiarowych zbiorów danych akustycznych i poza-akustycznych. Realizacja owego
celu jest prób wypracowania rozwiza prowadzcych do uefektywnienia procesu automatycznego rozpoznawania zakłóce akustycznych. W zwizku z tym postawiono nastpujce załoenia:
• opracowanie struktury bazy danych do przechowywania danych akustycznych
i pozaakustycznych / opisowych,
• ustalenie i opracowanie systemu zabezpieczenia i kontroli dostpu do gromadzonych danych,
• opracowanie aplikacji do zarzdzania systemem baz danych,
• implementacja rozwiza na platformie sprztowej.
Systemy baz danych 0 w jasny i przejrzysty sposób dostarcz nam informacji zwizanych ze
stanem i opisem monitorowanej przestrzeni czy obiektu, pozwol na wizualizacje historii zarejestrowanych zmian kontrolowanych parametrów, jak równie dadz moliwo prostego wyszukiwania istotnych informacji.
W trakcie realizacji projektu pojawiły si dwie róne moliwoci rozwizania tego problemu.
Jedna z nich to zakup kompletnego rozwizania – systemu u zewntrznego dostawcy; jest to jednak
sposób bardzo kosztowny i mało elastyczny.
Inny sposób to budowa systemu informatycznego na bazie dostpnych komputerów ogólnego
przeznaczenia jednake rozwizanie to wymaga zastosowania specjalnego oprogramowania
np. systemów Unix’owych (system Linux, bazy danych MySQL 0 lub PostgreSQL 0). Z ekonomicznego punktu widzenia jest to rozwizanie bardzo korzystne, ponadto system ten jest uniwersalny.
Przy realizacji powierzonego zadania wybrano rozwizanie polegajce na budowie systemu
od podstaw (rozwizanie drugie). Podejcie to jest niezbdne, jeeli mówimy o stworzeniu systemu
uniwersalnego o otwartej architekturze oraz zminimalizowania kosztów.
Aby rzetelnie odzwierciedli warunki akustyczne panujce w danym rodowisku, czyli obiekcie lub na obszarze, naley zgromadzi wartoci pomiarów jak i informacje rejestrowane
podczas pomiarów.
Fotografia / VIDEO
REJESTRACJA
AUDIO
Realizacja pomiaru
(gromadzenie danych
akustycznych i pozaakustycznych)
Pomiar
Lokalizacja
Termin
Wyposaenie
Aplikacja kontrolujca
poprawno wprowadzanych danych
Rysunek 1. Ogólny schemat rejestrowanych danych
ródło: Opracowanie własne.
17
Studies & Proceedings of Polish Association for Knowledge Management
Nr 45, 2011
Przeprowadzone w ramach realizacji zadania dyskusje oraz przegld dostpnych systemów rejestrujcych, które bd do dyspozycji w trakcie realizacji grantu pozwoliły na stworzenie ogólnego schematu rejestrowanych danych (rys. 1).
Open Source (otwarte oprogramowanie), to odłam ruchu wolnego oprogramowania, który dy do tego, aby istniał swobodny i wolny dostp do oprogramowania dla wszystkich uytkowników.
Open Source jest oprogramowaniem, którego licencja pozwala na legalne i darmowe kopiowane, kodu wynikowego, ródłowego oraz na dowolne jego modyfikacje.
Na podstawie tego schematu moliwym było stworzenie spisu wszystkich informacji potrzebnych do rzetelnego opisania rodowiska pomiarowego, jak i informacji dotyczcych osób wykonujcych pomiar, wykorzystanej aparatury i tym podobnych.
2. Baza danych
Na podstawie powyszych informacji stworzono propozycj tabel do przechowywania informacji opisowych oraz zaproponowano system przechowywania plików z rejestracji. Układ danych
podzieli mona na trzy segmenty:
• uytkownicy,
• sesja pomiarowa,
• informacja o przetwarzanych danych.
Pierwszy segment stanowi tabela uytkownicy, która zawiera informacje o osobach biorcych
udział w przetwarzaniu rejestrowanych danych:
• imi,
• nazwisko,
• login,
• hasło,
• status.
Zadania, jakie powierzone zostały uytkownikowi to: wprowadzanie sesji, przetwarzanie plików oraz opis.
Sesja pomiarowa – segment ten zawiera komplet informacji opisowych dotyczcych punktu
pomiarowego, terminu realizacji bada oraz wykorzystanej aparatury. W zwizku z tym stworzono
cztery tabele:
Sesja_pomiarowa – tabela zawiera informacje jednej sesji pomiarowej:
• id – czas w sekundach + id uytkownika,
• data_r – data rozpoczcia rejestracji,
• data_k – data zakoczenia rejestracji,
• gps_n – współrzdne gps,
• gps_e – współrzdne gps,
• katalog – informacja o lokalizacji plików – auto uzupełniany, tworzony na podstawie czasu
w sekundach oraz id z tabeli uytkownika,
• opis – ogólny opis o sesji pomiarowej,
18
Wojciech Batko, Bartłomiej Borkowski
Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych …
miasto – informacja z tabeli miasta oraz sprzona z nazw województwa z tabeli województwa,
• aparatura – informacja o sprzcie jaki został uyty,
• opiekun – pole z informacj kto wprowadził dan sesje sprzone z id z tablicy uytkownicy,
• kanały – informacja o iloci rejestrowanych kanałów,
Aparatura – tabela zawiera wszystkie niezbdne informacje o aparaturze wykorzystanej
w trakcie realizacji rejestracji sygnałów. Id z tabeli aparatura wprowadzana bdzie w komórk
„aparatura” w tabeli „sesja_pomiarowa”:
• id – nr porzdkowy,
• nazwa – zawiera nazw urzdzenia nadan przez producenta,
• nr_seryjny – zawiera numer seryjny nadany przez producenta,
• rodzaj – rozrónienie czy jest to miernik czy aparatura dodatkowa,
• przeznaczenie – opis przeznaczenia danego urzdzenia,
• swiadectwo – nr dokumentu o ile dla danego urzdzenia istnieje,
• waznosc – informacja o dacie nastpnego przegldu serwisu,
• miasta – tabela zawiera nazwy miast i symbole województw skorelowane z tabel województwa.
Tabela sesja pomiarowa pomoc pola id skorelowana jest z tabel miasta, dajc informacj
o miejscu wykonywania rejestracji:
• miasta – tabela ta zawiera nazwy miast i odwołanie do symboli województw z tabeli wojewodztwa
• id – nr porzdkowy,
• nazwa – pełna nazwa województwa,
• symbol – nr do korelacji z tabel województwa,
• Tabela wojewodztwa – zawiera nazwy województw i symbole wg obowizujcego podziału,
• id – identyfikator danego województwa do korelacji w tablicy miasta,
• nazwa – nazwa województwa, wg podziału po 1999 r.,
• symbol – obowizujcy dwuliterowy skrót nazwy województwa.
Przetwarzanie plików – segment ten zawiera komplet informacji na temat zarejestrowanego
pliku/sygnału:
• pliki – tabela zawiera informacje o poszczególnych plikach istotnych z punktu widzenia analizy. Po wybraniu danego pliku uytkownik cz danych uzupełnia sam pozostałe wpisywane
s automatycznie,
• id – identyfikator poszczególnych plików nadany kolejno,
• sesja_pomiarowa – pole uzupełniane automatycznie zawiera informacje o sesji w czasie której nastpiła rejestracja,
• nazwa_pliku – pole uzupełniane automatycznie – tworzona z nazwy katalogu w ujciu sekundowym po rozszyfrowaniu da nam informacje w którym katalogu ley plik,
• opis – krótka informacja o tym co zawiera plik,
• ocena_j – pole zawiera ocen jakociowa pliku wg uytkownika (od 1 – 6),
• kompresja – pole zawierajce informacje o rodzaju kompresji,
•
19
Studies & Proceedings of Polish Association for Knowledge Management
Nr 45, 2011
•
•
•
•
•
•
•
kanały – odwołanie do konkretnego kanału,
rodzaj – pole zawiera informacje o rodzaju hałasu,
publikacja,
ocena_j – tabela zawiera zbiór informacji o skali oceny plików,
id – numer porzdkowy,
skala – wartoci wstpnie od 1 do 6 ale dziki tak stworzonej tabeli moemy wprowadzi
dowoln skal wraz z opisem,
ocena – opis skali np. 1– nie nadaje si, 2 – marna jako, 3 – dostatecznie rozpoznawalne,
4 – dobry materiał, 5 – bardzo dobry materiał, 6 – wzorzec itd.
Rysunek 2. Schemat wzajemnych relacji pomiĊdzy poszczególnymi tabelami
ródło: Opracowanie własne.
Tabela ta za pomoc pola id skorelowana jest z tabel pliki (ocena_j)
kompresja – Tabela kompresja zawiera pola:
• id – zawiera numer porzdkowy,
• rodzaj – zawiera informacje o rodzaju kompresji.
20
Wojciech Batko, Bartłomiej Borkowski
Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych …
4. System plików
W trakcie realizacji prac podjto decyzje o sposobie przetrzymywania zarejestrowanych plików audio i wideo. Do wyboru były dwie metody, pierwsza to umieszczenie plików audio i wideo
w bazie danych, druga metoda to połczenie hybrydowe – opis zamieci w bazie danych natomiast pliki na dysku twardym. Ze wzgldu na ilo danych oraz ich rozmiar wybrano metod drug. Ustalono równie format oznaczenia katalogów i plików w celu ich łatwej identyfikacji. Poniej przedstawiony został przykład oznacze.
KATALOG/
– AUDIO / RRRR_MM_DD / HH. roz (mp3,wav,oga itd.)
– VIDEO / RRRR_MM_DD / HH. avi
– SVAN / *.svn (nie ma znaczenia pliki przetwarzane przez program svanPC)
– PLIKIS (opcja) *.svn (nie ma znaczenia pliki przetwarzane przez program svanPC)
RRRR – rok, MM – miesic, DD – dzie i HH – godzina.
Katalog główny zawiera podkatalogi AUDIO, WIEDO, SVAN i PLIKIS, które zawieraj katalogi i pliki zawierajce w nazwie dat utworzenia pliku.
5. Zabezpieczenie danych
Dostp do danych pomiarowych został ograniczony tylko dla osób biorcych udział w realizacji projektu. Osoba zainteresowana otrzymuje klucz do systemu VPN 0 wygenerowany przez administratora, po zainstalowaniu oprogramowania OPENVPN 0 uytkownik ma moliwo zestawienia połczenia i otrzymuje dostp do zasobów tylko z prawami odczytu. Poniej opisano zasad
działania systemu OPENVPN.
5.1. OpenVPN
OpenVPN to pakiet VPN stworzony przez Jamesa Yonana. Umoliwia on tworzenie zaszyfrowanych połcze midzy hostami – uywa do tego celu biblioteki OpenSSL oraz protokołów
SSLv3/TLSv1.
5.2. VPN
VPN (ang. Virtual Private Network, Wirtualna Sie Prywatna), jest to swojego rodzaju tunel,
przez który prowadzony jest prywatny ruch pomidzy klientami kocowymi. W celu zestawienia
połczenia tunelowego uywa si sieci publicznej, i od tego momentu cały ruch jest przezroczysty.
Zalet tego systemu jest moliwo szyfrowania (dla zwikszenia bezpieczestwa) i kompresji
przesyłanych danych.
Poniewa sie istnieje, jako struktura logiczna działajca w rzeczywistoci w ramach sieci publicznej std przyjło si nazywa ja „wirtualn”. Zalet tego rozwizania jest stosunkowo niski
koszt w porównaniu z sieciami prywatnymi, które działaj w obrbie specjalnie dzierawionych
łcz.
21
Studies & Proceedings of Polish Association for Knowledge Management
Nr 45, 2011
5.3 Zasoby sieciowe
W celu udostpnienia plików uytkownikom poprzez sie wykorzystano narzdzie Unixowe
SAMBA, które jest programem pracujcym w architekturze klient-serwer, słucym do współdzielenia plików oraz drukarek. Jest kompatybilny z protokołem SMB spotykanym w Windows, znanym, jako "Moje miejsca sieciowe". Natomiast opis skorelowany jest z baza danych.
6. Podsumowanie
Zastosowanie przedstawionego rozwizania ułatwia prac nad algorytmem automatycznej detekcji zakłóce akustycznych. System w jasny i przejrzysty sposób opisuje i segreguje interesujce
nas zdarzenia, dodatkowo zawieraj dokładn ocen warunków panujcych w trakcie rejestracji
sygnału. Wykorzystanie bazy danych i korelacji pomidzy warunkami meteorologiczne poziomem
dwiku jak i rejestrem audio i video zdecydowanie przypiesza prac ju na etapie segmentacji
i nadawaniu kategorii poszczególnym sygnałom. Stworzona przez nas baza danych charakteryzuje
si du elastycznoci, umoliwiajc dostosowanie jej do zmiennych w czasie wymaga dotyczcych manipulacji danymi wynikajcymi z prac realizowanych w ramach projektu.
Praca została wykonana w ramach projektu rozwojowego N R03 0030 06 finansowanego
przez Narodowe Centrum Bada i Rozwoju (NCBiR).
Bibliografia
[1] Barnett Ryan C.: Apache. Zabezpieczenia aplikacji i serwerów WWW. Gliwice: Helion,
2007.
[2] Ramzes Elmasri, Shamkant B. Navathe.: Wprowadzenie do systemów baz danych. Wydawnictwo Helion, Gliwice 2005.
[3] Serafin Marek.: Sieci VPN. Zdalna praca i bezpieczestwo danych. Helion, Gliwice 2008.
[4] http://www.openvpn.net
[5] http://www.mysql.com
[6] http://www.postgresql.org
22
Wojciech Batko, Bartłomiej Borkowski
Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych …
THE DESIGN OF DATABASE FOR ACOUSTIC AND NON-ACOUSTIC
SIGNALS NECESSARY FOR BUILDING OF ALGORITHMS
FOR AUTOMATED DETECTION OF INTERFERENCES
Summary
The article presents the concept of a system of databases that is intended for
gathering and description of the acoustic and non-acoustic signals necessary for
building of algorithms for automated detection of interferences. The concept of the
system is described, the method for data gathering and description as well as the
choice of the protection method against the access of unauthorised individuals. Regarding the application target the consideration also includes the method of the
choice of the system for data access. The article is a realisation of one of the tasks in
research project “The design of integrated system for acoustic monitoring with automated detection of the interferences”
The work is conducted within the development project N R03 0030 06 financed
by National Centre for Research and Development
Keywords: database, monitoring, disruption, acoustic, safety
Wojciech Batko
Bartłomiej Borkowski
Katedra Mechaniki i Wibroakustyki
Wydział Inynierii Mechanicznej i Robotyki
Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie
al. Mickiewicza 30, 30-059 Kraków
e-mail: [email protected]
[email protected]

Podobne dokumenty