Projekt bazy danych sygnałów akustycznych i
Transkrypt
Projekt bazy danych sygnałów akustycznych i
PROJEKT BAZY DANYCH SYGNAŁÓW AKUSTYCZNYCH I POZAAKUSTYCZNYCH NIEZBĉDNYCH PRZY BUDOWIE ALGORYTMÓW AUTOMATYCZNEJ DETEKCJI ZAKŁÓCEē WOJCIECH BATKO, BARTŁOMIEJ BORKOWSKI Streszczenie W artykule przedstawiono koncepcje bazy danych, która posłuĪyü ma do gromadzenia i opisu sygnałów akustycznych i pozaakustycznych niezbĊdnych do budowy algorytmów automatycznej detekcji zakłóceĔ. Omówiona została koncepcja systemu, sposób gromadzenia i opisu danych, oraz wybór sposobu zabezpieczenia przed dostĊpem osób niepowołanych. Z uwagi na cel zastosowaĔ, rozwaĪania obejmują równieĪ sposób wyboru systemu dostĊpu do danych. Artykuł stanowi realizacjĊ jednego z zadaĔ projektu badawczego „Projekt zintegrowanego systemu monitoringu akustycznego z automatyczną detekcją zakłóceĔ” Słowa kluczowe: bazy danych, monitoring, zakłócenia, akustyka, bezpieczestwo 1. Wprowadzenie Wykonujc cigły monitoring okrelonego terenu, napotykamy na problem duej iloci zebranych danych, bardzo czsto reprezentujcych informacje niezwizane z badanym ródłem. Zweryfikowanie danych pochodzcych z wielogodzinnych rejestracji w sposób manualny jest procesem czasochłonnym, a co za tym idzie kosztownym. W zwizku z tym podjto prób zautomatyzowania tego procesu, a zarejestrowane sygnały niezbdne bd do stworzenia algorytmów auto detekcji. Z uwagi na cel zastosowa, wykorzystane bd sprawdzone rozwizania OpenSource oraz metody publikacji i dostpu przez Internet 0 (PHP, HTML itp.). Open Source (otwarte oprogramowanie), to odłam ruchu wolnego oprogramowania, który dy do tego, aby istniał swobodny i wolny dostp do oprogramowania dla wszystkich uytkowników. Open Source jest oprogramowaniem, którego licencja pozwala na legalne i darmowe kopiowane, kodu wynikowego, ródłowego oraz na dowolne jego modyfikacje. Z uwagi na multimedialny charakter danych, istotnym jest zapewnienie odpowiedniej wydajnoci serwerów i oprogramowania. Podsumowujc celem zadania opisanego w niniejszym artykule było opracowanie struktury bazy danych, która wykorzystana bdzie do przechowywania i udostpniania zarejestrowanych, pozyskanych z monitoringu cigłego, sygnałów audio zawierajcych zakłócenia (przejazd pocigu, przelot samolotu, sygnał karetki pogotowia itp.). W ramach realizacji prac opracowano struktur bazy oraz dokonano doboru serwera, co zostało opisane w artykule. 16 Wojciech Batko, Bartłomiej Borkowski Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych … 2. ZałoĪenia Realizacja celu dotyczy budowy dedykowanych baz danych, niezbdnych przy przetworzeniach wielowymiarowych zbiorów danych akustycznych i poza-akustycznych. Realizacja owego celu jest prób wypracowania rozwiza prowadzcych do uefektywnienia procesu automatycznego rozpoznawania zakłóce akustycznych. W zwizku z tym postawiono nastpujce załoenia: • opracowanie struktury bazy danych do przechowywania danych akustycznych i pozaakustycznych / opisowych, • ustalenie i opracowanie systemu zabezpieczenia i kontroli dostpu do gromadzonych danych, • opracowanie aplikacji do zarzdzania systemem baz danych, • implementacja rozwiza na platformie sprztowej. Systemy baz danych 0 w jasny i przejrzysty sposób dostarcz nam informacji zwizanych ze stanem i opisem monitorowanej przestrzeni czy obiektu, pozwol na wizualizacje historii zarejestrowanych zmian kontrolowanych parametrów, jak równie dadz moliwo prostego wyszukiwania istotnych informacji. W trakcie realizacji projektu pojawiły si dwie róne moliwoci rozwizania tego problemu. Jedna z nich to zakup kompletnego rozwizania – systemu u zewntrznego dostawcy; jest to jednak sposób bardzo kosztowny i mało elastyczny. Inny sposób to budowa systemu informatycznego na bazie dostpnych komputerów ogólnego przeznaczenia jednake rozwizanie to wymaga zastosowania specjalnego oprogramowania np. systemów Unix’owych (system Linux, bazy danych MySQL 0 lub PostgreSQL 0). Z ekonomicznego punktu widzenia jest to rozwizanie bardzo korzystne, ponadto system ten jest uniwersalny. Przy realizacji powierzonego zadania wybrano rozwizanie polegajce na budowie systemu od podstaw (rozwizanie drugie). Podejcie to jest niezbdne, jeeli mówimy o stworzeniu systemu uniwersalnego o otwartej architekturze oraz zminimalizowania kosztów. Aby rzetelnie odzwierciedli warunki akustyczne panujce w danym rodowisku, czyli obiekcie lub na obszarze, naley zgromadzi wartoci pomiarów jak i informacje rejestrowane podczas pomiarów. Fotografia / VIDEO REJESTRACJA AUDIO Realizacja pomiaru (gromadzenie danych akustycznych i pozaakustycznych) Pomiar Lokalizacja Termin Wyposaenie Aplikacja kontrolujca poprawno wprowadzanych danych Rysunek 1. Ogólny schemat rejestrowanych danych ródło: Opracowanie własne. 17 Studies & Proceedings of Polish Association for Knowledge Management Nr 45, 2011 Przeprowadzone w ramach realizacji zadania dyskusje oraz przegld dostpnych systemów rejestrujcych, które bd do dyspozycji w trakcie realizacji grantu pozwoliły na stworzenie ogólnego schematu rejestrowanych danych (rys. 1). Open Source (otwarte oprogramowanie), to odłam ruchu wolnego oprogramowania, który dy do tego, aby istniał swobodny i wolny dostp do oprogramowania dla wszystkich uytkowników. Open Source jest oprogramowaniem, którego licencja pozwala na legalne i darmowe kopiowane, kodu wynikowego, ródłowego oraz na dowolne jego modyfikacje. Na podstawie tego schematu moliwym było stworzenie spisu wszystkich informacji potrzebnych do rzetelnego opisania rodowiska pomiarowego, jak i informacji dotyczcych osób wykonujcych pomiar, wykorzystanej aparatury i tym podobnych. 2. Baza danych Na podstawie powyszych informacji stworzono propozycj tabel do przechowywania informacji opisowych oraz zaproponowano system przechowywania plików z rejestracji. Układ danych podzieli mona na trzy segmenty: • uytkownicy, • sesja pomiarowa, • informacja o przetwarzanych danych. Pierwszy segment stanowi tabela uytkownicy, która zawiera informacje o osobach biorcych udział w przetwarzaniu rejestrowanych danych: • imi, • nazwisko, • login, • hasło, • status. Zadania, jakie powierzone zostały uytkownikowi to: wprowadzanie sesji, przetwarzanie plików oraz opis. Sesja pomiarowa – segment ten zawiera komplet informacji opisowych dotyczcych punktu pomiarowego, terminu realizacji bada oraz wykorzystanej aparatury. W zwizku z tym stworzono cztery tabele: Sesja_pomiarowa – tabela zawiera informacje jednej sesji pomiarowej: • id – czas w sekundach + id uytkownika, • data_r – data rozpoczcia rejestracji, • data_k – data zakoczenia rejestracji, • gps_n – współrzdne gps, • gps_e – współrzdne gps, • katalog – informacja o lokalizacji plików – auto uzupełniany, tworzony na podstawie czasu w sekundach oraz id z tabeli uytkownika, • opis – ogólny opis o sesji pomiarowej, 18 Wojciech Batko, Bartłomiej Borkowski Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych … miasto – informacja z tabeli miasta oraz sprzona z nazw województwa z tabeli województwa, • aparatura – informacja o sprzcie jaki został uyty, • opiekun – pole z informacj kto wprowadził dan sesje sprzone z id z tablicy uytkownicy, • kanały – informacja o iloci rejestrowanych kanałów, Aparatura – tabela zawiera wszystkie niezbdne informacje o aparaturze wykorzystanej w trakcie realizacji rejestracji sygnałów. Id z tabeli aparatura wprowadzana bdzie w komórk „aparatura” w tabeli „sesja_pomiarowa”: • id – nr porzdkowy, • nazwa – zawiera nazw urzdzenia nadan przez producenta, • nr_seryjny – zawiera numer seryjny nadany przez producenta, • rodzaj – rozrónienie czy jest to miernik czy aparatura dodatkowa, • przeznaczenie – opis przeznaczenia danego urzdzenia, • swiadectwo – nr dokumentu o ile dla danego urzdzenia istnieje, • waznosc – informacja o dacie nastpnego przegldu serwisu, • miasta – tabela zawiera nazwy miast i symbole województw skorelowane z tabel województwa. Tabela sesja pomiarowa pomoc pola id skorelowana jest z tabel miasta, dajc informacj o miejscu wykonywania rejestracji: • miasta – tabela ta zawiera nazwy miast i odwołanie do symboli województw z tabeli wojewodztwa • id – nr porzdkowy, • nazwa – pełna nazwa województwa, • symbol – nr do korelacji z tabel województwa, • Tabela wojewodztwa – zawiera nazwy województw i symbole wg obowizujcego podziału, • id – identyfikator danego województwa do korelacji w tablicy miasta, • nazwa – nazwa województwa, wg podziału po 1999 r., • symbol – obowizujcy dwuliterowy skrót nazwy województwa. Przetwarzanie plików – segment ten zawiera komplet informacji na temat zarejestrowanego pliku/sygnału: • pliki – tabela zawiera informacje o poszczególnych plikach istotnych z punktu widzenia analizy. Po wybraniu danego pliku uytkownik cz danych uzupełnia sam pozostałe wpisywane s automatycznie, • id – identyfikator poszczególnych plików nadany kolejno, • sesja_pomiarowa – pole uzupełniane automatycznie zawiera informacje o sesji w czasie której nastpiła rejestracja, • nazwa_pliku – pole uzupełniane automatycznie – tworzona z nazwy katalogu w ujciu sekundowym po rozszyfrowaniu da nam informacje w którym katalogu ley plik, • opis – krótka informacja o tym co zawiera plik, • ocena_j – pole zawiera ocen jakociowa pliku wg uytkownika (od 1 – 6), • kompresja – pole zawierajce informacje o rodzaju kompresji, • 19 Studies & Proceedings of Polish Association for Knowledge Management Nr 45, 2011 • • • • • • • kanały – odwołanie do konkretnego kanału, rodzaj – pole zawiera informacje o rodzaju hałasu, publikacja, ocena_j – tabela zawiera zbiór informacji o skali oceny plików, id – numer porzdkowy, skala – wartoci wstpnie od 1 do 6 ale dziki tak stworzonej tabeli moemy wprowadzi dowoln skal wraz z opisem, ocena – opis skali np. 1– nie nadaje si, 2 – marna jako, 3 – dostatecznie rozpoznawalne, 4 – dobry materiał, 5 – bardzo dobry materiał, 6 – wzorzec itd. Rysunek 2. Schemat wzajemnych relacji pomiĊdzy poszczególnymi tabelami ródło: Opracowanie własne. Tabela ta za pomoc pola id skorelowana jest z tabel pliki (ocena_j) kompresja – Tabela kompresja zawiera pola: • id – zawiera numer porzdkowy, • rodzaj – zawiera informacje o rodzaju kompresji. 20 Wojciech Batko, Bartłomiej Borkowski Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych … 4. System plików W trakcie realizacji prac podjto decyzje o sposobie przetrzymywania zarejestrowanych plików audio i wideo. Do wyboru były dwie metody, pierwsza to umieszczenie plików audio i wideo w bazie danych, druga metoda to połczenie hybrydowe – opis zamieci w bazie danych natomiast pliki na dysku twardym. Ze wzgldu na ilo danych oraz ich rozmiar wybrano metod drug. Ustalono równie format oznaczenia katalogów i plików w celu ich łatwej identyfikacji. Poniej przedstawiony został przykład oznacze. KATALOG/ – AUDIO / RRRR_MM_DD / HH. roz (mp3,wav,oga itd.) – VIDEO / RRRR_MM_DD / HH. avi – SVAN / *.svn (nie ma znaczenia pliki przetwarzane przez program svanPC) – PLIKIS (opcja) *.svn (nie ma znaczenia pliki przetwarzane przez program svanPC) RRRR – rok, MM – miesic, DD – dzie i HH – godzina. Katalog główny zawiera podkatalogi AUDIO, WIEDO, SVAN i PLIKIS, które zawieraj katalogi i pliki zawierajce w nazwie dat utworzenia pliku. 5. Zabezpieczenie danych Dostp do danych pomiarowych został ograniczony tylko dla osób biorcych udział w realizacji projektu. Osoba zainteresowana otrzymuje klucz do systemu VPN 0 wygenerowany przez administratora, po zainstalowaniu oprogramowania OPENVPN 0 uytkownik ma moliwo zestawienia połczenia i otrzymuje dostp do zasobów tylko z prawami odczytu. Poniej opisano zasad działania systemu OPENVPN. 5.1. OpenVPN OpenVPN to pakiet VPN stworzony przez Jamesa Yonana. Umoliwia on tworzenie zaszyfrowanych połcze midzy hostami – uywa do tego celu biblioteki OpenSSL oraz protokołów SSLv3/TLSv1. 5.2. VPN VPN (ang. Virtual Private Network, Wirtualna Sie Prywatna), jest to swojego rodzaju tunel, przez który prowadzony jest prywatny ruch pomidzy klientami kocowymi. W celu zestawienia połczenia tunelowego uywa si sieci publicznej, i od tego momentu cały ruch jest przezroczysty. Zalet tego systemu jest moliwo szyfrowania (dla zwikszenia bezpieczestwa) i kompresji przesyłanych danych. Poniewa sie istnieje, jako struktura logiczna działajca w rzeczywistoci w ramach sieci publicznej std przyjło si nazywa ja „wirtualn”. Zalet tego rozwizania jest stosunkowo niski koszt w porównaniu z sieciami prywatnymi, które działaj w obrbie specjalnie dzierawionych łcz. 21 Studies & Proceedings of Polish Association for Knowledge Management Nr 45, 2011 5.3 Zasoby sieciowe W celu udostpnienia plików uytkownikom poprzez sie wykorzystano narzdzie Unixowe SAMBA, które jest programem pracujcym w architekturze klient-serwer, słucym do współdzielenia plików oraz drukarek. Jest kompatybilny z protokołem SMB spotykanym w Windows, znanym, jako "Moje miejsca sieciowe". Natomiast opis skorelowany jest z baza danych. 6. Podsumowanie Zastosowanie przedstawionego rozwizania ułatwia prac nad algorytmem automatycznej detekcji zakłóce akustycznych. System w jasny i przejrzysty sposób opisuje i segreguje interesujce nas zdarzenia, dodatkowo zawieraj dokładn ocen warunków panujcych w trakcie rejestracji sygnału. Wykorzystanie bazy danych i korelacji pomidzy warunkami meteorologiczne poziomem dwiku jak i rejestrem audio i video zdecydowanie przypiesza prac ju na etapie segmentacji i nadawaniu kategorii poszczególnym sygnałom. Stworzona przez nas baza danych charakteryzuje si du elastycznoci, umoliwiajc dostosowanie jej do zmiennych w czasie wymaga dotyczcych manipulacji danymi wynikajcymi z prac realizowanych w ramach projektu. Praca została wykonana w ramach projektu rozwojowego N R03 0030 06 finansowanego przez Narodowe Centrum Bada i Rozwoju (NCBiR). Bibliografia [1] Barnett Ryan C.: Apache. Zabezpieczenia aplikacji i serwerów WWW. Gliwice: Helion, 2007. [2] Ramzes Elmasri, Shamkant B. Navathe.: Wprowadzenie do systemów baz danych. Wydawnictwo Helion, Gliwice 2005. [3] Serafin Marek.: Sieci VPN. Zdalna praca i bezpieczestwo danych. Helion, Gliwice 2008. [4] http://www.openvpn.net [5] http://www.mysql.com [6] http://www.postgresql.org 22 Wojciech Batko, Bartłomiej Borkowski Projekt bazy danych sygnałów akustycznych i pozaakustycznych niezbĊdnych … THE DESIGN OF DATABASE FOR ACOUSTIC AND NON-ACOUSTIC SIGNALS NECESSARY FOR BUILDING OF ALGORITHMS FOR AUTOMATED DETECTION OF INTERFERENCES Summary The article presents the concept of a system of databases that is intended for gathering and description of the acoustic and non-acoustic signals necessary for building of algorithms for automated detection of interferences. The concept of the system is described, the method for data gathering and description as well as the choice of the protection method against the access of unauthorised individuals. Regarding the application target the consideration also includes the method of the choice of the system for data access. The article is a realisation of one of the tasks in research project “The design of integrated system for acoustic monitoring with automated detection of the interferences” The work is conducted within the development project N R03 0030 06 financed by National Centre for Research and Development Keywords: database, monitoring, disruption, acoustic, safety Wojciech Batko Bartłomiej Borkowski Katedra Mechaniki i Wibroakustyki Wydział Inynierii Mechanicznej i Robotyki Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie al. Mickiewicza 30, 30-059 Kraków e-mail: [email protected] [email protected]