kodowanie d™wi†ku i obrazu
Transkrypt
kodowanie d™wi†ku i obrazu
KODOWANIE DWIKU I OBRAZU wiczenie 1 KWANTYZACJA -DWIK Uwagi ogólne • Program symulacyjny nosi nazwe "kwant.exe". Lokalizacja: M:/dymarski/kwant/kwant.exe • Sygnaªem wej±ciowym jest fraza mowy (nale»y wybra¢ okre±lona fraz¦ i nie zmienia¢ jej w trakcie ¢wiczenia) lub sygnaª sinusoidalny spróbkowany z cz¦stotliwo±ci¡ 8kHz. • Sygnaª jest podzielony na ramki, które mo»na obserwowa¢ na ekranie. Przy ka»dej ramce podany jest SN R[dB] - stosunek energii sygnaªu w ramce do energii bª¦du kwantowania w dB. • Wynikami symulacji s¡: SN R - stosunek energii sygnaªu w caªej przetwarzanej frazie do energii bª¦du kwantyzacji, oraz SN Rseg - tzw. segmentowy SNR - warto±¢ ±rednia SN R[dB] liczonych osobno w ka»dej ramce. Wynikiem symulacji jest te» fraza sygnaªu skwantowanego - gotowa do odsªuchu. Zadania do wykonania 1. W kwantyzatorze równomiernym ustaw zakres pracy 1,0 (wykorzystujemy wówczas caªy zakres pracy przetwornika C/A), oraz tªumienie sygnaªu wej±ciowego 0dB. Dla sygnaªu mowy zanotuj SN R w funkcji liczby poziomów kwantyzacji (2, 4, 8, 16, 32, 64, 128, 256 poziomów). Odsªuchaj skwantowane frazy mowy. 2. Ustaw zakres pracy kwantyzatora równy 1,0, liczb¦ poziomów kwantyzacji =16, tªumienie sygnaªu wej±ciowego =0dB. Zanotuj SN R dla sygnaªu mowy skwantowanego przy u»yciu kwantyzatora • równomiernego, • nierównomiernego z kompresj¡ logarytmiczn¡, • adaptacyjnego . 3. Ustaw tªumienie sygnaªu =20dB i powtórz badania kwantyzatorów wymienionych w punkcie 2. Jaki algorytm kwantyzacji daje najlepsze wyniki? wiczenie 2 KWANTYZACJA -OBRAZ Uwagi ogólne • Program symulacyjny jest uruchamiany komend¡ "cviptools.bat" (C:/CVIPTOOLS/bin/CVIPtools.bat). Po wej±ciu do programu nale»y wybra¢ obraz, najlepiej niekolorowy, zawieraj¡cy wiele odcieni szaro±ci • Przetwarzane obrazy zawieraj¡ najcz¦±ciej 256 na 256 pikseli, ka»dy w 256 odcieniach szaro±ci (obrazy kolorowe skªadaj¡ sie z 3 obrazów skªadowych R,G,B) • Kwantyzacj¦ skalarn¡ mo»na wykona¢ zaznaczaj¡c obraz w gªównym oknie programu (prosz¦ sprawdzi¢, czy zaznaczono wªa±ciwy obraz!), nast¦pnie przechodz¡c do compression - preprocessing - gray level quantization. • Obraz skwantowany mo»na porówna¢ z oryginaªem. Nale»y wybra¢ utilities - misc - compare two images. Najlepiej wykorzysta¢ SNR (wynik jest w decybelach). Oczywi±cie skwantowany obraz nale»y te» obejrze¢. Zadanie do wykonania Przeprowad¹ kwantyzacj¦ wybranego obrazu ustawiaj¡c liczb¦ poziomów kwantyzacji =2, 4, 8, 16... Zako«cz cykl symulacji po otrzymaniu obrazu o dobrej jako±ci (prawie nie ró»ni¡cego si¦ od oryginaªu). Zanotuj warto±¢ SNR [dB] w funkcji rozdzielczo±ci (w bitach na piksel). Jaka rozdzielczo±¢ gwarantuje dobr¡ jako±¢ obrazu? wiczenie 3 KWANTYZACJA WEKTOROWA Uwagi ogólne • Lokalizacja programu M:/dymarski/vq/wektor.exe. • Badane s¡ kwantyzatory przetwarzaj¡ce wektory o wymiarach od 1 do 8 (gdy wymiar wektora =1, kwantowanie wektorowe przechodzi w kwantowanie skalarne) o sªowniku optymalizowanym dla przetwarzanej frazy. Projektowanie sªownika odbywa si¦ iteracyjnie, przy u»yciu algorytmu Lloyda lub LBG. • Program umo»liwia (w przypadku wybrania wektorów 2-wymiarowych) obserwacj¦ procesu projektowania sªownika kwantyzatora wektorowego. • Sygnaªem wej±ciowym jest fraza mowy. Sygnaª posiada próbki o warto±ciach nie wykraczaj¡cych poza < −1, +1 >. • Sygnaª jest podzielony na ramki, które mo»na obserwowa¢ na ekranie (w ramce mie±ci si¦ caªkowita liczba wektorów). Przy ka»dej ramce podawany jest SN R[dB] - stosunek energii sygnaªu w ramce do energii bª¦du kwantowania, wyra»ony w dB. • Wynikami symulacji s¡: SN R - stosunek energii sygnaªu w caªej przetwarzanej frazie do energii bª¦du kwantyzacji, oraz SN Rseg - tzw. segmentowy SNR - warto±¢ ±rednia SN R[dB] liczonych osobno w ka»dej ramce. Wynikiem symulacji jest te» fraza sygnaªu skwantowanego - gotowa do odsªuchu. Zadania do wykonania 1. Badanie algorytmów projektowania sªowników kwantyzatorów wektorowych Zaobserwuj przedstawiony na ekranie zbiór wektorów M = 2-wymiarowych pobranych z sygnaªu mowy. Co ±wiadczy o wyst¦powaniu korelacji s¡siednich próbek? Przeprowad¹ projektowanie sªownika licz¡cego 128 wektorów 2-wymiarowych. Sªownik pocz¡tkowy otrzymaj metod¡ losowania wektorów z frazy. Nast¦pnie zaprojektuj sªownik metod¡ LBG i porównaj wyniki. 2. Badanie jako±ci skwantowanego sygnaªu w funkcji wymiaru wektora Przeprowad¹ ró»nymi metodami kwantyzacj¦ frazy mowy z rozdzielczo±ci¡ b = 1bit /próbk¦ (8kbit/s). Wykorzystaj kwantyzator skalarny o 2 poziomach kwantyzacji (podstaw wymiar wektora =1), kwantyzator wektorów 2-wymiarowych (4 wektory w sªowniku), kwantyzator wektorów 3-wymiarowych (8 wektorów w sªowniku), itd a» do kwantowania wektorów 8-wymiarowych (256 wektorów w sªowniku). Wykre±l SNR w funkcji wymiaru wektora. Czym wyja±ni¢ przewag¦ kwantyzatorów wektorowych nad skalarnym? wiczenie 4 KODOWANIE MOWY W TELEFONII KOMÓRKOWEJ - GSM-AMR Uwagi ogólne • Lokalizacja programu M:/dymarski/celp/AMRCelp.exe. • Obsªug¦ programu wyja±ni prowadz¡cy Zadania do wykonania 1. Obserwacja sygnaªów w koderze GSM-AMR. Uruchom symulator AMR-CELP. Dla wybranej ramki mowy d¹wi¦cznej porównaj widmo sygnaªu wej±ciowego S(f) i charakterystyk¦ cz¦stotliwo±ciow¡ ltru syntezy H(f). Jaki jest zwi¡zek H(f) i S(f)? Zaobserwuj sygnaª pobudzaj¡cy u(n) i jego skªadniki: pobudzenie adaptacyjne v(n) i algebraiczne c(n). Jaka jest rola pobudzenia adaptacyjnego w kodowaniu mowy d¹wi¦cznej? 2. Badanie jako±ci sygnaªu mowy w funkcji przepªywno±ci kodera. Dla wybranej frazy mowy przeprowad¹ symulacje kodera AMR CELP wykorzystuj¡c dost¦pne przepªywno±ci binarne. Notuj SNR i SNRseg [dB] oraz odsªuchuj frazy poddane kompresji. Powy»ej jakiej przepªywno±ci jako±¢ mowy mo»na uzna¢ za wystarczaj¡c¡ dla rozmowy telefonicznej? wiczenie 5 KOMPRESJA SYGNAÓW FONICZNYCH: MPEG1 - Audio Uwagi ogólne • Lokalizacja programu M:/dymarski/mpeg/koder.exe. • Sygnaªem wej±ciowym jest sygnaª muzyczny (monofoniczny) spróbkowany z cz¦stotliwa±ci¡ 44.1kHz. Jest zapisany w pliku z rozszerzeniem .pcm (raw pcm data). Format zapisu jest 2-bajtowy (16-bitowy) tzw. format Intel (najpierw LSB potem MSB). • Symulator kodera MPEG wytwarza pliki zgodne z formatem MPEG Audio. Mog¡ by¢ one odtworzone przez dowolny dekoder MPEG, np. dekoder wchodz¡cy w skªad edytora d¹wi¦ku COOL. Technika wykonywania symulacji • Otwórz koder MPEG i wybierz plik wej±ciowy - zaªó»my »e nosi on nazw¦ plik.pcm • Wybierz przepªywno±¢ binarn¡ • Wybierz "podgl¡d" - po obejrzeniu kilku ramek b¦dzie mo»na go wyª¡czy¢. • Inne ustawienia (cz¦stotliwo±¢ próbkowania itp) pozostaw bez zmian • Uruchom koder (kliknij "Start"). Plikiem wyj±ciowym b¦dzie plik.mpg • Uruchom dekoder MPEG - zamieni on plik.mpg na plik_.pcm • Posªuguj¡c si¦ programem COOL wczytaj plik.mpg (lub plik_.pcm) i oryginaª: plik.pcm. Porównaj oba pliki odsluchuj¡c je. Porównaj widma (opcja "Frequency analysis"). • Uruchom opcj¦ wyznaczania SNR (tj. porównanie plik.pcm i plik_.pcm) i odczytaj wynik. Zadania do wykonania W funkcji przepªywno±ci binarnej (np. 32, 64, 128, 256kbit/s) zbadaj jako±¢ sygnaªu (odsªuchy) i SNR. Co jest przyczyn¡ pogorszenia jako±ci sygnaªu przy du»ej kompresji? Powy»ej jakiej przepªywno±ci binarnej znieksztaªcenia staj¡ si¦ niezauwa»alne? wiczenie 6 KOMPRESJA OBRAZU: JPEG, MPEG Uwagi ogólne • Wykorzystuje si¦ oprogramowanie CVIP Scotta E.Umbaugh'a, opisane w ksia»ce "Computer Vision and Image Processing". Szczegóªy dziaªania programu wyja±ni prowadz¡cy ¢wiczenie. • Obrazów ¹ródªowych nale»y poszukiwa¢ w katalogu cviptools/images. • Obrazy po kompresji znajduj¡ si¦ w katalogu roboczym windows/temp/cvip_temp. W wyniku kompresji w tym katalogu umieszczane s¡ 2 pliki: wej±ciowy jpg_*.ras i po kompresji jpg_*.ras_jpg. Gwiazdka (*) oznacza nazwe wybranego pliku, do nazwy program dopisuje nr wersji. Porównuj¡c wielko±ci plików przed i po kompresji mo»na okre±li¢ wielko±¢ (stopie«) kompresji. Zadania do wykonania: 1. Wybierz obraz zawieraj¡cy kraw¦dzie i du»e obszary o jednostajnej barwie (np. buty.ras). Dokonuj kompresji posªuguj¡c si¦ algorytmem JPEG (opcja: compression - lossy). Wielko±¢ kompresji mo»na regulowa¢ parametrem "quality". Zmniejszaj¡c warto±¢ tego parametru (a» do rz¦du kilku) obserwuj znieksztaªcenia i notuj wielko±¢ kompresji. Jaka wielko±¢ kompresji zapewnia jako±¢ obrazu, trudn¡ do odró»nienia od oryginaªu? Dlaczego przy du»ym stopniu kompresji obserwuje si¦ plamy o prostopadªych kraw¦dziach? 2. Zaobserwuj znieksztaªcenia powstaj¡ce skutkiem kompresji obrazu ruchomego (MPEG-4) i jego transmisji (UMTS) - prezentacji sekwencji wideo dokona prowadz¡cy.