Badanie wybranych metod opisu sygnału mowy
Transkrypt
Badanie wybranych metod opisu sygnału mowy
W O J S K O W A A K A D E M I A T E C H N I C Z N A WYDZIAŁ ELEKTRONIKI Drukować dwustronnie PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH Grupa ........................... Data wykonania ćwiczenia: Nazwisko i imię: Ocena 1. ........................................................ Ćwiczenie prowadził: ................................... Uwagi: ................................... Podpis: 2. ........................................................ SPRAWOZDANIE Z ĆWICZENIA LABORATORYJNEGO Temat: Badanie wybranych me tod opisu sygnału mowy Zadanie 1. Analiza sygnału mowy Ø Za pomocą odtwarzacza systemowego odsłuchać pliki audio z katalogu …\MOSM. Ø Zapoznać się z kodem programu VowelsAnalyzer.m Ø Uruchomić program VowelsAnalyzer.m i wczytać pierwszy plik audio (K1.wav). Ø Przeanalizować wygenerowane wykresy. Zadanie 2. Parametryzacja mowy dźwięcznej – generacja cech dystynktywnych Ø Dla każdej głoski niezależnie określić częstotliwość podstawową w oparciu o widmo, cepstrum i funkcję autokorelacji oraz obliczyć jej wartość średnią. Uwaga. Właściwego maksimum cepstrum oraz funkcji autokorelacji poszukiwać · dla kobiet w zakresie: 3.5 ms - 8 ms (125 Hz - 286 Hz) · dla mężczyzn w zakresie: 5.0 ms - 20 ms (50 Hz - 200 Hz) Wyniki zanotować w tabeli. Ø Dla każdej głoski niezależnie określić wartości drugiego i trzeciego maksimum cepstrum. W tabeli zanotować wartości maksimów znormalizowane do wartości pierwszego maksimum. Uwaga Maksimum zerowe zlokalizowane jest w okolicy pseudoczasu zerowego. Ø Wyznaczyć wartości średnie częstotliwość podstawowej oraz maksimów cepstrum w zbiorze głosek a-e-i-u. Zadanie 3. Porównanie cech mowy dźwięcznej i bezdźwięcznej Ø Wczytać plik audio (K1_szept.wav) i dokonać porównania wygenerowanych wykresów z poprzednimi. Ø Wczytać kolejno pliki M1.wav i M1_szept.wav. i porównać otrzymane rezultaty. Ø Sformułować wnioski z dokonanych spostrzeżeń. Zadanie 4. Generacja cech dystynktywnych dla pozostałych mówców Ø Powtórzyć zadanie nr 2 dla plików K2.wav oraz M1.wav i M2.wav. Zadanie 5. Ø Korzystając z metody PCA (skrypt PCA_for_Vowels.m) zobrazować na płaszczyźnie (PCA1, PCA2) punkty średnie z głosek a-e-i-u oraz punkty odpowiadające głoskom o i dokonać oceny otrzymanej wizualizacji. Ø Sformułować wnioski końcowe. PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH str. 1 z 2 Częstotliwość podstawowa Plik Głoska Spectrum [Hz] Cepstrum [ms] [Hz] Autokorelacja [ms] [Hz] Średnia Unormowane maksima cepstrum [Hz] M2 M3 C1 C2 C3 a e K1.wav i u Średnia: o a e K2.wav i u Średnia: o a e M1.wav i u Średnia: o a e M2.wav i u Średnia: o Spostrzeżenia i wnioski ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… ……………………………………..……………………………………….………....………………………………………………...… PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH str. 2 z 2