Badanie wybranych metod opisu sygnału mowy

Transkrypt

Badanie wybranych metod opisu sygnału mowy
W O J S K O W A
A K A D E M I A
T E C H N I C Z N A
WYDZIAŁ ELEKTRONIKI
Drukować dwustronnie
PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH
Grupa ...........................
Data wykonania ćwiczenia:
Nazwisko i imię:
Ocena
1. ........................................................
Ćwiczenie prowadził:
...................................
Uwagi:
...................................
Podpis:
2. ........................................................
SPRAWOZDANIE Z ĆWICZENIA LABORATORYJNEGO
Temat: Badanie wybranych me tod opisu sygnału mowy
Zadanie 1. Analiza sygnału mowy
Ø Za pomocą odtwarzacza systemowego odsłuchać pliki audio z katalogu …\MOSM.
Ø Zapoznać się z kodem programu VowelsAnalyzer.m
Ø Uruchomić program VowelsAnalyzer.m i wczytać pierwszy plik audio (K1.wav).
Ø Przeanalizować wygenerowane wykresy.
Zadanie 2. Parametryzacja mowy dźwięcznej – generacja cech dystynktywnych
Ø Dla każdej głoski niezależnie określić częstotliwość podstawową w oparciu o widmo, cepstrum i funkcję autokorelacji oraz obliczyć jej wartość średnią.
Uwaga.
Właściwego maksimum cepstrum oraz funkcji autokorelacji poszukiwać
· dla kobiet w zakresie:
3.5 ms - 8 ms (125 Hz - 286 Hz)
· dla mężczyzn w zakresie: 5.0 ms - 20 ms (50 Hz - 200 Hz)
Wyniki zanotować w tabeli.
Ø Dla każdej głoski niezależnie określić wartości drugiego i trzeciego maksimum cepstrum.
W tabeli zanotować wartości maksimów znormalizowane do wartości pierwszego maksimum.
Uwaga
Maksimum zerowe zlokalizowane jest w okolicy pseudoczasu zerowego.
Ø Wyznaczyć wartości średnie częstotliwość podstawowej oraz maksimów cepstrum w zbiorze głosek a-e-i-u.
Zadanie 3. Porównanie cech mowy dźwięcznej i bezdźwięcznej
Ø Wczytać plik audio (K1_szept.wav) i dokonać porównania wygenerowanych wykresów z poprzednimi.
Ø Wczytać kolejno pliki M1.wav i M1_szept.wav. i porównać otrzymane rezultaty.
Ø Sformułować wnioski z dokonanych spostrzeżeń.
Zadanie 4. Generacja cech dystynktywnych dla pozostałych mówców
Ø Powtórzyć zadanie nr 2 dla plików K2.wav oraz M1.wav i M2.wav.
Zadanie 5.
Ø Korzystając z metody PCA (skrypt PCA_for_Vowels.m) zobrazować na płaszczyźnie (PCA1, PCA2) punkty średnie
z głosek a-e-i-u oraz punkty odpowiadające głoskom o i dokonać oceny otrzymanej wizualizacji.
Ø Sformułować wnioski końcowe.
PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH
str. 1 z 2
Częstotliwość podstawowa
Plik
Głoska
Spectrum
[Hz]
Cepstrum
[ms]
[Hz]
Autokorelacja
[ms]
[Hz]
Średnia
Unormowane
maksima cepstrum
[Hz]
M2
M3
C1
C2
C3
a
e
K1.wav
i
u
Średnia:
o
a
e
K2.wav
i
u
Średnia:
o
a
e
M1.wav
i
u
Średnia:
o
a
e
M2.wav
i
u
Średnia:
o
Spostrzeżenia i wnioski
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
……………………………………..……………………………………….………....………………………………………………...…
PRZETWARZANIE SYGNAŁÓW BIOMETRYCZNYCH
str. 2 z 2