"Fonetyczno-akustyczne podstawy anotacji sygnału mowy"

Transkrypt

"Fonetyczno-akustyczne podstawy anotacji sygnału mowy"
WARSZTATY AKUSTYCZNE
dr Agnieszka Wagner
Uniwersytet Adama Mickiewicza w Poznaniu
Warsztaty z analizy intonacji
Termin: 25 czerwca, godz. 15:30-18:00
Miejsce: Wydział Polonistyki Uniwersytetu Warszawskiego, s. 29
Przebieg zajęć:
Celem warsztatów będzie zapoznanie z metodologią badań nad intonacją wypowiedzi słownych oraz
nabycie wiedzy i praktycznych umiejętności pozwalających na zaplanowanie i przeprowadzenie analiz
w tym zakresie. Omówione zostaną następujące kwestie:
– segmentacja wypowiedzi słownych na poziomie fraz/słów/sylab/głosek i transkrypcja fonetyczna;
– systemy anotacji intonacji na potrzeby badań językoznawczych i technologii mowy: ToBI
(Silvermann i in. 1992, Beckman i in. 2004) i RaP (Breen i in. 2012) oraz system kategorii tonalnych
dla języka polskiego (Demenko i Wagner 2007, Wagner 2008);
– wcześniejsze systemy opisu intonacji języka polskiego (Steffen-Batogowa 1996, Jassem 1962) oraz
zasoby do analizy intonacji języka polskiego (m.in. PoINT, Paralingua, korpus „rytmiczny”);
– obowiązujące modele intonacji: superpozycyjny model Fujisakiego (Fujisaki 1983), model IPO
(t’Hart, Collier & Cohen 1990), Momel (Hirst & Espesser 1993), INTSINT (Hirst & Di Cristo 1998),
ToBI, PaIntE (Möhler 1998) i Tilt (Taylor 2000);
– ekstrakcja i parametryzacja konturu częstotliwości podstawowej – F0 (Hess 1983);
W czasie kursu uczestnicy zapoznają się z programami Annotation Pro (Klessa i in. 2013) i Praat
(Boersma & Weenink 2013), służącymi kolejno do segmentacji i anotacji materiału słownego oraz
ekstrakcji i pomiarów F0, a także wezmą udział w wybranych etapach badania nad intonacją
wypowiedzi, głównie w zakresie anotacji intonacji, ekstrakcji i parametryzacji częstotliwości
podstawowej.
Bibliografia
Beckman, M. E., Hirschberg, J. B., i Shattuck-Hufnagel, S. (2004). The original ToBI system and the
evolution of the ToBI framework. Prosodic models and transcription: Towards prosodic typology, 954.
Boersma P. & Weenink D. (2013). Praat: doing phonetics by computer [Computer program]. Version
5.3.51, http://www.praat.org/
Breen, M., Dilley, L. C., Kraemer, J., i Gibson, E. (2012). Inter-transcriber reliability for two systems
of prosodic annotation: ToBI (Tones and Break Indices) and RaP (Rhythm and Pitch). Corpus
Linguistics and Linguistic Theory 8(2), 277-312.
Demenko G. & Wagner A. (2007). Prosody annotation for unit selection text-to-speech synthesis.
Archives of acoustics, 32(1): 25-40
Fujisaki H. (1983). Dynamic characteristic of voice fundamental frequency in speech and singing.
W: MacNeilage [red.], The Production, of Speech, Springer, New York, str. 39-55
Hess W. (1983) Pitch determination of speech signals. Springer-Verlag, Heidelberg
Hirst D. J. & Espesser R. (1993). Automatic modelling of fundamental frequency using a quadratic
spline function. Travaux de l'Institut de Phonétique d'Aix 15, str. 71-85.
Hirst D. J. & Di Cristo A. (1998). Intonation Systems: A Survey of. Twenty Languages. Cambridge
University Press, Cambridge
Jassem, W. (1962). Akcent języka polskiego. Wrocław: Ossolineum.
Möhler G. (1998). Describing intonation with a parametric model. Proceedings of ICSLP 98', Sydney,
Australia.
t'Hart J., Collier R. & Cohen A. (1990). A Perceptual Study of Intonation. Cambridge University
Press, Cambridge
Klessa, K., Karpiński, M., Wagner, A. (2013). Annotation Pro – a new software tool for annotation of
linguistic and paralinguistic features. In D. Hirst & B. Bigi (Eds.) Proceedings of the Tools and
Resources for the Analysis of Speech Prosody (TRASP) Workshop, Aix en Provence, str. 51-54.
Steffen- Batogowa M. (1996). Struktura przebiegu melodii polskiego języka ogólnego. Wydawnictwo
Sorus, Poznań
Silverman, K., Beckman, M., Pierrehumbert, J., Ostendorf, M., Wightman, C., Price, P., i Hirschberg,
J. (1992). ToBI: A standard scheme for labeling prosody. W: Proceedings of the Second International
Conference on Spoken Language Processing, 867-879.
Taylor P. (2000). Analysis and synthesis of intonation using the tilt model. J. Acoust. Soc. Am.
107(3): 1697-1714
Wagner A. (2008). A comprehensive model of intonation for application in speech synthesis.
Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu
prof. dr hab. Ryszard Gubrynowicz
Polsko-Japońska Wyższa Szkoła Technik Komputerowych
Fonetyczno-akustyczne podstawy anotacji sygnału mowy
Termin: 26 czerwca, godz. 14:30-17:00
Miejsce: Wydział Polonistyki Uniwersytetu Warszawskiego, s. 29
Przebieg zajęć:
Wykład wprowadzający (1godz.)
1) Rejestracja sygnału mowy – podstawowe zasady, jakich należy przestrzegać;
2) Cele anotacji – przypomnienie pojęć: fonem, głoska, segment;
3) Oscylogram, trójwymiarowe widmo dźwięku, przekrój widma;
4) Akustyka samogłosek – pojęcie formantu, określanie częstotliwości formantów i szerokości
(pasma formantowe). Relacja między opisem artykulacyjnym i akustycznym samogłosek;
5) Akustyka spółgłosek – zjawiska aerodynamiczne przy artykulacji spółgłosek, obraz akustyczny
stopnia zwarcia i miejsca artykulacji;
6) Koartykulacja i nazalizacja: ich wpływ na obraz akustyczny głosek;
7) Percepcja mowy – cechy akustyczne dźwięków mowy.
Zajęcia warsztatowe
(z użyciem systemu „PRAAT doing phonetics by computer” wersja 5.3.7) (2 godz.)
1) Segmentacja sygnału mowy– wyróżnianie segmentów samogłoskowych, spółgłoskowych, zwarć
dźwięcznych, bezdźwięcznych, pauzy;
2) Przekroje widmowe, określanie częstotliwości formantowych samogłosek;
3) Rozpoznawanie segmentów spółgłoskowych i określanie ich granic;
4) Systemy transkrypcji fonetycznej: IPA, komputerowy alfabet fonetyczny SAMPA;
5) Anotacja wybranych zdań.