"Fonetyczno-akustyczne podstawy anotacji sygnału mowy"
Transkrypt
"Fonetyczno-akustyczne podstawy anotacji sygnału mowy"
WARSZTATY AKUSTYCZNE dr Agnieszka Wagner Uniwersytet Adama Mickiewicza w Poznaniu Warsztaty z analizy intonacji Termin: 25 czerwca, godz. 15:30-18:00 Miejsce: Wydział Polonistyki Uniwersytetu Warszawskiego, s. 29 Przebieg zajęć: Celem warsztatów będzie zapoznanie z metodologią badań nad intonacją wypowiedzi słownych oraz nabycie wiedzy i praktycznych umiejętności pozwalających na zaplanowanie i przeprowadzenie analiz w tym zakresie. Omówione zostaną następujące kwestie: – segmentacja wypowiedzi słownych na poziomie fraz/słów/sylab/głosek i transkrypcja fonetyczna; – systemy anotacji intonacji na potrzeby badań językoznawczych i technologii mowy: ToBI (Silvermann i in. 1992, Beckman i in. 2004) i RaP (Breen i in. 2012) oraz system kategorii tonalnych dla języka polskiego (Demenko i Wagner 2007, Wagner 2008); – wcześniejsze systemy opisu intonacji języka polskiego (Steffen-Batogowa 1996, Jassem 1962) oraz zasoby do analizy intonacji języka polskiego (m.in. PoINT, Paralingua, korpus „rytmiczny”); – obowiązujące modele intonacji: superpozycyjny model Fujisakiego (Fujisaki 1983), model IPO (t’Hart, Collier & Cohen 1990), Momel (Hirst & Espesser 1993), INTSINT (Hirst & Di Cristo 1998), ToBI, PaIntE (Möhler 1998) i Tilt (Taylor 2000); – ekstrakcja i parametryzacja konturu częstotliwości podstawowej – F0 (Hess 1983); W czasie kursu uczestnicy zapoznają się z programami Annotation Pro (Klessa i in. 2013) i Praat (Boersma & Weenink 2013), służącymi kolejno do segmentacji i anotacji materiału słownego oraz ekstrakcji i pomiarów F0, a także wezmą udział w wybranych etapach badania nad intonacją wypowiedzi, głównie w zakresie anotacji intonacji, ekstrakcji i parametryzacji częstotliwości podstawowej. Bibliografia Beckman, M. E., Hirschberg, J. B., i Shattuck-Hufnagel, S. (2004). The original ToBI system and the evolution of the ToBI framework. Prosodic models and transcription: Towards prosodic typology, 954. Boersma P. & Weenink D. (2013). Praat: doing phonetics by computer [Computer program]. Version 5.3.51, http://www.praat.org/ Breen, M., Dilley, L. C., Kraemer, J., i Gibson, E. (2012). Inter-transcriber reliability for two systems of prosodic annotation: ToBI (Tones and Break Indices) and RaP (Rhythm and Pitch). Corpus Linguistics and Linguistic Theory 8(2), 277-312. Demenko G. & Wagner A. (2007). Prosody annotation for unit selection text-to-speech synthesis. Archives of acoustics, 32(1): 25-40 Fujisaki H. (1983). Dynamic characteristic of voice fundamental frequency in speech and singing. W: MacNeilage [red.], The Production, of Speech, Springer, New York, str. 39-55 Hess W. (1983) Pitch determination of speech signals. Springer-Verlag, Heidelberg Hirst D. J. & Espesser R. (1993). Automatic modelling of fundamental frequency using a quadratic spline function. Travaux de l'Institut de Phonétique d'Aix 15, str. 71-85. Hirst D. J. & Di Cristo A. (1998). Intonation Systems: A Survey of. Twenty Languages. Cambridge University Press, Cambridge Jassem, W. (1962). Akcent języka polskiego. Wrocław: Ossolineum. Möhler G. (1998). Describing intonation with a parametric model. Proceedings of ICSLP 98', Sydney, Australia. t'Hart J., Collier R. & Cohen A. (1990). A Perceptual Study of Intonation. Cambridge University Press, Cambridge Klessa, K., Karpiński, M., Wagner, A. (2013). Annotation Pro – a new software tool for annotation of linguistic and paralinguistic features. In D. Hirst & B. Bigi (Eds.) Proceedings of the Tools and Resources for the Analysis of Speech Prosody (TRASP) Workshop, Aix en Provence, str. 51-54. Steffen- Batogowa M. (1996). Struktura przebiegu melodii polskiego języka ogólnego. Wydawnictwo Sorus, Poznań Silverman, K., Beckman, M., Pierrehumbert, J., Ostendorf, M., Wightman, C., Price, P., i Hirschberg, J. (1992). ToBI: A standard scheme for labeling prosody. W: Proceedings of the Second International Conference on Spoken Language Processing, 867-879. Taylor P. (2000). Analysis and synthesis of intonation using the tilt model. J. Acoust. Soc. Am. 107(3): 1697-1714 Wagner A. (2008). A comprehensive model of intonation for application in speech synthesis. Niepublikowana rozprawa doktorska, Uniwersytet im. Adama Mickiewicza w Poznaniu prof. dr hab. Ryszard Gubrynowicz Polsko-Japońska Wyższa Szkoła Technik Komputerowych Fonetyczno-akustyczne podstawy anotacji sygnału mowy Termin: 26 czerwca, godz. 14:30-17:00 Miejsce: Wydział Polonistyki Uniwersytetu Warszawskiego, s. 29 Przebieg zajęć: Wykład wprowadzający (1godz.) 1) Rejestracja sygnału mowy – podstawowe zasady, jakich należy przestrzegać; 2) Cele anotacji – przypomnienie pojęć: fonem, głoska, segment; 3) Oscylogram, trójwymiarowe widmo dźwięku, przekrój widma; 4) Akustyka samogłosek – pojęcie formantu, określanie częstotliwości formantów i szerokości (pasma formantowe). Relacja między opisem artykulacyjnym i akustycznym samogłosek; 5) Akustyka spółgłosek – zjawiska aerodynamiczne przy artykulacji spółgłosek, obraz akustyczny stopnia zwarcia i miejsca artykulacji; 6) Koartykulacja i nazalizacja: ich wpływ na obraz akustyczny głosek; 7) Percepcja mowy – cechy akustyczne dźwięków mowy. Zajęcia warsztatowe (z użyciem systemu „PRAAT doing phonetics by computer” wersja 5.3.7) (2 godz.) 1) Segmentacja sygnału mowy– wyróżnianie segmentów samogłoskowych, spółgłoskowych, zwarć dźwięcznych, bezdźwięcznych, pauzy; 2) Przekroje widmowe, określanie częstotliwości formantowych samogłosek; 3) Rozpoznawanie segmentów spółgłoskowych i określanie ich granic; 4) Systemy transkrypcji fonetycznej: IPA, komputerowy alfabet fonetyczny SAMPA; 5) Anotacja wybranych zdań.