Comenius-project TEWISE Dzwiek
Transkrypt
Comenius-project TEWISE Dzwiek
Comenius-project TEWISE 10650-CP-1-2002-A -COMENIUS-C21 Dzwiek k Copyright © 2002-2010 by Project "TEWISE" for the project -team: [email protected] All rights reserved. Privacy Statement. 106050 - CP - 1 - 2002 - 1 - COMENIUS - C21 This project has been funded with support from the European Commission. This publication [communication] reflects the views only of the author, and the Commission cannot be held responsible for any use which may be made of the information contained therein. Projekt Tewise Dźwięk Ivo Verovnik, Narodowy Instytut Nauczania, Słowenia Zaawansowana technologia komputerowa stwarza możliwości wykorzystywania nowych metod w nauczaniu na temat zjawisk akustycznych. Obecny szybki rozwój sprzętu i oprogramowania komputerowego umożliwia dokonywanie złożonych obliczeń różnorodnych sygnałów w czasie rzeczywistym. Taki rodzaj badań naukowych był wcześniej możliwy jedynie w wyspecjalizowanych centrach badawczych. Nauczyciel może wykorzystać fakt, że muzyka jest jednym z najbardziej fascynujących elementów sztuki i rozrywki, tak więc motywacja uczniów powinna być wysoka. Materiały zaprentowane w tym module oparte zostały na pozycji i CD ROM: L. Mathelitsch, I. Verovnik, Akustische Phänomene* a niektóre jego części zostały dosłownie przetłumaczone. Drgania i fale Drgania membrany bębenka lub głośnika wytwarzają zmiany w ciśnieniu powietrza dokoła membrany. Zmiany te rozchodzą się w otoczeniu jako fale akustyczne. Dźwięk taki może zostać nagrany i zapisany w postaci cyfrowej, a więc może zostać następnie odtworzony i przeanalizowany przez odpowiednie oprogramowanie. Do analizy używano programu Cool Edit, ale równie dobrze można wykorzystać w tym celu inne programy. Wyniki analiz można przedstawiać w różny sposób, niektóre z tych sposobów zostaną opisane w poniższej pracy. Fala sinusoidalna Przebieg zmian ciśnienia powietrza w funkcji czasu, w przypadku czystego pojedynczego dźwięku obrazuje wykres funkcji sinus. Ten rodzaj drgań występuje, gdy siła wygenerowana przez drgające ciało jest proporcjonalna do przesunięcia. Gdy częstotliwość drgań f należy do określonego zakresu (mniej więcej od 20 do 20000 Hz) to te fale mogą być słyszane przez człowieka jako dźwięk. Wysokość dźwięku jest określona przez czas jednej oscylacji okresu T lub przez częstotliwość f, przy pomocy następującego związku między tymi dwoma wielkościami: 1 f=T Gdy czas podany jest w sekundach, częstotliwość mierzymy w hercach (1 Hz = 1 s-1). Maksymalna zmiana ciśnienia (amplituda fali) powiązana jest z natężeniem dźwięku, a przez to z jego głośnością. Obydwie wielkości, częstotliwość i natężenie dźwięku, mogą zostać przedstawione na wykresie częstotliwość – widmo, gdzie pozioma oś przedstawia częstotliwość, a pionowa natężenie dźwięku. *Leopold Mathelitsch, Ivo Verovnik, Akustische Phänomene, 2004, AULIS VERLAG DEUBNER GMBH & CO KG, Köln (ISBN 3-7614-2532-5), Verlag öbv & hpt, Wien (ISBN 3-209-04585-2). „Dźwięk” Projekt Tewise Wymienione powyżej wielkości mogą także zostać przedstawione na tak zwanym spektrogramie lub sonogramie. Jest to rodzaj trójwymiarowego wykresu, gdzie oś pozioma reprezentuje czas, pionowa częstotliwość, a natężenie dźwięku przedstawione jest jako różne odcienie szarości. Widmo częstotliwości i sonogram różnią się głównie tym, że sonogram pokazuje skład widmowy całego zapisu dźwiękowego, podczas gdy widmo częstotliwości pokazuje tylko jego wycinek, krótki interwał czasowy. Czysty dźwięk, taki jak pokazano na rysunku poniżej, jest bardzo rzadki w przyrodzie. Drgania nigdy nie przyjmują idealnej formy sinusoidalnej. Ale za pomocą odpowiedniego sprzęt elektronicznego można wygenerować drgania zbliżone do formy sinusoidalnej. Także widelec kamertonu generuje dźwięk, który jest bardzo zbliżony do fali sinusoidalnej. Dźwięk: a) forma falowa, b) widmo częstotliwości, c) sonogram Złożenie dźwięków W złożeniu dźwięków zmiany w ciśnieniu powietrza są okresowe, ale nie sinusoidalne (patrz rysunek poniżej, gdzie przeanalizowano dźwięk trąbki). Francuski matematyk Jean Fourier rozwinął teorię mówiącą, że każda funkcja okresowa może zostać wyrażona za pomocą sum funkcji sinusoidalnych, gdzie częstotliwości argumentów są wielokrotnościami bazowej częstotliwości f0. Periodyczność zmian ciśnienia powietrza odzwierciedla się w seriach sinusoidalnych przebiegów, widocznych w widmie częstotliwości. Różnice w natężeniach poszczególnych części także mogą być pokazane na sonogramie. Wysokość dźwięku (jak wysoki ton usłyszy odbiorca) określona jest przez częstotliwość najniższego dźwięku, zwaną częstotliwością bazową. Liczba i natężenia wyższych dźwięków, które nazywa się harmonikami nadają złożeniu dźwięków tembr i barwę. Ta właściwość złożenia dźwięków powoduje różnice między, na przykład głosem trąbki, a klarnetu. „Dźwięk” Projekt Tewise Złożenie dźwięków (trąbka): a) forma falowa, b) widmo częstotliwości, c) sonogram Hałas W zapisie falowym hałasu nie widać w ogóle periodyczności (patrz rysunek poniżej). W hałasie mamy do czynienia z nieskończoną liczbą różnych dźwięków o różnych częstotliwościach w zakresie określonego interwału. Można to przedstawić jako widmo ciągłe. W naturze istnieje wiele rodzajów hałasu, różniących się od siebie rozkładem widmowym. Pomiędzy nimi są takie odgłosy, jak dźwięki niektórych instrumentów muzycznych (np. cymbały), głoski „s” lub „sz”, ryk silników odrzutowych albo szum wodospadu (pokazanego na rysunku poniżej). Hałas wodospadu: a) forma falowa, b) widmo częstotliwości, c) sonogram Przykład dźwiękowy: TonKlangGeraeusch1.wav „Dźwięk” Projekt Tewise Głos ludzki Głos jest najbardziej istotnym instrumentem gatunku ludzkiego, ponieważ służy do komunikacji, a także do wyrażania nastrojów i emocji; większość kultur nadała mu ponadto artystyczny wymiar. Mimo ogromnego znaczenia głosu w życiu człowieka, jego podstawowe zasady działania nie są zbyt dobrze znane ogółowi społeczeństwa. W tym rozdziale przedyskutowano podstawowe elementy mowy. Przykłady dźwiękowe, ilustrujące poszczególne tematy mogą być uzupełnione przez własne doświadczenia; ludzie mogą nagrywać swoje głosy, analizować je i porównywać z innymi. Mogą ustalić zakres częstotliwości i głośności swoich głosów, badać różnice w formowaniu samogłosek i spółgłosek, porównywać swój „śpiew” z głosami lepszych i gorszych zawodowych śpiewaków. Struny głosowe Ludzkie struny głosowe składają się pary umięśnionych fałd, których wewnętrzne brzegi zakończone są elastyczną membraną. Struny głosowe są mocno połączone z wewnętrznym brzegiem chrząstki tarczowatej. Chrząstka tarczowata może być umocowana z przodu krtani, w przypadku mężczyzn jest ona nawet widoczna, jako wystająca część zwana jabłkiem Adama. W tylnej części struny głosowe kończą się ruchomą chrząstką nalewkowatą, przez którą mogą być one zwężane. Po lewej: schematyczny rysunek aparatu mowy człowieka Po prawej: Fotografia otwartych strun głosowych Przy formowaniu dźwięku struny głosowe są na początku zamknięte. Poprzez kurczenie się klatki piersiowej powietrze z płuc zostaje skierowane poprzez tchawice w kierunku strun głosowych. To nadciśnienie powoduje rozsunięcie się strun głosowych, tak aby powietrze mogło przepływać przez to rozwarcie, które nazywamy głośnią. Przepływ powietrza powoduje podciśnienie w głośni (paradoks aerodynamiczny) i struny głosowe zamykają się ponownie; następnie nadciśnienie ponownie wzrasta i cały cykl powtarza się. Proces ten następuje bardzo szybko, a częstotliwość jego oscylacji determinuje wysokość generowanego dźwięku. W przypadku wygenerowania przez śpiewaków dźwięku A4 (440 Hz) struny głosowe muszą zamknąć się i otworzyć 440 razy w ciągu sekundy! „Dźwięk” Projekt Tewise Specjalna cecha tych drgań polega na tym, że są zamknięte przez około połowę okresu trwania drgania. Ten fakt, jak to zobaczymy później, ma daleko idące konsekwencje. Z tytułu długiego czasu, gdy struny głosowe są zamknięte ich drgania różnią się silnie od drgań sinusoidalnych. Dlatego drgania strun głosowych zawierają silne wyższe harmoniczne, dźwięk generowany przez struny głosowe jest bogaty w wyższe harmoniczne. Można to zobaczyć w widmie częstotliwości. a) drgania strun głosowych, b) stowarzyszone widmo częstotliwości Chłopcy i dziewczęta mają głosy o mniej więcej tej samej częstotliwości. W przypadku chłopców, podczas dojrzewania płciowego hormon płciowy testosteron powoduje znaczne powiększenie krtani (załamanie głosu). Chrząstka tarczowata rośnie (jabłko Adama), a struny głosowe powiększają się o 1 cm. Następnie, masa fałd głosowych wzrasta, czego rezultatem jest także wolniejszy ruch strun głosowych po okresie dojrzewania. Końcowym efektem jest więc głos, który leży o około oktawę niżej niż głos dziecka. Ten dźwięk strun głosowych niezbyt przypomina dźwięki, które znamy jako wymawiane słowa lub śpiewane nuty. Jest to raczej nieokreślony dźwięk, przypominający niewyraźne „aaaaaah”. Na następnych stronach wyjaśniono, jak taki dźwięk jest przemieniany w melodyjny głos. Przykład dźwiękowy: Stimmlippen1.wav Samogłoski Dźwięk generowane przez struny głosowe jest bogaty z zabarwienia, jakkolwiek nadal jest on względnie słaby. Zostaje on wzmocniony przez jamę ustną, która działa jak rezonator. Na dodatek, specyficzne rezonanse tej drogi głosowej powodują istotne zmiany w widmie dźwięku, w szczególności w tworzeniu się samogłosek. Charakterystyka rezonansu ust może być zrozumiana poprzez następującą analogię, odpowiednio: w zgrubnym przybliżeniu jama ustna może być przedstawiona jako cylindryczna rura o stałej średnicy, otwarta z jednej strony podczas mówienia lub śpiewania. Pokazano już, że głośnia pomiędzy strunami głosowymi jest wąska, a struny głosowe są półprzymknięte. Dlatego jama ustna przypomina rurę, która jest zamknięta z jednej strony. „Dźwięk” Projekt Tewise Jeśli założymy, że długość jamy ustnej przeciętnego człowieka wynosi L = 17,5 cm i wstawimy ją do wzoru na częstotliwości rezonansowe takiej rury: c fn = (2n + 1) 4L, n = 0, 1, 2, ... otrzymamy częstotliwość bazowego dźwięku f0 = 500 Hz, a dla pierwszych dwu składowych częstotliwości f1 = 1500 Hz, f2 = 2500 Hz. Te rezonanse jamy ustnej nazywa się formantami. Ponieważ jama ustna nie ma jednolitego kształtu, rzeczywiste formanty nie posiadają dokładnie tych wyliczonych częstotliwości. Co więcej, rezonanse mogą być przesuwane poprzez zmiany w jamie ustnej, głównie z uwagi na ruchy języka. Jeden z najważniejszych mechanizmów w generowaniu mowy zawiera się w fakcie, że położenie formantów może zmieniać się w szerokim zakresie. Artykulacje poszczególnych samogłosek jest wynikiem różnych położeń ust i języka, pomiar tego jest możliwy poprzez mierzenie częstotliwości pierwszego i drugiego formantu. Fakty te pokazane są graficzne, a w tabeli zebrano częstotliwości pierwszych dwu formantów dla męskiego i żeńskiego głosu. Sonogram pojedynczych samogłosek, porównany z odpowiednim położeniem ust. Samogłoski były wymawiane głosem o wysokości 100 Hz. „Dźwięk” Projekt Tewise Częstotliwości formantu [Hz] a e i o U 730 530 270 570 300 M 850 610 310 590 370 Ż 1090 1840 2290 840 870 M F2 1220 2330 2790 920 950 Ż Średnia wartości pierwszych dwu formantów (F1 i F2) podstawowych samogłosek dla głosu męskiego (M) i żeńskiego (Ż). F1 Można zauważyć, że dla niektórych samogłosek częstotliwości pierwszych dwu formantów leżą blisko siebie, chociaż dla „i” pierwszy formant leży stosunkowo nisko, drugi jest bardzo wysoki. Jak już opisano, język odgrywa bardzo ważną rolę w artykulacji. Pierwszy formant jest związany z wertykalną pozycją języka: wysoka pozycja języka (jak w przypadku „i”) daje niską częstotliwość pierwszego formantu, niska pozycja (jak w przypadku „a”) skutkuje wysoką częstotliwością w tym formancie. Horyzontalna pozycja języka wpływa natomiast na drugi formant: gdy język znajduje się z przodu („i”) prowadzi to do wysokich częstotliwości, jeśli język cofa się do tylnich partii jamy ustnej („o”) to odpowiednie częstotliwości są niskie. Wysokość i artykulacja samogłosek są niezależnymi cechami, jak można to zobaczyć na następnej ilustracji. Wysokość wzrastała od 100 Hz do 200 Hz, co mogło być obserwowane jako wzrost częstotliwości bazowego dźwięku i wyższych harmonicznych. Samogłoska („e”) pozostaje ta sama – formanty, tj. ciemno zabarwione obszary (zaznaczone przez strzałki), pozostają wszędzie niezmienione. Samogłoska „e” śpiewana początkowo z wysokością 100 Hz, a następnie z wysokością 200 Hz. Pierwsze trzy formanty zaznaczone są strzałkami. „Dźwięk” Projekt Tewise W wartościach w tabeli i na rysunku można zaobserwować rozbieżność: w tabeli drugi formant dla głosu męskiego wynosi 1840 Hz, podczas gdy na rysunku pokazana jest wartość 1500 Hz. Powód tych rozbieżności leży w fakcie, że każda samogłoska może być wyartykułowana w różny sposób: otwarcie, z naciskiem, nosowo, etc. Pomimo to, jest ona rozpoznawana jako właściwa samogłoska. Tak więc, położenie formantu może zmieniać się w pewnych granicach i każde z położeń będzie dodawać się do średniej wartości przedstawionej w tabeli, w zakresach, w których dana samogłoska jest ciągle rozpoznawana: dla pierwszych formantów jest to od 50 do 100 Hz wokół średnich wartości podanych w tabeli, dla drugich formantów od 200 do 300 Hz, zarówno ku dolnym jak i górnym częstotliwościom. Z tabeli i następnego rysunku ewidentnie widać, że formanty głosu żeńskiego leżą około 20% wyżej niż analogiczne formanty głosu męskiego. Jak można to wytłumaczyć w obliczu faktu, że przecież wysokość głosu żeńskiego jest o oktawę wyższa (współczynnik 2 w częstotliwości)? Głos żeński śpiewający podstawowe samogłoski z wysokością 300 Hz. Powód tego leży w różnych mechanizmach tworzenia się wysokości i formantów. Jak pokazano w poprzedniej części, wysokość dźwięku jest powodowana tempem drgań strun głosowych. To, ponieważ struny głosowe u kobiet są krótsze i mniej masywne niż u mężczyzn, prowadzi do dużych różnic w wysokości dźwięku. Formanty natomiast, są określane przez długość jamy ustnej, a ponieważ głowa kobieca średnio nie jest dużo mniejsza od głowy męskiej, więc mamy relatywnie mniejsze różnice jeśli chodzi o formanty. Przykład dźwiękowy: Vokale1.wav, Vokale2.wav, Vokale3.wav Spółgłoski Dla spółgłosek stosuje się kilka akustycznych form złożeń dźwięków. W oparciu o te różne wzory podstawowe można utworzyć klasyfikację spółgłosek. Spółgłoski szczelinowe Spółgłoski szczelinowe „f”, „s” i „sz” formowane są, gdy powietrze musi przejść przez szczelinę, tworząc syczący dźwięk bez określonej częstotliwości. Dla spółgłoski „f” szczelina tworzona jest między wargami a zębami, dla „s” pomiędzy językiem a przednią częścią podniebienia. „Dźwięk” Projekt Tewise Natomiast dla „sz” dźwięk jest generowany przez turbulentny przepływ powietrza między językiem, a środkową częścią podniebienia. Tak wytworzona fala dźwiękowa (zawierająca wiele częstotliwości), jest wciąż modyfikowana przez przednią część jamy ustnej: podobnie, jak w przypadku formowania samogłosek rezonanse jamy ustnej wpływają na wytwarzane dźwięki. Na poniższych wykresach można zobaczyć, że pewne zakresy częstotliwości wykazują większe natężenie niż sąsiednie częstotliwości. Mogą one być uważane za swego rodzaju formanty. Widmo częstości dla spółgłosek „s” i „sz” Spółgłoski zwarto-wybuchowe „p”, „t” i „k” nazywane są spółgłoskami zwarto-wybuchowymi, ponieważ strumień powietrza blokowany jest w różnych miejscach jamy ustnej. Zablokowane powietrze jest następnie nagle uwalniane, powodując charakterystyczny dźwięk. Różnica pomiędzy trzema spółgłoskami zwartymi bierze się z pozycji, gdzie zatrzymywany jest strumień powietrza: dla „p” jest to pomiędzy wargami, dla „t” pomiędzy językiem a przednią częścią podniebienia, a dla „k” pomiędzy językiem a tylnią częścią podniebienia. Spółgłoski dźwięczne W dotychczas omawianych mechanizmach formowania się spółgłosek struny głosowe nie brały udziału. Dlatego spółgłoski te nazywamy bezdźwięcznymi. Dla spółgłosek dźwięcznych „b”, „d” i „g”, dodatkowo obok mechanizmu blokowania przepływu powietrza wydawany dźwięk ma swoje pochodzenie w krtani i strunach głosowych. Spółgłoski nosowe W celu wytworzenia spółgłoski nosowej, jama ustna na krótki okres czasu jest blokowana, a strumień powietrza kierowany jest przez nos. Różnice pomiędzy spółgłoskami nosowymi „m”, „n” i „g” biorą się z miejsca zablokowania jamy ustnej, kolejno: ust, przedniej i tylniej części podniebienia. „Dźwięk” Projekt Tewise Sonogram dla kilku spółgłosek Przykład dźwiękowy: Konsonanten1.wav, Konsonanten2.wav Szeptanie Podczas mówienia albo śpiewania struny głosowa znajdują się początkowo w pozycji zamkniętej, a następnie są wprowadzane w drgania o określonej częstotliwości. W trakcie szeptania struny głosowe nie są całkowicie zamknięte. Zwykle tylnia część głośni tworzy otwór w kształcie trójkąta, zwanego szepczącym trójkątem. Im większy szepczący trójkąt, tym głośniejszy jest szept. Pozycja strun głosowych w trakcie szeptania, tak zwany szepczący trójkąt zaznaczono czarnym kolorem Przez głośnię strumień powietrza może stale przepływać nie powodując regularnych ruchów strun głosowych. Jednakże, na zwężeniach tworzą się turbulencje, które, w kategoriach akustycznych, odpowiadają hałasowi, tj. dźwiękowi, który zawiera wiele częstotliwości. Hałas ten doświadcza takich samych zmian w jamie ustnej, jak dźwięki tworzone za pomocą strun głosowych, tj. w zależności od ułożenia ust i języka różne częstotliwości są wzmacniane. Występują tutaj dokładnie te same formanty, jakkolwiek, teraz pojawią się one w formie pasm hałasu. „Dźwięk” Projekt Tewise Częstotliwości drgań strun głosowych, tj. wysokość dźwięku, nie mają zbyt wielkiego znaczenia w ludzkiej mowie, która opiera się głównie o samogłoski (formanty) i spółgłoski. W szepczącym głosie nadal zawarta jest informacja, więc tekst wygłaszany szeptem jest nadal zrozumiały. Z drugiej strony, szepczący głos traci charakterystyczną barwę, z brzmienia szeptanego zdania niewiele można wywnioskować o osobowości mówiącego. Samogłoski „a”, „e”, „i”. Po lewej: normalny głos, po prawej: szept Na rysunku powyżej można zauważyć, że szept jest słabszy niż zwykły głos (szary kolor po prawej stronie rysunku jest słabszy): gdy szepczemy, głośność naszego szeptu wynosi od 10 do 20 decybeli mniej niż w przypadku normalnego mowy. Można z tego wynieść przekonanie, że mówienie bardzo cichym głosem, szeptanie, chroni nasz głos. Szeptanie, jednakże, reprezentuje bardzo nienaturalną formę wydawania głosu. Z powodu wysokich wartości przepływu powietrza przez szepczący trójkąt, szeptanie – stosowane przez dłuższy czas – obciąża głos, a nawet może go zniszczyć i dlatego należy go unikać. Przykład dźwiękowy: Fluestern1.wav Płacz dziecka Na następnym rysunku zaprezentowano sonogram głosu niemowlęcia. Można rozpoznać formanty (F1 i F2) o wysokości 1000 i 2800 Hz, razem z dźwiękiem bazowym o wysokości około 440 Hz. Następnie dodano kilka – przeważnie nie-fizycznych – uwag, dotyczących płaczu niemowlęcia. Płacz nowonarodzonych dzieci ze wszystkich stron świata jest tej samej wysokości – od 400 do 450 Hz. Wytłumaczeniem tego faktu to, że właściwie rozwinięte niemowlęta prawie nie różnią się do siebie rozmiarem głowy, czy stopniem rozwoju centralnego układu nerwowego. Można zastanawiać się, czy jest to tylko przypadkowa zbieżność, że podstawowy dźwięk, według którego orkiestra stroi instrumenty, ma tę samą częstotliwość co płacz niemowlęcia. „Dźwięk” Projekt Tewise Spektrogram (po lewej) i średnie widmo częstotliwości (po prawej) płaczu niemowlęcia Przykład dźwiękowy: Baby1.wav CD-ROM pt.: „Zjawiska akustyczne” Informacje CD-ROM ten został stworzony jako dodatek do książki „Zjawiska akustyczne” (niem. Akustiche Phanoemene, Praktyczna Fizyka Drukowana, Wydawnictwo Aulis, Wiedeń). Jego zawartość stanowią przykłady dźwiękowe opisane w książce. Dlatego też, czytelnik może posłuchać tych przykładów, powtórzyć ich analizę, a także przeprowadzać dalsze badania. Dodatkowo, do plików dźwiękowych na CD-ROMie umieszczono także shareware’owy program Cool Edit 2000, edytor dźwięku, który był używany przez autorów książki. Program ten może być zainstalowany na każdym komputerze klasy PC z system operacyjnym MS Windows. Poza ww. programem, do edycji i analizy dźwięku można równie dobrze używać innych programów. Między nimi znajdują się programy znacznie bardziej złożone, a co za tym idzie droższe, ale można także znaleźć sporo programów darmowych (tzw. freeware), jak na przykład Audacity (http://audacity.sourceforge.net/). Na CD-ROMie znajdują się następujące pliki: Readme Information.doc - tekst podobny do tego, który czytasz (tylko po niemiecku). Readme Information Cool Edit.doc – “Jak używać programu Cool Edit”. Readme Installation Cool Edit.doc – “Jak zainstalować program Cool Edit”. ce2kmain.exe – Aplikacja instalacyjna programu Cool Edit 2000. Przykład dźwiękowys – Pliki dźwiękowe w formacie *.wav. Struktura przykładów dźwiękowych odpowiada strukturze książki „Zjawiska akustyczne”. - Pierwszy poziom odpowiada pięciu rozdziałom książki. - Drugi poziom odpowiada podrozdziałom. - Na ostatnim poziomie znajdują się pliki dźwiękowe w formacie *.wav. Nazwy plików odpowiadają nazwom umieszczonym na końcu każdego z podrozdziałów. „Dźwięk” Projekt Tewise 1. Podstawy dźwięku 01 Ton, złożony ton, hałas TonKlangGeraeusch1.wav 02 Kształt fal dźwiękowych Wellenformen1.wav, Wellenformen2.wav, Wellenformen3.wav, Wellenformen4.wav 03 Otwarte i zamknięte rury Pfeife1.wav 04 Rezonator Helmholtza Helmholtz1.wav 05 Bicie Schwebungen1.wav, Schwebungen2.wav, Schwebungen3.wav 06 Szybkość dźwięku Geschwindigkeit1.wav, Geschwindigkeit2.wav, Geschwindigkeit3.wav Geschwindigkeit4.wav 07 Pochłanianie dźwięków Absorption1.wav 08 Efekt Dopplera Doppler1.wav 09 Rura Macha Mach1.wav, Mach2.wav 10 Wysokość dźwięku Tonhoehe1.wav, Tonhoehe2.wav 11 Głośność Lautstaerke1.wav 12 Konsonans i dysonans Konsonanz1.wav, Konsonanz2.wav 2. Naturalne zjawiska akustyczne 01 Odgłos wiatru Wind1.wav, Wind2.wav 02 Piorun Donner1.wav 03 Krople wody Wassertropfen1.wav, Wassertropfen2.wav 04 Wodospad i hałas Wasserfall1.wav 05 Muszla morska Muschel1.wav 06 Żaby Froesche1.wav 07 Ptaki Voegel1.wav, Voegel2.wav, Voegel3.wav 08 Nietoperze Fledermaus1.wav 09 Zwierzętna kopytne Huftiere1.wav „Dźwięk” Projekt Tewise 10 Małpy Affen1.wav 11 Odgłosy pracy serca Herz1.wav 12 Odgłosy pracy mięśni Muskel1.wav, Muskel2.wav 3. Głos ludzki 01 Struny głosowe Stimmlippen1.wav 02 Samogłoski Vokale1.wav, Vokale2.wav, Vokale3.wav 03 Spółgłoski Konsonanten1.wav, Konsonanten2.wav 04 Szept Fluestern1.wav 05 Płacz niemowlęcia Baby1.wav 06 Formanty śpiewu Gesangsformant1.wav 07 Vibrato Vibrato1.wav, Vibrato2.wav, Vibrato3.wav 08 Gwizdanie Pfeifen1.wav 09 Chemiczne głosy Chemische1.wav 4. Odgłosy urządzeń technicznych i domowych 01 Syreny Sirene1.wav 02 Wiertarka dentystyczna Zahnbohrer1.wav 03 Transformator i linie wysokiego napięcia Transformator1.wav 04 Koła samochodowe Autoreifen1.wav 05 Silnik samochodu Automotor1.wav 06 Śmigłowiec Hubschrauber1.wav 07 Cyfrowe nagranie dźwięku Digital1.wav, Digital2.wav 08 Przetworzenie dźwięku MP3.wav 09 Telefon Telefon1.wav „Dźwięk” Projekt Tewise 10 Szklanka wody Wasserglas1.wav, Wasserglas2.wav 11 Napełnianie szklanki Einfuellen1.wav 12 Lampka wina Weinglas1.wav, Weinglas2.wav 5. Instrumenty muzyczne 01 Kamerton Stimmgabel1.wav, Stimmgabel2.wav 02 Kościelne dzwony Glocken1.wav, Glocken2.wav, Glocken3.wav, Glocken4.wav 03 Monochord Monochord1.wav 04 Skrzypce Geige1.wav, Geige2.wav 05 Rejestrator Blockfloete1.wav 06 Klarnet Klarinette1.wav 07 Puzon Zugposaune1.wav 08 Kotły i bębny PaukenTrommeln1.wav 09 Harfa Maultrommel1.wav Cool Edit 2000 1.1 Instalacja Program Cool Edit 200 może zostać zainstalowany na każdym komputerze klasy PC, posiadającym system operacyjny MS Windows: 95, 98, ME, NT, 2000, XP. Typowa instalacja powinna przebiegać według następującego schematu: - Włóż CD-ROM do napędu CD komputera. - Wejdź na CD-ROM i dwukrotnie kliknij na pliku ce2kmain.exe. - Kliknij OK, aby rozpocząć instalację programu. Teraz stosuj się do instrukcji podawanych przez program instalacyjny. - W oknie Select destination directory możesz wybrać lokalizację programu na dysku swojego komputera lub zgodzić się z proponowaną przez program lokalizacją C:\Program Files\Cool2000 „Dźwięk” Projekt Tewise - W oknie Audio file association możesz wybrać, które pliki dźwiękowe zostaną stowarzyszone z programem Cool Edit (będzie on używany do ich otwierania). Jeśli, na przykład chcesz, aby pliki *.mp3 były stowarzyszone z inną aplikacją musisz odznaczyć odpowiednią pozycję. - W oknie Shortcut on desktop możesz wybrać, czy Cool Edit ma umieścić swój skrót na Pulpicie Twojego komputera (zalecane przy częstym używaniu programu). W przeciwnym wypadku program będzie uruchamiany z menu startowego. - Po zakończeniu instalacji pojawi się okno Cool Edit 2000 - Trial version. Okno to pojawia się zawsze przy uruchamianiu niezarejestrowanej wersji programu. Teraz, przy każdym starcie, można wybrać dwie opcje (z ośmiu), które określą, jakie funkcje programu zostaną zablokowane. Po wyborze pierwszych dwu opcje (zalecane) można używać i badać wszystkie przykłady dźwiękowe zamieszczone na CD-ROMie. Po kliknięciu OK załaduje się i zostanie automatycznie odtworzony plik dźwiękowy Good Sound Stuff.au, żeby sprawdzić, czy instalacja przebiegła prawidłowo. Jeśli nagranie pojawi się na ekranie i zostanie odtworzona muzyka, oznaczać to będzie, że instalacja programu została zakończona. Następnie program można zamknąć. - Uruchamianie programu. Są dwie możliwości: jeśli na Pulpicie został umieszczony skrót do programu, należy po prostu dwukrotnie kliknąć na ikonie Cool Edit 2000 i program wystartuje. Jeśli nie ma skrótu na Pulpicie, można program uruchomić z menu startowego: Start\Programy\Cool Edit 2000\Cool Edit 2000. Po wystartowaniu programu, gdy pojawi się okno Cool Edit 2000 - Trial version, można dokonać zakupu pełnej wersji poprzez kliknięcie przycisku Buy Now. Cool Edit 2000 1.1. Podstawowa instrukcja W tym miejscu opisano kilka najważniejszych porad dotyczących używania programu Cool Edit. Instrukcje dotyczące instalacji programu dostępne są w oddzielnym rozdziale (Instalacja programu Cool Edit). Program może być używany do nagrywania i odtwarzania dźwięku, a także do przeprowadzania analizy zarejestrowanych dźwięków. Wyniki analiz mogą zostać przedstawione w różny sposób: Forma falowa: Diagram przedstawiający rozkład ciśnienia akustycznego w czasie. Widmo częstotliwości: Składniki widmowe, obliczone za pomocą analizy Fouriera z krótkich interwałów czasowych. Spektrogram lub sonogram: Trójwymiarowy diagram przedstawiający rozkład składników widmowych w czasie. „Dźwięk” Projekt Tewise Po uruchomieniu programu, pojawi się okno startowe programu, lecz nie zostanie otwarty żaden plik. Podstawowe komendy, które są dostępne z menu są bardzo podobne do komend używanych w innych programach użytkowych środowiska MS Windows. Kompletną informację o programie i jego działaniu można znaleźć klikając na polecenie menu Help (Pomoc). Początkującym użytkownikom radzi się, aby uruchomili animowanego „tutora”: Help\Tutorials\Overview of Cool Edit 2000. Podstawowe informacje potrzebne do oglądania przykładów dźwiękowych zamieszczonych na CD-ROMie podane są poniżej. Otwieranie pliku Aby otworzyć plik należy użyć polecenia File\Open, a następnie wybrać pożądany plik, który przeważnie znajdować się będzie między innymi plikami dźwiękowymi. Wszystkie przykłady dźwiękowe z CD-ROMu są plikami typu *.wav. Poza używaniem poleceń menu, można także używać ikon poleceń z paska narzędziowego menu. Wyświetlanie formy falowej lub sonogramu Plik jest otwierany w postaci formy falowej lub sonogramu, zależy to od początkowych ustawień programu. Widok pliku można zmieniać za pomocą poleceń: View\Waveform view lub View\Spectral view. Ustawianie rozdzielczości widmowej Obraz widma (sonogramu) pokazuje rozkład składników widmowych całego pliku dźwiękowego. Rozdzielczość widmowa może przyjmować różne wartości, a wartość początkowa zwykle nie pasuje do naszych potrzeb. Ma ona wartość 64. Oznacza to, że w obliczeniach FFT (Fast Fourier Transformation - szybka transformata Fouriera) używane są 64 cyfrowe próbki nagranego dźwięku. Wartość rozdzielczość zawsze równoważna jest 2n, gdzie n jest dodatnią liczbą całkowitą. Wartość tę można zmienić na, np. 512 za pomocą polecenia: Options\Settings\Spectral, następnie w polu Resolution zamiast 64 należy wybrać lub wpisać 512 i kliknąć przycisk OK. Dla przykładów dźwiękowych z książki rozdzielczość widmowa była ustawiona na 512 lub 1024. Te wartości zależą od tego, co się chce pokazać. Niższa wartość rozdzielczości pokazuje niższą rozdzielczość na osi częstotliwości, ale wyższą na osi czasu. Przy wysokich wartościach rozdzielczości widmowej jest na odwrót. Zwykle, jeśli nagranie zostało wykonane przy niskiej częstotliwości próbkowania, to rozdzielczość także może być niska i uzyskamy wyraźny sonogram. Zoom (powiększenie) Czasami trzeba na całym ekranie pokazać jedynie niewielki interwał czasowy wykresu fali albo sonogramu (powiększanie osi poziomej). Można to zrobić zaznaczając za pomocą kursora część wykresu, którą chcemy obejrzeć (klikając i „przeciągając” kursor). Zaznaczona część zostanie teraz wyświetlona we wzajemnie uzupełniających się barwach. Ikona powiększenia, położona blisko lewego dolnego rogu okna używana jest do określania różnych typów powiększenia. Do zmiany rozmiarów zaznaczenia do rozmiarów całego ekranu należy kliknąć na ikonę . Klikając na ikonie przywrócimy zaznaczeniu oryginalne rozmiary. W celu uzyskania powiększenia lub pomniejszenia widoku sonogramu z zachowaniem skali częstotliwości (oś pionowa), należy wykorzystać dwie ikony w prawym dolnym rogu okna. Klikając na ikonie powiększamy sonagram, a klikając na ikonie pomniejszamy go. Podobny efekt można uzyskać klikając prawym przyciskiem myszy na prawej ramce sonogramu. „Dźwięk” Projekt Tewise Wyświetlanie widma częstotliwości Widmo częstotliwości pokazuje składniki widmowe (wykres częstotliwość – natężenie) stosunkowo krótkiego interwału czasowego nagrania dźwiękowego. Aby pokazać widmo od wybranego punktu nagrania, które przedstawione jest jako sonogram lub w formie falowej, należy najpierw zaznaczyć roboczą przestrzeń w wybranej wartości czasu (położenie poziome). Następnie, należy wybrać polecenie Analyze/Frequency analysis, aby pokazać widmo częstotliwości od tego punktu nagrania. Czasami użyteczniejsze jest obejrzenie średniego widma częstotliwości z wybranego interwału czasowego. W tym przypadku, procedura postępowania jest podobna do tej, która została opisana powyżej, z tym, że w przeciwieństwie do poprzedniego przypadku nie zaznacza się tylko jednego punktu, ale cały interwał czasowy. Po wybraniu polecenia Analyze/Frequency analysis wyświetla się widmo częstotliwości środkowego punktu zaznaczonego interwału. Aby uzyskać średnią z całego interwału należy użyć przycisku Scan, znajdującego się w prawym dolnym rogu okna. Po odpowiednim czasie (długość obliczeń zależy głównie od tego jak szybkim komputerem dysponujemy i jak długi interwał został wybrany) otrzymamy średnie widmo. Aby zmienić kształt lub rozmiar okna z widmem częstotliwości należy kliknąć i „przeciągnąć” ramkę okna do pożądanej wielkości. Rozdzielczość widmowa używana w obliczeniach widma częstotliwości może zostać ustawiona w polu FFT Size, które położone jest w lewym dolnym rogu okna, pokazującego widmo. Jeśli chcemy odtworzyć nagranie dźwiękowe i w tym samym czasie oglądać jego widmo, śledząc zmiany składników widma dźwięku, najwyższa wartość ustawiona w polu FFT Size nie może przekraczać 1024. Wykonywanie nagrań dźwiękowych za pomocą programu Cool Edit Zaleca się następującą procedurę. Mikrofon musi być podłączony do odpowiedniego gniazda (zobacz oznaczenia). Następnie można nagrywać dźwięki, używając jednego z wielu programów do nagrywania (np. Rejestrator dźwięków). My będziemy używać programu Cool Edit. Po uruchomieniu , położony blisko lewego dolnego rogu okna. programu naciskamy przycisk Pojawi się okno New Waveform. Mamy tu kilka opcji ustawień: Sample rate (ilość próbek na sekundę), Chanels (mono lub stereo) i Resolution (ilość bitów użytych dla każdej próbki, np. 8, 16, 24, 32 bity; zależeć to będzie od karty dźwiękowej). 16 bitów zwykle jest odpowiednie dla naszych potrzeb. Po kliknięciu przycisku OK program rozpoczyna nagrywanie. „Dźwięk” Projekt Tewise Klikając na przycisku przerywamy nagrywanie. Na tym etapie nagranie, które otrzymaliśmy jest gotowe do dalszej edycji, powielenia lub zapisania. Nagranie może zostać zapisane na każdym nośniku danych. Zwykle jest to twardy dysk komputera. W tym celu używamy polecenia: File / Save as…, podobnie jak ma to miejsce w innych programach komputerowych. Podobna procedura musi zostać powtórzona, gdy nagrywamy dźwięk z innych urządzeń audio, jak na przykład radio, magnetofon, walkman, etc. Wejście Line out lub Phones w urządzeniu audio musi zostać połączone za pomocą kabla z wejściem Line in w komputerze (w niektórych komputerach można do tego celu wykorzystać wejście mikrofonowe). Należy pamiętać, aby upewnić się, że opcja Line in we „właściwościach głośności” nie jest wyciszona. Kilka ćwiczeń polecanych do wykonania przy pomocy programu Cool Edit 1. Otwórz plik dźwiękowy TonKlangGeraeusch1.wav. Składa się on z trzech części: czystego tonu, złożonego dźwięku i hałasu. Odtwórz plik. Zatrzymaj odtwarzanie mniej więcej pośrodku, a następnie odtwarzaj nagranie od tej pozycji. Wybierz jedną część nagrania i odtwórz ją. Odtwarzaj ją cyklicznie (w pętli). Zatrzymaj odtwarzanie. 2. Przełącz widok między formą falową a widmem. 3. Wyświetl szczegóły czasowe każdej z trzech części, można też śledzić rozkład ciśnienia akustycznego w czasie. 4. Zmierz czas jednego okresu w przypadku czystego tonu i złożenia dźwięków. Dokładność może być lepsza, gdy pomierzysz kilka okresów, następnie obliczysz ich średnią arytmetyczną. Zapisz te wartości. 5. Wyświetl średnie widmo dla każdej z trzech części nagrania. 6. Zmień rozmiar okna z widmem (wysokość, szerokość, a następnie obie wielkości na raz). 7. Wyświetl średnie widmo hałasu i zmień wartość FFT z 2048 na 256. Jakie zauważyłeś różnice? To samo wykonaj w przypadku czystego tonu i złożenia dźwięków. „Dźwięk” Projekt Tewise 8. Zmierz częstotliwość czystego tonu i częstotliwość bazową złożenia dźwięków, używając widm i spektrogramów. 9. Które częstotliwości są najmocniejsze w widmie ciągłym hałasu wodospadu (ostatnia część nagrania). 10. Wytnij część poliwinylowej rurki o długości od 6 do 12 cm. Zamknij jeden z jej końców kciukiem i spróbuj zagwizdać na rurce dmuchając nad otwartym końcem rurki. Spróbuj uzyskać wyższy dźwięk. 11. Wykonania nagrania gwizdnięcia: podłącz mikrofon do komputera i wykonaj nagranie dźwięku wykonanego gwizdka. Jeśli to możliwe nagraj nie tylko niższe, ale i wyższe tony. Ustawienia nagrania: Sample rate: 16K, Resolution: 16 bitów, Channel: 1. 12. Zapisz nagranie. 13. Zamknij plik, zamknij program Cool Edit i uruchom go ponownie. Otwórz swój plik dźwiękowy i spróbuj dokonać jego edycji i analizy. Wytnij niechciane części nagrania (kliknij i przeciągnij kursor myszy przez niechciany obszar wykresy i naciśnij klawisze Delete). Wyświetl widmo wybranych części nagrania, a następnie wyświetl spektrogram całego nagrania. 14. Porównaj teoretyczne przewidywania częstotliwości rezonansowych zamkniętej z jednej strony rurki z uzyskanymi przez siebie wynikami z analizy widma. Używając najprostszego modelu, teoretycznie częstotliwość bazowa rury zamkniętej z jednej strony odpowiada rurze, której długość wynosi jedną czwartą długości fali. 15. Nagraj swój głos. Wypowiadaj różne samogłoski, np. a, e, i, o, u lub proste słowa. Wykonaj analizy nagrań. Spróbuj znaleźć rozdzielczość (wartość FFT), która najlepiej nadaje się dla wymawianych słów. Wypróbuj przynajmniej następujące wartości FFT: 128, 256, 512, 1024, 2048 i 4096. 16. Jeśli masz czas, zmierz kilka innych dźwięków, np. kamerton, etc. 17. Spróbuj zbadać inne możliwości programu Cool Edit 2000. Przeczytaj Help oferowany przez ten program. 18. Cool Edit jest tylko jednym z wielu programów do edycji i analizy plików dźwiękowych. W ciągu najbliższego czasu pojawi się kilka nowych programów o podobnych możliwościach. Między nimi są także programy darmowe (freeware). Jednym z nich jest AUDACITY, który można uzyskać ze strony internetowej http://audacity.sourceforge.net/ Spróbuj uzyskać ten program (ma on ok. 2,4 MB), zainstalować go i wypróbować. „Dźwięk”