Comenius-project TEWISE Dzwiek

Transkrypt

Comenius-project TEWISE Dzwiek
Comenius-project
TEWISE
10650-CP-1-2002-A -COMENIUS-C21
Dzwiek
k
Copyright © 2002-2010 by Project "TEWISE"
for the project -team: [email protected]
All rights reserved. Privacy Statement.
106050 - CP - 1 - 2002 - 1 - COMENIUS - C21
This project has been funded with support from the European Commission.
This publication [communication] reflects the views only of the author, and the Commission
cannot be held responsible for any use which may be made of the information contained therein.
Projekt Tewise
Dźwięk
Ivo Verovnik, Narodowy Instytut Nauczania, Słowenia
Zaawansowana technologia komputerowa stwarza możliwości wykorzystywania nowych
metod w nauczaniu na temat zjawisk akustycznych. Obecny szybki rozwój sprzętu i
oprogramowania komputerowego umożliwia dokonywanie złożonych obliczeń różnorodnych
sygnałów w czasie rzeczywistym. Taki rodzaj badań naukowych był wcześniej możliwy
jedynie w wyspecjalizowanych centrach badawczych. Nauczyciel może wykorzystać fakt, że
muzyka jest jednym z najbardziej fascynujących elementów sztuki i rozrywki, tak więc
motywacja uczniów powinna być wysoka. Materiały zaprentowane w tym module oparte
zostały na pozycji i CD ROM: L. Mathelitsch, I. Verovnik, Akustische Phänomene* a
niektóre jego części zostały dosłownie przetłumaczone.
Drgania i fale
Drgania membrany bębenka lub głośnika wytwarzają zmiany w ciśnieniu powietrza dokoła
membrany. Zmiany te rozchodzą się w otoczeniu jako fale akustyczne. Dźwięk taki może
zostać nagrany i zapisany w postaci cyfrowej, a więc może zostać następnie odtworzony i
przeanalizowany przez odpowiednie oprogramowanie. Do analizy używano programu Cool
Edit, ale równie dobrze można wykorzystać w tym celu inne programy. Wyniki analiz można
przedstawiać w różny sposób, niektóre z tych sposobów zostaną opisane w poniższej pracy.
Fala sinusoidalna
Przebieg zmian ciśnienia powietrza w funkcji czasu, w przypadku czystego pojedynczego
dźwięku obrazuje wykres funkcji sinus. Ten rodzaj drgań występuje, gdy siła wygenerowana
przez drgające ciało jest proporcjonalna do przesunięcia. Gdy częstotliwość drgań f należy do
określonego zakresu (mniej więcej od 20 do 20000 Hz) to te fale mogą być słyszane przez
człowieka jako dźwięk. Wysokość dźwięku jest określona przez czas jednej oscylacji okresu
T lub przez częstotliwość f, przy pomocy następującego związku między tymi dwoma
wielkościami:
1
f=T
Gdy czas podany jest w sekundach, częstotliwość mierzymy w hercach (1 Hz = 1 s-1).
Maksymalna zmiana ciśnienia (amplituda fali) powiązana jest z natężeniem dźwięku, a przez
to z jego głośnością. Obydwie wielkości, częstotliwość i natężenie dźwięku, mogą zostać
przedstawione na wykresie częstotliwość – widmo, gdzie pozioma oś przedstawia
częstotliwość, a pionowa natężenie dźwięku.
*Leopold Mathelitsch, Ivo Verovnik, Akustische Phänomene, 2004, AULIS VERLAG DEUBNER GMBH &
CO KG, Köln (ISBN 3-7614-2532-5), Verlag öbv & hpt, Wien (ISBN 3-209-04585-2).
„Dźwięk”
Projekt Tewise
Wymienione powyżej wielkości mogą także zostać przedstawione na tak zwanym
spektrogramie lub sonogramie. Jest to rodzaj trójwymiarowego wykresu, gdzie oś pozioma
reprezentuje czas, pionowa częstotliwość, a natężenie dźwięku przedstawione jest jako różne
odcienie szarości. Widmo częstotliwości i sonogram różnią się głównie tym, że sonogram
pokazuje skład widmowy całego zapisu dźwiękowego, podczas gdy widmo częstotliwości
pokazuje tylko jego wycinek, krótki interwał czasowy.
Czysty dźwięk, taki jak pokazano na rysunku poniżej, jest bardzo rzadki w przyrodzie.
Drgania nigdy nie przyjmują idealnej formy sinusoidalnej. Ale za pomocą odpowiedniego
sprzęt elektronicznego można wygenerować drgania zbliżone do formy sinusoidalnej. Także
widelec kamertonu generuje dźwięk, który jest bardzo zbliżony do fali sinusoidalnej.
Dźwięk: a) forma falowa, b) widmo częstotliwości, c) sonogram
Złożenie dźwięków
W złożeniu dźwięków zmiany w ciśnieniu powietrza są okresowe, ale nie sinusoidalne (patrz
rysunek poniżej, gdzie przeanalizowano dźwięk trąbki).
Francuski matematyk Jean Fourier rozwinął teorię mówiącą, że każda funkcja okresowa może
zostać wyrażona za pomocą sum funkcji sinusoidalnych, gdzie częstotliwości argumentów są
wielokrotnościami bazowej częstotliwości f0.
Periodyczność zmian ciśnienia powietrza odzwierciedla się w seriach sinusoidalnych
przebiegów, widocznych w widmie częstotliwości. Różnice w natężeniach poszczególnych
części także mogą być pokazane na sonogramie.
Wysokość dźwięku (jak wysoki ton usłyszy odbiorca) określona jest przez częstotliwość
najniższego dźwięku, zwaną częstotliwością bazową. Liczba i natężenia wyższych dźwięków,
które nazywa się harmonikami nadają złożeniu dźwięków tembr i barwę. Ta właściwość
złożenia dźwięków powoduje różnice między, na przykład głosem trąbki, a klarnetu.
„Dźwięk”
Projekt Tewise
Złożenie dźwięków (trąbka): a) forma falowa, b) widmo częstotliwości, c) sonogram
Hałas
W zapisie falowym hałasu nie widać w ogóle periodyczności (patrz rysunek poniżej). W
hałasie mamy do czynienia z nieskończoną liczbą różnych dźwięków o różnych
częstotliwościach w zakresie określonego interwału. Można to przedstawić jako widmo
ciągłe. W naturze istnieje wiele rodzajów hałasu, różniących się od siebie rozkładem
widmowym. Pomiędzy nimi są takie odgłosy, jak dźwięki niektórych instrumentów
muzycznych (np. cymbały), głoski „s” lub „sz”, ryk silników odrzutowych albo szum
wodospadu (pokazanego na rysunku poniżej).
Hałas wodospadu: a) forma falowa, b) widmo częstotliwości, c) sonogram
Przykład dźwiękowy: TonKlangGeraeusch1.wav
„Dźwięk”
Projekt Tewise
Głos ludzki
Głos jest najbardziej istotnym instrumentem gatunku ludzkiego, ponieważ służy do
komunikacji, a także do wyrażania nastrojów i emocji; większość kultur nadała mu ponadto
artystyczny wymiar. Mimo ogromnego znaczenia głosu w życiu człowieka, jego podstawowe
zasady działania nie są zbyt dobrze znane ogółowi społeczeństwa.
W tym rozdziale przedyskutowano podstawowe elementy mowy. Przykłady dźwiękowe,
ilustrujące poszczególne tematy mogą być uzupełnione przez własne doświadczenia; ludzie
mogą nagrywać swoje głosy, analizować je i porównywać z innymi. Mogą ustalić zakres
częstotliwości i głośności swoich głosów, badać różnice w formowaniu samogłosek i
spółgłosek, porównywać swój „śpiew” z głosami lepszych i gorszych zawodowych
śpiewaków.
Struny głosowe
Ludzkie struny głosowe składają się pary umięśnionych fałd, których wewnętrzne brzegi
zakończone są elastyczną membraną. Struny głosowe są mocno połączone z wewnętrznym
brzegiem chrząstki tarczowatej. Chrząstka tarczowata może być umocowana z przodu krtani,
w przypadku mężczyzn jest ona nawet widoczna, jako wystająca część zwana jabłkiem
Adama. W tylnej części struny głosowe kończą się ruchomą chrząstką nalewkowatą, przez
którą mogą być one zwężane.
Po lewej: schematyczny rysunek aparatu mowy człowieka
Po prawej: Fotografia otwartych strun głosowych
Przy formowaniu dźwięku struny głosowe są na początku zamknięte. Poprzez kurczenie się
klatki piersiowej powietrze z płuc zostaje skierowane poprzez tchawice w kierunku strun
głosowych. To nadciśnienie powoduje rozsunięcie się strun głosowych, tak aby powietrze
mogło przepływać przez to rozwarcie, które nazywamy głośnią. Przepływ powietrza
powoduje podciśnienie w głośni (paradoks aerodynamiczny) i struny głosowe zamykają się
ponownie; następnie nadciśnienie ponownie wzrasta i cały cykl powtarza się. Proces ten
następuje bardzo szybko, a częstotliwość jego oscylacji determinuje wysokość generowanego
dźwięku. W przypadku wygenerowania przez śpiewaków dźwięku A4 (440 Hz) struny
głosowe muszą zamknąć się i otworzyć 440 razy w ciągu sekundy!
„Dźwięk”
Projekt Tewise
Specjalna cecha tych drgań polega na tym, że są zamknięte przez około połowę okresu
trwania drgania. Ten fakt, jak to zobaczymy później, ma daleko idące konsekwencje. Z tytułu
długiego czasu, gdy struny głosowe są zamknięte ich drgania różnią się silnie od drgań
sinusoidalnych. Dlatego drgania strun głosowych zawierają silne wyższe harmoniczne,
dźwięk generowany przez struny głosowe jest bogaty w wyższe harmoniczne. Można to
zobaczyć w widmie częstotliwości.
a) drgania strun głosowych, b) stowarzyszone widmo częstotliwości
Chłopcy i dziewczęta mają głosy o mniej więcej tej samej częstotliwości. W przypadku
chłopców, podczas dojrzewania płciowego hormon płciowy testosteron powoduje znaczne
powiększenie krtani (załamanie głosu). Chrząstka tarczowata rośnie (jabłko Adama), a struny
głosowe powiększają się o 1 cm. Następnie, masa fałd głosowych wzrasta, czego rezultatem
jest także wolniejszy ruch strun głosowych po okresie dojrzewania. Końcowym efektem jest
więc głos, który leży o około oktawę niżej niż głos dziecka.
Ten dźwięk strun głosowych niezbyt przypomina dźwięki, które znamy jako wymawiane
słowa lub śpiewane nuty. Jest to raczej nieokreślony dźwięk, przypominający niewyraźne
„aaaaaah”. Na następnych stronach wyjaśniono, jak taki dźwięk jest przemieniany w
melodyjny głos.
Przykład dźwiękowy: Stimmlippen1.wav
Samogłoski
Dźwięk generowane przez struny głosowe jest bogaty z zabarwienia, jakkolwiek nadal jest on
względnie słaby. Zostaje on wzmocniony przez jamę ustną, która działa jak rezonator. Na
dodatek, specyficzne rezonanse tej drogi głosowej powodują istotne zmiany w widmie
dźwięku, w szczególności w tworzeniu się samogłosek.
Charakterystyka rezonansu ust może być zrozumiana poprzez następującą analogię,
odpowiednio: w zgrubnym przybliżeniu jama ustna może być przedstawiona jako
cylindryczna rura o stałej średnicy, otwarta z jednej strony podczas mówienia lub śpiewania.
Pokazano już, że głośnia pomiędzy strunami głosowymi jest wąska, a struny głosowe są
półprzymknięte. Dlatego jama ustna przypomina rurę, która jest zamknięta z jednej strony.
„Dźwięk”
Projekt Tewise
Jeśli założymy, że długość jamy ustnej przeciętnego człowieka wynosi L = 17,5 cm i
wstawimy ją do wzoru na częstotliwości rezonansowe takiej rury:
c
fn = (2n + 1) 4L, n = 0, 1, 2, ...
otrzymamy częstotliwość bazowego dźwięku f0 = 500 Hz, a dla pierwszych dwu składowych
częstotliwości f1 = 1500 Hz, f2 = 2500 Hz. Te rezonanse jamy ustnej nazywa się formantami.
Ponieważ jama ustna nie ma jednolitego kształtu, rzeczywiste formanty nie posiadają
dokładnie tych wyliczonych częstotliwości. Co więcej, rezonanse mogą być przesuwane
poprzez zmiany w jamie ustnej, głównie z uwagi na ruchy języka.
Jeden z najważniejszych mechanizmów w generowaniu mowy zawiera się w fakcie, że
położenie formantów może zmieniać się w szerokim zakresie. Artykulacje poszczególnych
samogłosek jest wynikiem różnych położeń ust i języka, pomiar tego jest możliwy poprzez
mierzenie częstotliwości pierwszego i drugiego formantu. Fakty te pokazane są graficzne, a w
tabeli zebrano częstotliwości pierwszych dwu formantów dla męskiego i żeńskiego głosu.
Sonogram pojedynczych samogłosek, porównany z odpowiednim położeniem ust.
Samogłoski były wymawiane głosem o wysokości 100 Hz.
„Dźwięk”
Projekt Tewise
Częstotliwości
formantu [Hz]
a
e
i
o
U
730
530
270
570
300
M
850
610
310
590
370
Ż
1090
1840
2290
840
870
M
F2
1220
2330
2790
920
950
Ż
Średnia wartości pierwszych dwu formantów (F1 i F2) podstawowych samogłosek dla głosu męskiego (M) i
żeńskiego (Ż).
F1
Można zauważyć, że dla niektórych samogłosek częstotliwości pierwszych dwu formantów
leżą blisko siebie, chociaż dla „i” pierwszy formant leży stosunkowo nisko, drugi jest bardzo
wysoki. Jak już opisano, język odgrywa bardzo ważną rolę w artykulacji. Pierwszy formant
jest związany z wertykalną pozycją języka: wysoka pozycja języka (jak w przypadku „i”) daje
niską częstotliwość pierwszego formantu, niska pozycja (jak w przypadku „a”) skutkuje
wysoką częstotliwością w tym formancie. Horyzontalna pozycja języka wpływa natomiast na
drugi formant: gdy język znajduje się z przodu („i”) prowadzi to do wysokich częstotliwości,
jeśli język cofa się do tylnich partii jamy ustnej („o”) to odpowiednie częstotliwości są niskie.
Wysokość i artykulacja samogłosek są niezależnymi cechami, jak można to zobaczyć na
następnej ilustracji. Wysokość wzrastała od 100 Hz do 200 Hz, co mogło być obserwowane
jako wzrost częstotliwości bazowego dźwięku i wyższych harmonicznych. Samogłoska („e”)
pozostaje ta sama – formanty, tj. ciemno zabarwione obszary (zaznaczone przez strzałki),
pozostają wszędzie niezmienione.
Samogłoska „e” śpiewana początkowo z wysokością 100 Hz, a następnie z wysokością 200 Hz.
Pierwsze trzy formanty zaznaczone są strzałkami.
„Dźwięk”
Projekt Tewise
W wartościach w tabeli i na rysunku można zaobserwować rozbieżność: w tabeli drugi
formant dla głosu męskiego wynosi 1840 Hz, podczas gdy na rysunku pokazana jest wartość
1500 Hz. Powód tych rozbieżności leży w fakcie, że każda samogłoska może być
wyartykułowana w różny sposób: otwarcie, z naciskiem, nosowo, etc. Pomimo to, jest ona
rozpoznawana jako właściwa samogłoska. Tak więc, położenie formantu może zmieniać się w
pewnych granicach i każde z położeń będzie dodawać się do średniej wartości przedstawionej
w tabeli, w zakresach, w których dana samogłoska jest ciągle rozpoznawana: dla pierwszych
formantów jest to od 50 do 100 Hz wokół średnich wartości podanych w tabeli, dla drugich
formantów od 200 do 300 Hz, zarówno ku dolnym jak i górnym częstotliwościom.
Z tabeli i następnego rysunku ewidentnie widać, że formanty głosu żeńskiego leżą około 20%
wyżej niż analogiczne formanty głosu męskiego. Jak można to wytłumaczyć w obliczu faktu,
że przecież wysokość głosu żeńskiego jest o oktawę wyższa (współczynnik 2 w
częstotliwości)?
Głos żeński śpiewający podstawowe samogłoski z wysokością 300 Hz.
Powód tego leży w różnych mechanizmach tworzenia się wysokości i formantów. Jak
pokazano w poprzedniej części, wysokość dźwięku jest powodowana tempem drgań strun
głosowych. To, ponieważ struny głosowe u kobiet są krótsze i mniej masywne niż u
mężczyzn, prowadzi do dużych różnic w wysokości dźwięku. Formanty natomiast, są
określane przez długość jamy ustnej, a ponieważ głowa kobieca średnio nie jest dużo
mniejsza od głowy męskiej, więc mamy relatywnie mniejsze różnice jeśli chodzi o formanty.
Przykład dźwiękowy: Vokale1.wav, Vokale2.wav, Vokale3.wav
Spółgłoski
Dla spółgłosek stosuje się kilka akustycznych form złożeń dźwięków. W oparciu o te różne
wzory podstawowe można utworzyć klasyfikację spółgłosek.
Spółgłoski szczelinowe
Spółgłoski szczelinowe „f”, „s” i „sz” formowane są, gdy powietrze musi przejść przez
szczelinę, tworząc syczący dźwięk bez określonej częstotliwości. Dla spółgłoski „f” szczelina
tworzona jest między wargami a zębami, dla „s” pomiędzy językiem a przednią częścią
podniebienia.
„Dźwięk”
Projekt Tewise
Natomiast dla „sz” dźwięk jest generowany przez turbulentny przepływ powietrza między
językiem, a środkową częścią podniebienia. Tak wytworzona fala dźwiękowa (zawierająca
wiele częstotliwości), jest wciąż modyfikowana przez przednią część jamy ustnej: podobnie,
jak w przypadku formowania samogłosek rezonanse jamy ustnej wpływają na wytwarzane
dźwięki. Na poniższych wykresach można zobaczyć, że pewne zakresy częstotliwości
wykazują większe natężenie niż sąsiednie częstotliwości. Mogą one być uważane za swego
rodzaju formanty.
Widmo częstości dla spółgłosek „s” i „sz”
Spółgłoski zwarto-wybuchowe
„p”, „t” i „k” nazywane są spółgłoskami zwarto-wybuchowymi, ponieważ strumień powietrza
blokowany jest w różnych miejscach jamy ustnej. Zablokowane powietrze jest następnie
nagle uwalniane, powodując charakterystyczny dźwięk. Różnica pomiędzy trzema
spółgłoskami zwartymi bierze się z pozycji, gdzie zatrzymywany jest strumień powietrza: dla
„p” jest to pomiędzy wargami, dla „t” pomiędzy językiem a przednią częścią podniebienia, a
dla „k” pomiędzy językiem a tylnią częścią podniebienia.
Spółgłoski dźwięczne
W dotychczas omawianych mechanizmach formowania się spółgłosek struny głosowe nie
brały udziału. Dlatego spółgłoski te nazywamy bezdźwięcznymi. Dla spółgłosek dźwięcznych
„b”, „d” i „g”, dodatkowo obok mechanizmu blokowania przepływu powietrza wydawany
dźwięk ma swoje pochodzenie w krtani i strunach głosowych.
Spółgłoski nosowe
W celu wytworzenia spółgłoski nosowej, jama ustna na krótki okres czasu jest blokowana, a
strumień powietrza kierowany jest przez nos. Różnice pomiędzy spółgłoskami nosowymi
„m”, „n” i „g” biorą się z miejsca zablokowania jamy ustnej, kolejno: ust, przedniej i tylniej
części podniebienia.
„Dźwięk”
Projekt Tewise
Sonogram dla kilku spółgłosek
Przykład dźwiękowy: Konsonanten1.wav, Konsonanten2.wav
Szeptanie
Podczas mówienia albo śpiewania struny głosowa znajdują się początkowo w pozycji
zamkniętej, a następnie są wprowadzane w drgania o określonej częstotliwości. W trakcie
szeptania struny głosowe nie są całkowicie zamknięte. Zwykle tylnia część głośni tworzy
otwór w kształcie trójkąta, zwanego szepczącym trójkątem. Im większy szepczący trójkąt, tym
głośniejszy jest szept.
Pozycja strun głosowych w trakcie szeptania, tak zwany szepczący trójkąt zaznaczono czarnym kolorem
Przez głośnię strumień powietrza może stale przepływać nie powodując regularnych ruchów
strun głosowych. Jednakże, na zwężeniach tworzą się turbulencje, które, w kategoriach
akustycznych, odpowiadają hałasowi, tj. dźwiękowi, który zawiera wiele częstotliwości.
Hałas ten doświadcza takich samych zmian w jamie ustnej, jak dźwięki tworzone za pomocą
strun głosowych, tj. w zależności od ułożenia ust i języka różne częstotliwości są
wzmacniane. Występują tutaj dokładnie te same formanty, jakkolwiek, teraz pojawią się one
w formie pasm hałasu.
„Dźwięk”
Projekt Tewise
Częstotliwości drgań strun głosowych, tj. wysokość dźwięku, nie mają zbyt wielkiego
znaczenia w ludzkiej mowie, która opiera się głównie o samogłoski (formanty) i spółgłoski.
W szepczącym głosie nadal zawarta jest informacja, więc tekst wygłaszany szeptem jest nadal
zrozumiały. Z drugiej strony, szepczący głos traci charakterystyczną barwę, z brzmienia
szeptanego zdania niewiele można wywnioskować o osobowości mówiącego.
Samogłoski „a”, „e”, „i”. Po lewej: normalny głos, po prawej: szept
Na rysunku powyżej można zauważyć, że szept jest słabszy niż zwykły głos (szary kolor po
prawej stronie rysunku jest słabszy): gdy szepczemy, głośność naszego szeptu wynosi od 10
do 20 decybeli mniej niż w przypadku normalnego mowy.
Można z tego wynieść przekonanie, że mówienie bardzo cichym głosem, szeptanie, chroni
nasz głos. Szeptanie, jednakże, reprezentuje bardzo nienaturalną formę wydawania głosu. Z
powodu wysokich wartości przepływu powietrza przez szepczący trójkąt, szeptanie –
stosowane przez dłuższy czas – obciąża głos, a nawet może go zniszczyć i dlatego należy go
unikać.
Przykład dźwiękowy: Fluestern1.wav
Płacz dziecka
Na następnym rysunku zaprezentowano sonogram głosu niemowlęcia. Można rozpoznać
formanty (F1 i F2) o wysokości 1000 i 2800 Hz, razem z dźwiękiem bazowym o wysokości
około 440 Hz. Następnie dodano kilka – przeważnie nie-fizycznych – uwag, dotyczących
płaczu niemowlęcia.
Płacz nowonarodzonych dzieci ze wszystkich stron świata jest tej samej wysokości – od 400
do 450 Hz. Wytłumaczeniem tego faktu to, że właściwie rozwinięte niemowlęta prawie nie
różnią się do siebie rozmiarem głowy, czy stopniem rozwoju centralnego układu nerwowego.
Można zastanawiać się, czy jest to tylko przypadkowa zbieżność, że podstawowy dźwięk,
według którego orkiestra stroi instrumenty, ma tę samą częstotliwość co płacz niemowlęcia.
„Dźwięk”
Projekt Tewise
Spektrogram (po lewej) i średnie widmo częstotliwości (po prawej) płaczu niemowlęcia
Przykład dźwiękowy: Baby1.wav
CD-ROM pt.: „Zjawiska akustyczne”
Informacje
CD-ROM ten został stworzony jako dodatek do książki „Zjawiska akustyczne” (niem.
Akustiche Phanoemene, Praktyczna Fizyka Drukowana, Wydawnictwo Aulis, Wiedeń). Jego
zawartość stanowią przykłady dźwiękowe opisane w książce. Dlatego też, czytelnik może
posłuchać tych przykładów, powtórzyć ich analizę, a także przeprowadzać dalsze badania.
Dodatkowo, do plików dźwiękowych na CD-ROMie umieszczono także shareware’owy
program Cool Edit 2000, edytor dźwięku, który był używany przez autorów książki. Program
ten może być zainstalowany na każdym komputerze klasy PC z system operacyjnym MS
Windows. Poza ww. programem, do edycji i analizy dźwięku można równie dobrze używać
innych programów. Między nimi znajdują się programy znacznie bardziej złożone, a co za
tym idzie droższe, ale można także znaleźć sporo programów darmowych (tzw. freeware), jak
na przykład Audacity (http://audacity.sourceforge.net/).
Na CD-ROMie znajdują się następujące pliki:
Readme Information.doc - tekst podobny do tego, który czytasz (tylko po niemiecku).
Readme Information Cool Edit.doc – “Jak używać programu Cool Edit”.
Readme Installation Cool Edit.doc – “Jak zainstalować program Cool Edit”.
ce2kmain.exe – Aplikacja instalacyjna programu Cool Edit 2000.
Przykład dźwiękowys – Pliki dźwiękowe w formacie *.wav.
Struktura przykładów dźwiękowych odpowiada strukturze książki „Zjawiska akustyczne”.
- Pierwszy poziom odpowiada pięciu rozdziałom książki.
- Drugi poziom odpowiada podrozdziałom.
- Na ostatnim poziomie znajdują się pliki dźwiękowe w formacie *.wav. Nazwy plików
odpowiadają nazwom umieszczonym na końcu każdego z podrozdziałów.
„Dźwięk”
Projekt Tewise
1. Podstawy dźwięku
01 Ton, złożony ton, hałas
TonKlangGeraeusch1.wav
02 Kształt fal dźwiękowych
Wellenformen1.wav, Wellenformen2.wav, Wellenformen3.wav,
Wellenformen4.wav
03 Otwarte i zamknięte rury
Pfeife1.wav
04 Rezonator Helmholtza
Helmholtz1.wav
05 Bicie
Schwebungen1.wav, Schwebungen2.wav, Schwebungen3.wav
06 Szybkość dźwięku
Geschwindigkeit1.wav, Geschwindigkeit2.wav, Geschwindigkeit3.wav
Geschwindigkeit4.wav
07 Pochłanianie dźwięków
Absorption1.wav
08 Efekt Dopplera
Doppler1.wav
09 Rura Macha
Mach1.wav, Mach2.wav
10 Wysokość dźwięku
Tonhoehe1.wav, Tonhoehe2.wav
11 Głośność
Lautstaerke1.wav
12 Konsonans i dysonans
Konsonanz1.wav, Konsonanz2.wav
2. Naturalne zjawiska akustyczne
01 Odgłos wiatru
Wind1.wav, Wind2.wav
02 Piorun
Donner1.wav
03 Krople wody
Wassertropfen1.wav, Wassertropfen2.wav
04 Wodospad i hałas
Wasserfall1.wav
05 Muszla morska
Muschel1.wav
06 Żaby
Froesche1.wav
07 Ptaki
Voegel1.wav, Voegel2.wav, Voegel3.wav
08 Nietoperze
Fledermaus1.wav
09 Zwierzętna kopytne
Huftiere1.wav
„Dźwięk”
Projekt Tewise
10 Małpy
Affen1.wav
11 Odgłosy pracy serca
Herz1.wav
12 Odgłosy pracy mięśni
Muskel1.wav, Muskel2.wav
3. Głos ludzki
01 Struny głosowe
Stimmlippen1.wav
02 Samogłoski
Vokale1.wav, Vokale2.wav, Vokale3.wav
03 Spółgłoski
Konsonanten1.wav, Konsonanten2.wav
04 Szept
Fluestern1.wav
05 Płacz niemowlęcia
Baby1.wav
06 Formanty śpiewu
Gesangsformant1.wav
07 Vibrato
Vibrato1.wav, Vibrato2.wav, Vibrato3.wav
08 Gwizdanie
Pfeifen1.wav
09 Chemiczne głosy
Chemische1.wav
4. Odgłosy urządzeń technicznych i domowych
01 Syreny
Sirene1.wav
02 Wiertarka dentystyczna
Zahnbohrer1.wav
03 Transformator i linie wysokiego napięcia
Transformator1.wav
04 Koła samochodowe
Autoreifen1.wav
05 Silnik samochodu
Automotor1.wav
06 Śmigłowiec
Hubschrauber1.wav
07 Cyfrowe nagranie dźwięku
Digital1.wav, Digital2.wav
08 Przetworzenie dźwięku
MP3.wav
09 Telefon
Telefon1.wav
„Dźwięk”
Projekt Tewise
10 Szklanka wody
Wasserglas1.wav, Wasserglas2.wav
11 Napełnianie szklanki
Einfuellen1.wav
12 Lampka wina
Weinglas1.wav, Weinglas2.wav
5. Instrumenty muzyczne
01 Kamerton
Stimmgabel1.wav, Stimmgabel2.wav
02 Kościelne dzwony
Glocken1.wav, Glocken2.wav, Glocken3.wav, Glocken4.wav
03 Monochord
Monochord1.wav
04 Skrzypce
Geige1.wav, Geige2.wav
05 Rejestrator
Blockfloete1.wav
06 Klarnet
Klarinette1.wav
07 Puzon
Zugposaune1.wav
08 Kotły i bębny
PaukenTrommeln1.wav
09 Harfa
Maultrommel1.wav
Cool Edit 2000 1.1
Instalacja
Program Cool Edit 200 może zostać zainstalowany na każdym komputerze klasy PC,
posiadającym system operacyjny MS Windows: 95, 98, ME, NT, 2000, XP.
Typowa instalacja powinna przebiegać według następującego schematu:
-
Włóż CD-ROM do napędu CD komputera.
-
Wejdź na CD-ROM i dwukrotnie kliknij na pliku ce2kmain.exe.
-
Kliknij OK, aby rozpocząć instalację programu.
Teraz stosuj się do instrukcji podawanych przez program instalacyjny.
-
W oknie Select destination directory możesz wybrać lokalizację programu na dysku
swojego komputera lub zgodzić się z proponowaną przez program lokalizacją
C:\Program Files\Cool2000
„Dźwięk”
Projekt Tewise
-
W oknie Audio file association możesz wybrać, które pliki dźwiękowe zostaną
stowarzyszone z programem Cool Edit (będzie on używany do ich otwierania). Jeśli,
na przykład chcesz, aby pliki *.mp3 były stowarzyszone z inną aplikacją musisz
odznaczyć odpowiednią pozycję.
-
W oknie Shortcut on desktop możesz wybrać, czy Cool Edit ma umieścić swój skrót
na Pulpicie Twojego komputera (zalecane przy częstym używaniu programu). W
przeciwnym wypadku program będzie uruchamiany z menu startowego.
-
Po zakończeniu instalacji pojawi się okno Cool Edit 2000 - Trial version. Okno to
pojawia się zawsze przy uruchamianiu niezarejestrowanej wersji programu. Teraz,
przy każdym starcie, można wybrać dwie opcje (z ośmiu), które określą, jakie funkcje
programu zostaną zablokowane. Po wyborze pierwszych dwu opcje (zalecane) można
używać i badać wszystkie przykłady dźwiękowe zamieszczone na CD-ROMie. Po
kliknięciu OK załaduje się i zostanie automatycznie odtworzony plik dźwiękowy
Good Sound Stuff.au, żeby sprawdzić, czy instalacja przebiegła prawidłowo. Jeśli
nagranie pojawi się na ekranie i zostanie odtworzona muzyka, oznaczać to będzie, że
instalacja programu została zakończona. Następnie program można zamknąć.
-
Uruchamianie programu. Są dwie możliwości: jeśli na Pulpicie został umieszczony
skrót do programu, należy po prostu dwukrotnie kliknąć na ikonie Cool Edit 2000 i
program wystartuje. Jeśli nie ma skrótu na Pulpicie, można program uruchomić z
menu startowego: Start\Programy\Cool Edit 2000\Cool Edit 2000.
Po wystartowaniu programu, gdy pojawi się okno Cool Edit 2000 - Trial version, można
dokonać zakupu pełnej wersji poprzez kliknięcie przycisku Buy Now.
Cool Edit 2000 1.1.
Podstawowa instrukcja
W tym miejscu opisano kilka najważniejszych porad dotyczących używania programu Cool
Edit.
Instrukcje dotyczące instalacji programu dostępne są w oddzielnym rozdziale (Instalacja
programu Cool Edit).
Program może być używany do nagrywania i odtwarzania dźwięku, a także do
przeprowadzania analizy zarejestrowanych dźwięków.
Wyniki analiz mogą zostać przedstawione w różny sposób:
Forma falowa:
Diagram przedstawiający rozkład ciśnienia akustycznego w czasie.
Widmo częstotliwości:
Składniki widmowe, obliczone za pomocą analizy Fouriera z krótkich interwałów czasowych.
Spektrogram lub sonogram:
Trójwymiarowy diagram przedstawiający rozkład składników widmowych w czasie.
„Dźwięk”
Projekt Tewise
Po uruchomieniu programu, pojawi się okno startowe programu, lecz nie zostanie otwarty
żaden plik. Podstawowe komendy, które są dostępne z menu są bardzo podobne do komend
używanych w innych programach użytkowych środowiska MS Windows. Kompletną
informację o programie i jego działaniu można znaleźć klikając na polecenie menu Help
(Pomoc). Początkującym użytkownikom radzi się, aby uruchomili animowanego „tutora”:
Help\Tutorials\Overview of Cool Edit 2000.
Podstawowe informacje potrzebne do oglądania przykładów dźwiękowych zamieszczonych
na CD-ROMie podane są poniżej.
Otwieranie pliku
Aby otworzyć plik należy użyć polecenia File\Open, a następnie wybrać pożądany plik, który
przeważnie znajdować się będzie między innymi plikami dźwiękowymi. Wszystkie przykłady
dźwiękowe z CD-ROMu są plikami typu *.wav. Poza używaniem poleceń menu, można także
używać ikon poleceń z paska narzędziowego menu.
Wyświetlanie formy falowej lub sonogramu
Plik jest otwierany w postaci formy falowej lub sonogramu, zależy to od początkowych
ustawień programu. Widok pliku można zmieniać za pomocą poleceń: View\Waveform view
lub View\Spectral view.
Ustawianie rozdzielczości widmowej
Obraz widma (sonogramu) pokazuje rozkład składników widmowych całego pliku
dźwiękowego. Rozdzielczość widmowa może przyjmować różne wartości, a wartość
początkowa zwykle nie pasuje do naszych potrzeb. Ma ona wartość 64. Oznacza to, że w
obliczeniach FFT (Fast Fourier Transformation - szybka transformata Fouriera) używane są
64 cyfrowe próbki nagranego dźwięku. Wartość rozdzielczość zawsze równoważna jest 2n,
gdzie n jest dodatnią liczbą całkowitą. Wartość tę można zmienić na, np. 512 za pomocą
polecenia: Options\Settings\Spectral, następnie w polu Resolution zamiast 64 należy
wybrać lub wpisać 512 i kliknąć przycisk OK. Dla przykładów dźwiękowych z książki
rozdzielczość widmowa była ustawiona na 512 lub 1024. Te wartości zależą od tego, co się
chce pokazać. Niższa wartość rozdzielczości pokazuje niższą rozdzielczość na osi
częstotliwości, ale wyższą na osi czasu. Przy wysokich wartościach rozdzielczości widmowej
jest na odwrót. Zwykle, jeśli nagranie zostało wykonane przy niskiej częstotliwości
próbkowania, to rozdzielczość także może być niska i uzyskamy wyraźny sonogram.
Zoom (powiększenie)
Czasami trzeba na całym ekranie pokazać jedynie niewielki interwał czasowy wykresu fali
albo sonogramu (powiększanie osi poziomej). Można to zrobić zaznaczając za pomocą
kursora część wykresu, którą chcemy obejrzeć (klikając i „przeciągając” kursor). Zaznaczona
część zostanie teraz wyświetlona we wzajemnie uzupełniających się barwach. Ikona
powiększenia, położona blisko lewego dolnego rogu okna używana jest do określania różnych
typów powiększenia. Do zmiany rozmiarów zaznaczenia do rozmiarów całego ekranu należy
kliknąć na ikonę
. Klikając na ikonie
przywrócimy zaznaczeniu oryginalne rozmiary.
W celu uzyskania powiększenia lub pomniejszenia widoku sonogramu z zachowaniem skali
częstotliwości (oś pionowa), należy wykorzystać dwie ikony w prawym dolnym rogu okna.
Klikając na ikonie
powiększamy sonagram, a klikając na ikonie
pomniejszamy go.
Podobny efekt można uzyskać klikając prawym przyciskiem myszy na prawej ramce
sonogramu.
„Dźwięk”
Projekt Tewise
Wyświetlanie widma częstotliwości
Widmo częstotliwości pokazuje składniki widmowe (wykres częstotliwość – natężenie)
stosunkowo krótkiego interwału czasowego nagrania dźwiękowego. Aby pokazać widmo od
wybranego punktu nagrania, które przedstawione jest jako sonogram lub w formie falowej,
należy najpierw zaznaczyć roboczą przestrzeń w wybranej wartości czasu (położenie
poziome). Następnie, należy wybrać polecenie Analyze/Frequency analysis, aby pokazać
widmo częstotliwości od tego punktu nagrania.
Czasami użyteczniejsze jest obejrzenie średniego widma częstotliwości z wybranego
interwału czasowego. W tym przypadku, procedura postępowania jest podobna do tej, która
została opisana powyżej, z tym, że w przeciwieństwie do poprzedniego przypadku nie
zaznacza się tylko jednego punktu, ale cały interwał czasowy. Po wybraniu polecenia
Analyze/Frequency analysis wyświetla się widmo częstotliwości środkowego punktu
zaznaczonego interwału. Aby uzyskać średnią z całego interwału należy użyć przycisku Scan,
znajdującego się w prawym dolnym rogu okna. Po odpowiednim czasie (długość obliczeń
zależy głównie od tego jak szybkim komputerem dysponujemy i jak długi interwał został
wybrany) otrzymamy średnie widmo.
Aby zmienić kształt lub rozmiar okna z widmem częstotliwości należy kliknąć i
„przeciągnąć” ramkę okna do pożądanej wielkości.
Rozdzielczość widmowa używana w obliczeniach widma częstotliwości może zostać
ustawiona w polu FFT Size, które położone jest w lewym dolnym rogu okna, pokazującego
widmo.
Jeśli chcemy odtworzyć nagranie dźwiękowe i w tym samym czasie oglądać jego widmo,
śledząc zmiany składników widma dźwięku, najwyższa wartość ustawiona w polu FFT Size
nie może przekraczać 1024.
Wykonywanie nagrań dźwiękowych za pomocą programu Cool Edit
Zaleca się następującą procedurę.
Mikrofon musi być podłączony do odpowiedniego gniazda (zobacz oznaczenia). Następnie
można nagrywać dźwięki, używając jednego z wielu programów do nagrywania (np.
Rejestrator dźwięków). My będziemy używać programu Cool Edit. Po uruchomieniu
, położony blisko lewego dolnego rogu okna.
programu naciskamy przycisk
Pojawi się okno New Waveform. Mamy tu kilka opcji ustawień: Sample rate (ilość próbek
na sekundę), Chanels (mono lub stereo) i Resolution (ilość bitów użytych dla każdej próbki,
np. 8, 16, 24, 32 bity; zależeć to będzie od karty dźwiękowej). 16 bitów zwykle jest
odpowiednie dla naszych potrzeb. Po kliknięciu przycisku OK program rozpoczyna
nagrywanie.
„Dźwięk”
Projekt Tewise
Klikając na przycisku
przerywamy nagrywanie. Na tym etapie nagranie, które
otrzymaliśmy jest gotowe do dalszej edycji, powielenia lub zapisania. Nagranie może zostać
zapisane na każdym nośniku danych. Zwykle jest to twardy dysk komputera. W tym celu
używamy polecenia: File / Save as…, podobnie jak ma to miejsce w innych programach
komputerowych.
Podobna procedura musi zostać powtórzona, gdy nagrywamy dźwięk z innych urządzeń
audio, jak na przykład radio, magnetofon, walkman, etc. Wejście Line out lub Phones w
urządzeniu audio musi zostać połączone za pomocą kabla z wejściem Line in w komputerze
(w niektórych komputerach można do tego celu wykorzystać wejście mikrofonowe). Należy
pamiętać, aby upewnić się, że opcja Line in we „właściwościach głośności” nie jest
wyciszona.
Kilka ćwiczeń polecanych do wykonania przy pomocy programu Cool Edit
1. Otwórz plik dźwiękowy TonKlangGeraeusch1.wav. Składa się on z trzech części:
czystego tonu, złożonego dźwięku i hałasu. Odtwórz plik. Zatrzymaj odtwarzanie mniej
więcej pośrodku, a następnie odtwarzaj nagranie od tej pozycji. Wybierz jedną część
nagrania i odtwórz ją. Odtwarzaj ją cyklicznie (w pętli). Zatrzymaj odtwarzanie.
2. Przełącz widok między formą falową a widmem.
3. Wyświetl szczegóły czasowe każdej z trzech części, można też śledzić rozkład ciśnienia
akustycznego w czasie.
4. Zmierz czas jednego okresu w przypadku czystego tonu i złożenia dźwięków. Dokładność
może być lepsza, gdy pomierzysz kilka okresów, następnie obliczysz ich średnią
arytmetyczną. Zapisz te wartości.
5. Wyświetl średnie widmo dla każdej z trzech części nagrania.
6. Zmień rozmiar okna z widmem (wysokość, szerokość, a następnie obie wielkości na raz).
7. Wyświetl średnie widmo hałasu i zmień wartość FFT z 2048 na 256. Jakie zauważyłeś
różnice? To samo wykonaj w przypadku czystego tonu i złożenia dźwięków.
„Dźwięk”
Projekt Tewise
8. Zmierz częstotliwość czystego tonu i częstotliwość bazową złożenia dźwięków, używając
widm i spektrogramów.
9. Które częstotliwości są najmocniejsze w widmie ciągłym hałasu wodospadu (ostatnia
część nagrania).
10. Wytnij część poliwinylowej rurki o długości od 6 do 12 cm. Zamknij jeden z jej końców
kciukiem i spróbuj zagwizdać na rurce dmuchając nad otwartym końcem rurki. Spróbuj
uzyskać wyższy dźwięk.
11. Wykonania nagrania gwizdnięcia: podłącz mikrofon do komputera i wykonaj nagranie
dźwięku wykonanego gwizdka. Jeśli to możliwe nagraj nie tylko niższe, ale i wyższe
tony. Ustawienia nagrania: Sample rate: 16K, Resolution: 16 bitów, Channel: 1.
12. Zapisz nagranie.
13. Zamknij plik, zamknij program Cool Edit i uruchom go ponownie. Otwórz swój plik
dźwiękowy i spróbuj dokonać jego edycji i analizy. Wytnij niechciane części nagrania
(kliknij i przeciągnij kursor myszy przez niechciany obszar wykresy i naciśnij klawisze
Delete). Wyświetl widmo wybranych części nagrania, a następnie wyświetl spektrogram
całego nagrania.
14. Porównaj teoretyczne przewidywania częstotliwości rezonansowych zamkniętej z jednej
strony rurki z uzyskanymi przez siebie wynikami z analizy widma. Używając
najprostszego modelu, teoretycznie częstotliwość bazowa rury zamkniętej z jednej strony
odpowiada rurze, której długość wynosi jedną czwartą długości fali.
15. Nagraj swój głos. Wypowiadaj różne samogłoski, np. a, e, i, o, u lub proste słowa.
Wykonaj analizy nagrań. Spróbuj znaleźć rozdzielczość (wartość FFT), która najlepiej
nadaje się dla wymawianych słów. Wypróbuj przynajmniej następujące wartości FFT:
128, 256, 512, 1024, 2048 i 4096.
16. Jeśli masz czas, zmierz kilka innych dźwięków, np. kamerton, etc.
17. Spróbuj zbadać inne możliwości programu Cool Edit 2000. Przeczytaj Help oferowany
przez ten program.
18. Cool Edit jest tylko jednym z wielu programów do edycji i analizy plików dźwiękowych.
W ciągu najbliższego czasu pojawi się kilka nowych programów o podobnych
możliwościach. Między nimi są także programy darmowe (freeware). Jednym z nich jest
AUDACITY, który można uzyskać ze strony internetowej http://audacity.sourceforge.net/
Spróbuj uzyskać ten program (ma on ok. 2,4 MB), zainstalować go i wypróbować.
„Dźwięk”

Podobne dokumenty