(Microsoft PowerPoint - Konwersja sygna\263u analogowego na

Transkrypt

(Microsoft PowerPoint - Konwersja sygna\263u analogowego na
Konwersja dźwięku analogowego do
postaci cyfrowej
Schemat postępowania podczas przetwarzania sygnału
analogowego na cyfrowy nie jest skomplikowana.
W pierwszej kolejności trzeba wyjaśnić kilka elementarnych
pojęć związanych z postacią sygnału akustycznego w formie
analogowej, przetwarzaniem AD oraz postacią sygnału
akustycznego w formie cyfrowej.
Przetwornik analogowo-cyfrowy A/C (ang. A/D analog to digital), to układ służący do zamiany sygnału
analogowego (ciągłego) na dyskretny ciąg liczb, zależny
od wykorzystywanego systemu. Działanie przeciwne
do wyżej wymienionego wykonuje przetwornik
cyfrowo-analogowy C/A.
Jak wiadomo, sygnał audio w postaci analogowej jest niczym innym jak
przebiegiem wartości amplitudy prądu względem czasu
Wartość amplitudy sygnału (popularnie nazywane VU) przekłada się
na poziom dBU czyli poziom akustyczny sygnału. Bierze się to stąd, że
dźwięk będący efektem pracy muzyka w studio nagraniowym,
odbierany jest przez mikrofony, które są elementem aktywnym
przetwarzającym drgania fali akustycznej na falowe drgania
elektryczne o częstotliwości i poziomie analogicznych do poziomu
odebranej fali akustycznej.
Tak otrzymujemy analogową postać sygnału dźwiękowego pod
postacią przebiegu falowego prądu.
Teraz kiedy wiemy już czym jest dźwięk pod postacią
analogową opisać trzeba sposób na przetworzenie go w
ciąg zer i jedynek.
Aby było to możliwe naukowcy opracowali trzystopniowy
proces przekształcania sygnału analogowego na cyfrowy.
PRÓBKOWANIE, KWANTYZACJA, KODOWANIE - oto te trzy
stopnie.
Każdy z nas spotkał się niejednokrotnie z zestawem wartości opisujących np.
plik .WAV, .MP3, .WMA, .MPC itd.
Większość popularnych odtwarzaczy programowych takich jak np.
Foobar2000 daje nam możliwość wglądu w te charakterystyczne dla pliku
dźwiękowego właściwości. W Foobar2000 klikamy prawym przyciskiem
myszy na dowolnej pozycji z listy utworów i wybieramy z menu
kontekstowego "Properties...„
W dalszej części zajęć uczniowie ściągają z sieci instalkę footbar2000, instalują na
swoim komputerze i postępują według powyższych wskazówek
Z prawej strony okna zobaczyć możemy właściwości techniczne pliku
dźwiękowego. Są to:
Bitrate, Samplerate, oraz Codec. Informacje te pomogą nam ocenić jakość i
system kodowania wybranej ścieżki
Teraz zajmiemy się procesem zamiany sygnału analogowego na postać cyfrową,
opisując po drodze w/w właściwości plików dźwiękowych.
Bitrate
Średnia bitowa (kompresja danych) – średnia liczba bitów potrzebna na
wyrażenie symbolu. Stosunek liczby bitów do liczby symboli. Innymi słowy
można nim określić współczynnik, który mówi ile bitów danych zostało użytych
do zapisu dźwięku lub obrazu w określonej jednostce czasu (zwykle 1sekunda)
Próbkowaniem nazywamy proces pomiaru wartości chwilowej danego sygnału ze
stałą częstotliwością. Częstotliwość tą nazywamy CZĘSTOTLIWOŚCIĄ
PRÓBKOWANIA (Samplerate).
W przypadku częstotliwości 44100Hz, która jest standardową częstotliwością
próbkowania dla materiału audio zapisywanego na płytach CD-Audio,
próbkowanie jest wykonywane 44100 razy na sekundę co daje nam do dyspozycji
44100 próbek (z których każda ma pewną określoną wartość) w ciągu sekundy.
Już teraz wyciągnąć możemy prosty wniosek, iż im większa będzie częstotliwość
próbkowania, tym dokładniejszy obraz sygnału otrzymamy. Częstotliwość
próbkowania zawsze określona była zasadą, iż musi być ona przynajmniej dwa
razy większa niż maksymalna częstotliwość składowa sygnału na wejściu
przetwornika. Częstotliwości próbkowania dla plików .MP3 i innych formatów
przechowywania dźwięku (stratnych jak i bezstratnych) bardzo często osiąga
wartość 48000Hz, jest to także standard dla dźwięku zawartego na płytach DVD.
KWANTYZACJA
Kwantyzacja jest to proces mający na celu przedstawienie nieskończonej
wartości sygnału analogowego pod postacią skończonego ciągu zer i jedynek.
Jest to proces niemożliwy z matematycznego punktu widzenia jednak stopień w
jakim algebra binarna pozwala nam na odwzorowanie jest w zupełności
wystarczający.
Brzmi to dosyć niejasno więc małe objaśnienie:
Wyobraźmy sobie prosty układ dwóch współrzędnych. Oś X i
oś Y, zupełnie jak na matematyce podstawówce. Oś X
pozioma, oś Y pionowa.
Na osi X opiszemy sobie czas w sekundach, od 0 (początek
układu) do 1 sekundy. Na pionowej osi Y opiszemy poziom
naszego sygnału w dBU.
Nie trudno jest sobie wyobrazić teraz funkcję obrazującą
sekundowy urywek naszego sygnału: linia falista wzdłużna do
osi X, której wybrane punkty znajdują się na wysokości
danych wartości na osi Y.:
Teraz rzecz odrobinę trudniejsza do wyobrażenia. Wyobraźmy sobie iż oś X od
punktu 0 do punktu 1s podzielona jest na 44100 równych części. Taka jest podziałka
osi X w tym przypadku 1/44100. Oznacza to, że mamy 44100 punktów które staną
się naszymi punktami odniesienia do osi Y
W przypadku gdybyśmy chcieli odczytać wartość każdej z 44100 próbek na osi Y w
sposób analogowy, nie byłoby żadnego problemu. Prowadzimy dwie proste. Jedna
prosta prostopadła do osi X, przechodząca przez jeden z 44100 punktów a druga
prosta prostopadła do osi Y i równoległa do osi X. Proste te przeciąć się mają w
punkcie którego wartość chcemy odczytać. Nic prostszego:
W przypadku gdy chcemy przedstawić wartość jednej z 44100 próbek w systemie
binarnym sprawa się komplikuje. Już zauważyliśmy w krótki powtórzeniu wiadomości z
zakresu techniki cyfrowej, wartość dziesiętna jaką możemy się posłużyć ograniczona
jest ilością bitów w słowie binarnym. Co to oznacza w tym przypadku?
Oznacza to, iż zakres wartości jakie będziemy mogli odczytać z osi Y opisanej w
systemie binarnym uzależniony jest od długości słowa opisującego każdą pojedynczą
wartość. Poniżej przedstawiony jest przykład opisania wartości sygnału w sposób
binarny przy pomocy słowa 2-bitowego:
Jak widać zakres wartości sygnału opisanego słowem 2-bitowym wynosi od 0 do 3
jednostek. tutaj podkreślic trzeba że z badanego sygnału w przypadku opisywania
go wartościami binarnymi do dyspozycji mamy tylko wartości reprezentowane
przez słowa binarne i żadnych pośrednich między nimi! (w przypadku słowa 2bitowego do dyspozycji mamy tylko 4 wartości!)
Nasuwa sie prosty wniosek, że opisywanie jakiegokolwiek sygnału złożonego z
więcej niż czterech wartości nie ma większego sensu gdyż błąd odwzorowania
będzie tak duży, że nie pozwoli nam na nawet przybliżone odtworzenie sygnału
wzorcowego.
Dopisywania wartości sygnału używamz słowa 16-bitowego. Tutaj sprawa ma się już
lepiej, gdyż do dyspozycji mamy 65536 wartości (od 0 do 65535). Zakres ten jest
olbrzymi i pozwala nam na wierne odwzorowanie wartości jednej z naszych 44100
próbek.
Dla płyt Audio-CD wartości próbkowania i kwantyzacji to 44100Hz i 16 bitowe
słowo opisujące każdą próbkę. Dla materiałów dźwiękowych zapisywanych na
płytach DVD słowo opisujące każdą z 96000 lub 192000 próbek ma długość 24
bitów (daje nam to prawie 17 milionów możliwych wartości!).
Pozostańmy jednak przy naszych 16 bitach i 44100 próbkach na każdą sekundę
ścieżki.
KODOWANIE:
Zasada kodowania jest bardzo prosta:
16 bitów każdej z 44100 próbek tworzy ramkę w której każdy bit znajduje się w
odpowiedniej szczelinie czasowej (każda szczelina trwa tyle samo) stąd wniosej iż
każda ramka trwa tyle samo. Pozwala to na zachowanie pewności, iż każda sekunda
naszej ścieżki będzie trwała tyle samo.
W przypadku kodowania ścieżki audio w systemie PCM stereo do czynienia mamy
tak na prawdę z dwoma ścieżkami które są poddawane próbkowaniu i kwantyzacji
w identyczny sposób a następnie w procesie kodowania zapisywane pod postacią
jednego ciągu informacji (np. plik .WAV).
W przypadku dźwięku wielokanałowego PCM sytuacja jest podobna z tą różnicą, że
ścieżki każdego z kanałów mapowane są podczas kodowania na każdy z kanałów (4
lub 6). Jest to definicja bartdzo uproszczona gdyż kodowanie dźwięku
wielokanałowego jest duzo bardziej skomplikowane od kodowania dźwięku mono
lub stereo.
Wspomnieć trzeba jeszcze o takich systemach kodowania dźwięku przestrzennego
jak DolbyDigital czy DTS w przypadku których algorytmy kodowania, w tym
mapowania są bardziej skomplikowane niż w przypadku kodowania PCM.
Sygnał zakodowany pewnym algorytmem trafia na nośnik danych, opatrywany jest
w piękna okładkę a następnie wyczekuje na swojego właściciela w sklepie.
Kiedy kupujemy płytę a następnie wkładamy do odtwarzacza następuje proces
odwrotny do opisanego powyżej. Dekodowanie, odczyt wartości próbek i
rekombinacja sygnału analogowego który p[rzez głośniki trafia do naszych uszu.

Podobne dokumenty