(Microsoft PowerPoint - Konwersja sygna\263u analogowego na
Transkrypt
(Microsoft PowerPoint - Konwersja sygna\263u analogowego na
Konwersja dźwięku analogowego do postaci cyfrowej Schemat postępowania podczas przetwarzania sygnału analogowego na cyfrowy nie jest skomplikowana. W pierwszej kolejności trzeba wyjaśnić kilka elementarnych pojęć związanych z postacią sygnału akustycznego w formie analogowej, przetwarzaniem AD oraz postacią sygnału akustycznego w formie cyfrowej. Przetwornik analogowo-cyfrowy A/C (ang. A/D analog to digital), to układ służący do zamiany sygnału analogowego (ciągłego) na dyskretny ciąg liczb, zależny od wykorzystywanego systemu. Działanie przeciwne do wyżej wymienionego wykonuje przetwornik cyfrowo-analogowy C/A. Jak wiadomo, sygnał audio w postaci analogowej jest niczym innym jak przebiegiem wartości amplitudy prądu względem czasu Wartość amplitudy sygnału (popularnie nazywane VU) przekłada się na poziom dBU czyli poziom akustyczny sygnału. Bierze się to stąd, że dźwięk będący efektem pracy muzyka w studio nagraniowym, odbierany jest przez mikrofony, które są elementem aktywnym przetwarzającym drgania fali akustycznej na falowe drgania elektryczne o częstotliwości i poziomie analogicznych do poziomu odebranej fali akustycznej. Tak otrzymujemy analogową postać sygnału dźwiękowego pod postacią przebiegu falowego prądu. Teraz kiedy wiemy już czym jest dźwięk pod postacią analogową opisać trzeba sposób na przetworzenie go w ciąg zer i jedynek. Aby było to możliwe naukowcy opracowali trzystopniowy proces przekształcania sygnału analogowego na cyfrowy. PRÓBKOWANIE, KWANTYZACJA, KODOWANIE - oto te trzy stopnie. Każdy z nas spotkał się niejednokrotnie z zestawem wartości opisujących np. plik .WAV, .MP3, .WMA, .MPC itd. Większość popularnych odtwarzaczy programowych takich jak np. Foobar2000 daje nam możliwość wglądu w te charakterystyczne dla pliku dźwiękowego właściwości. W Foobar2000 klikamy prawym przyciskiem myszy na dowolnej pozycji z listy utworów i wybieramy z menu kontekstowego "Properties...„ W dalszej części zajęć uczniowie ściągają z sieci instalkę footbar2000, instalują na swoim komputerze i postępują według powyższych wskazówek Z prawej strony okna zobaczyć możemy właściwości techniczne pliku dźwiękowego. Są to: Bitrate, Samplerate, oraz Codec. Informacje te pomogą nam ocenić jakość i system kodowania wybranej ścieżki Teraz zajmiemy się procesem zamiany sygnału analogowego na postać cyfrową, opisując po drodze w/w właściwości plików dźwiękowych. Bitrate Średnia bitowa (kompresja danych) – średnia liczba bitów potrzebna na wyrażenie symbolu. Stosunek liczby bitów do liczby symboli. Innymi słowy można nim określić współczynnik, który mówi ile bitów danych zostało użytych do zapisu dźwięku lub obrazu w określonej jednostce czasu (zwykle 1sekunda) Próbkowaniem nazywamy proces pomiaru wartości chwilowej danego sygnału ze stałą częstotliwością. Częstotliwość tą nazywamy CZĘSTOTLIWOŚCIĄ PRÓBKOWANIA (Samplerate). W przypadku częstotliwości 44100Hz, która jest standardową częstotliwością próbkowania dla materiału audio zapisywanego na płytach CD-Audio, próbkowanie jest wykonywane 44100 razy na sekundę co daje nam do dyspozycji 44100 próbek (z których każda ma pewną określoną wartość) w ciągu sekundy. Już teraz wyciągnąć możemy prosty wniosek, iż im większa będzie częstotliwość próbkowania, tym dokładniejszy obraz sygnału otrzymamy. Częstotliwość próbkowania zawsze określona była zasadą, iż musi być ona przynajmniej dwa razy większa niż maksymalna częstotliwość składowa sygnału na wejściu przetwornika. Częstotliwości próbkowania dla plików .MP3 i innych formatów przechowywania dźwięku (stratnych jak i bezstratnych) bardzo często osiąga wartość 48000Hz, jest to także standard dla dźwięku zawartego na płytach DVD. KWANTYZACJA Kwantyzacja jest to proces mający na celu przedstawienie nieskończonej wartości sygnału analogowego pod postacią skończonego ciągu zer i jedynek. Jest to proces niemożliwy z matematycznego punktu widzenia jednak stopień w jakim algebra binarna pozwala nam na odwzorowanie jest w zupełności wystarczający. Brzmi to dosyć niejasno więc małe objaśnienie: Wyobraźmy sobie prosty układ dwóch współrzędnych. Oś X i oś Y, zupełnie jak na matematyce podstawówce. Oś X pozioma, oś Y pionowa. Na osi X opiszemy sobie czas w sekundach, od 0 (początek układu) do 1 sekundy. Na pionowej osi Y opiszemy poziom naszego sygnału w dBU. Nie trudno jest sobie wyobrazić teraz funkcję obrazującą sekundowy urywek naszego sygnału: linia falista wzdłużna do osi X, której wybrane punkty znajdują się na wysokości danych wartości na osi Y.: Teraz rzecz odrobinę trudniejsza do wyobrażenia. Wyobraźmy sobie iż oś X od punktu 0 do punktu 1s podzielona jest na 44100 równych części. Taka jest podziałka osi X w tym przypadku 1/44100. Oznacza to, że mamy 44100 punktów które staną się naszymi punktami odniesienia do osi Y W przypadku gdybyśmy chcieli odczytać wartość każdej z 44100 próbek na osi Y w sposób analogowy, nie byłoby żadnego problemu. Prowadzimy dwie proste. Jedna prosta prostopadła do osi X, przechodząca przez jeden z 44100 punktów a druga prosta prostopadła do osi Y i równoległa do osi X. Proste te przeciąć się mają w punkcie którego wartość chcemy odczytać. Nic prostszego: W przypadku gdy chcemy przedstawić wartość jednej z 44100 próbek w systemie binarnym sprawa się komplikuje. Już zauważyliśmy w krótki powtórzeniu wiadomości z zakresu techniki cyfrowej, wartość dziesiętna jaką możemy się posłużyć ograniczona jest ilością bitów w słowie binarnym. Co to oznacza w tym przypadku? Oznacza to, iż zakres wartości jakie będziemy mogli odczytać z osi Y opisanej w systemie binarnym uzależniony jest od długości słowa opisującego każdą pojedynczą wartość. Poniżej przedstawiony jest przykład opisania wartości sygnału w sposób binarny przy pomocy słowa 2-bitowego: Jak widać zakres wartości sygnału opisanego słowem 2-bitowym wynosi od 0 do 3 jednostek. tutaj podkreślic trzeba że z badanego sygnału w przypadku opisywania go wartościami binarnymi do dyspozycji mamy tylko wartości reprezentowane przez słowa binarne i żadnych pośrednich między nimi! (w przypadku słowa 2bitowego do dyspozycji mamy tylko 4 wartości!) Nasuwa sie prosty wniosek, że opisywanie jakiegokolwiek sygnału złożonego z więcej niż czterech wartości nie ma większego sensu gdyż błąd odwzorowania będzie tak duży, że nie pozwoli nam na nawet przybliżone odtworzenie sygnału wzorcowego. Dopisywania wartości sygnału używamz słowa 16-bitowego. Tutaj sprawa ma się już lepiej, gdyż do dyspozycji mamy 65536 wartości (od 0 do 65535). Zakres ten jest olbrzymi i pozwala nam na wierne odwzorowanie wartości jednej z naszych 44100 próbek. Dla płyt Audio-CD wartości próbkowania i kwantyzacji to 44100Hz i 16 bitowe słowo opisujące każdą próbkę. Dla materiałów dźwiękowych zapisywanych na płytach DVD słowo opisujące każdą z 96000 lub 192000 próbek ma długość 24 bitów (daje nam to prawie 17 milionów możliwych wartości!). Pozostańmy jednak przy naszych 16 bitach i 44100 próbkach na każdą sekundę ścieżki. KODOWANIE: Zasada kodowania jest bardzo prosta: 16 bitów każdej z 44100 próbek tworzy ramkę w której każdy bit znajduje się w odpowiedniej szczelinie czasowej (każda szczelina trwa tyle samo) stąd wniosej iż każda ramka trwa tyle samo. Pozwala to na zachowanie pewności, iż każda sekunda naszej ścieżki będzie trwała tyle samo. W przypadku kodowania ścieżki audio w systemie PCM stereo do czynienia mamy tak na prawdę z dwoma ścieżkami które są poddawane próbkowaniu i kwantyzacji w identyczny sposób a następnie w procesie kodowania zapisywane pod postacią jednego ciągu informacji (np. plik .WAV). W przypadku dźwięku wielokanałowego PCM sytuacja jest podobna z tą różnicą, że ścieżki każdego z kanałów mapowane są podczas kodowania na każdy z kanałów (4 lub 6). Jest to definicja bartdzo uproszczona gdyż kodowanie dźwięku wielokanałowego jest duzo bardziej skomplikowane od kodowania dźwięku mono lub stereo. Wspomnieć trzeba jeszcze o takich systemach kodowania dźwięku przestrzennego jak DolbyDigital czy DTS w przypadku których algorytmy kodowania, w tym mapowania są bardziej skomplikowane niż w przypadku kodowania PCM. Sygnał zakodowany pewnym algorytmem trafia na nośnik danych, opatrywany jest w piękna okładkę a następnie wyczekuje na swojego właściciela w sklepie. Kiedy kupujemy płytę a następnie wkładamy do odtwarzacza następuje proces odwrotny do opisanego powyżej. Dekodowanie, odczyt wartości próbek i rekombinacja sygnału analogowego który p[rzez głośniki trafia do naszych uszu.