Dźwięk wielokanałowy cd
Transkrypt
Dźwięk wielokanałowy cd
Interfejsy i multimedia w technice Wykład Dźwięk cyfrowy, animacja, wideofonia Opracował dr inż. Dariusz Trawicki Gdańsk 28.04.2010 1 Sygnał dyskretny Sygnał dyskretny – model wielkości zmiennej, która jest określona tylko w dyskretnych chwilach czasu. Najczęściej jest to sygnał powstały poprzez próbkowanie sygnału ciągłego. Rys.4.1. Sygnał dyskretny (źródło: http://pl.wikipedia.org /) 2 Sygnał dyskretny c.d. W odróżnieniu od sygnału ciągłego, sygnał dyskretny nie jest funkcją zdefiniowaną dla ciągłego przedziału argumentów, lecz ciągiem liczbowym. Każda wartość ciągu nazywa się próbką (ang. sample). W odróżnieniu od sygnału cyfrowego, poszczególne próbki sygnału dyskretnego analogowego mogą przyjmować dowolne wartości z nieograniczonego lub ograniczonego zbioru. 3 Sygnał cyfrowy Sygnał cyfrowy – sygnał, którego dziedzina i zbiór wartości są dyskretne. Rys. 4.2. Sygnał cyfrowy (źródło: http://pl.wikipedia.org /) 4 Próbkowanie Próbkowanie (dyskretyzacja, kwantowanie w czasie) - proces tworzenia sygnału dyskretnego, reprezentującego sygnał ciągły za pomocą ciągu wartości nazywanych próbkami. Rys. 4.3. Próbkowanie (źródło: http://pl.wikipedia.org /) 5 Próbkowanie - twierdzenie Kotielnikowa-Shannona Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty informacji z powrotem do postaci analogowej, musi być spełnione twierdzenie Kotielnikowa-Shannona o próbkowaniu. Mówi ono, że częstotliwość próbkowania nie może być mniejsza niż podwojona szerokość pasma sygnału (warunku Nyquista). Jeśli ten warunek nie jest spełniony, wówczas występuje zjawisko aliasingu. Rys. 4.4. Widmo sygnału o pasmie B i warunek Nyquista (źródło: http://pl.wikipedia.org /) 6 Próbkowanie – zjawisko aliasingu Aliasing to nieodwracalne zniekształcenie sygnału w procesie próbkowania wynikające z niespełnienia warunku Nyquista. Zniekształcenie to objawia się obecnością w sygnale składowych o błędnych częstotliwościach (aliasów). Aliasing wynika z niejednoznacznej reprezentacji sygnału okresowego przez ciąg jego wartości chwilowych (próbek) pobranych w równych odstępach. Rys. 4.5. Przykład dwóch różnych sinusoid pasujących do tego samego wzoru próbek. W rzeczywistości jest nieskończenie wiele takich sinusoid, które przechodzą przez ten sam zbiór punktów (źródło: http://pl.wikipedia.org /) 7 Próbkowanie – zjawisko aliasingu c.d. W dziedzinie częstotliwości widmo sygnału zostaje w procesie próbkowania zwielokrotnione w ten sposób, że kopia widma pierwotnego zostaje umieszczona w każdej całkowitej wielokrotności fs po obu stronach osi częstotliwości. Rys. 4.6. Zwielokrotnione widmo (warunek Nyquista spełniony) (źródło: http://pl.wikipedia.org /) 8 Próbkowanie – zjawisko aliasingu c.d. Jeśli maksymalna częstotliwość sygnału próbkowanego (szerokość jego widma) przekracza połowę częstotliwości próbkowania fs, to kolejne powtarzające się widma zaczynają się na siebie nakładać. Zgodnie z twierdzeniem Kotielnikowa-Shannona nie da się odtworzyć oryginalnego sygnału z tak zniekształconych próbek. Rys. 4.7. Zwielokrotnione widmo (warunek Nyquista nie spełniony-aliasing) (źródło: http://pl.wikipedia.org /) 9 Uniknięcie aliasingu Aby uniknąć aliasingu należy zapewnić, aby sygnał próbkowany był ograniczony pasmowo do częstotliwości Nyquista czyli połowy częstotliwości próbkowania. Można to uzyskać przez ograniczenie widma sygnału przy pomocy filtru, nazywanego filtrem anty-aliasingowym. Filtr ten powinien mieć szerokość pasma mniejszą niż połowa częstotliwości próbkowania. Zazwyczaj stosuje się filtry o wyraźnie mniejszej szerokości pasma przepustowego po to, aby uwzględnić niewielkie tłumienie, które zachodzi na odcinku przejściowym charakterystyki filtru oddzielającego pasmo przepustowe od pasma zaporowego. W praktyce, ze względu na to, że żaden sygnał o skończonym czasie trwania nie ma ograniczonego pasma, a żaden filtr nie tłumi idealnie w swoim paśmie zaporowym, aliasing występuje zawsze. W prawidłowo zaprojektowanym systemie wykorzystującym próbkowanie sygnału dąży się do minimalizacji tego zjawiska, aby amplituda składowych aliasowych była pomijalnie mała. (źródło: http://pl.wikipedia.org /) 10 Kwantyzacja Kwantyzacja to proces polegający na przypisaniu wartości analogowych do najbliższych poziomów reprezentacji. Liczba tych poziomów jest ograniczona, dlatego aproksymacja może powodować błędy zwane błędami kwantyzacji. W procesie analogowo-cyfrowego przetwarzania sygnału, czyli zamiany analogowego na cyfrowy, kwantyzacja jest najczęściej etapem następującym po próbkowaniu. 11 Rys. 4.8. Kwantyzacja (źródło: http://pl.wikipedia.org/) 12 Rys. 4.9. Przebieg analogowy i odpowiadający mu odtworzony przebieg przy 4bitowym kodowaniu (źródło: http://pl.wikipedia.org /) 13 Kwantyzacja - Szum kwantyzacji Szum kwantyzacji powstaje w przetwornikach analogowo-cyfrowych z powodu błędu zaokrąglenia. Podczas konwersji ciągłego sygnału analogowego na postać cyfrową, każda wartość jest zaokrąglana do najbliższej wartości dyskretnej. Powstający w ten sposób błąd określany jest mianem szumu kwantyzacji. Rys4.10. Szum kwantyzacji – przypadek 2-bitowej konwersji analogowo cyfrowej (źródło: http://en.wikipedia.org /) 14 Szum kwantyzacji c.d. Odstęp sygnału od szumu (SQNR) )wyznacza zależność: (ang. Signal-to-quantization-noise ratio SQNR = 20 * log (2n) ≈ 6,02 *n dB. 15 Dynamika dźwięku Dynamika (ang. Dynamic range, abbreviated DR) określa stosunek najmniejszej do największej wartości z poziomów reprezentacji możliwych do uzyskania w wyniku procesu kwantyzacji. DR = 20 * log (2n) ≈ 6,02 *n dB, gdzie: n - liczba bitów. Dla przypadku konwersji 16-bitowej dynamika wynosi DR ≈ 6*16=96 dB. 16 "Dźwięk cyfrowy "- PCM PCM (ang. Pulse Code Modulation) – to najpopularniejsza metoda reprezentacji analogowego sygnału audio w systemach cyfrowych. Używana jest w telekomunikacji, w cyfrowej obróbce sygnału (np. w procesorach dźwięku), do przetwarzania obrazu, do zapisu na płytach CD (CD-Audio) i w wielu zastosowaniach przemysłowych. Metoda polega na reprezentacji wartości chwilowej sygnału (próbkowaniu) w określonych (najczęściej równych) odstępach czasu, czyli z określoną częstością, zwaną częstotliwością próbkowania. Wartość chwilowa sygnału jest przedstawiana za pomocą słowa kodowego, którego wartości odpowiadają wybranym przedziałom kwantyzacji sygnału wejściowego. 17 "Dźwięk cyfrowy "- PCM c.d. Dźwięk w formacie PCM może być zapisywany z różną częstotliwością próbkowania, najczęściej jest to 8 kHz (niektóre standardy telefonii), 44,1 kHz (płyty CD-Audio), oraz różną rozdzielczością, najczęściej 8, 16, 20 lub 24 bitów na próbkę, może reprezentować 1 kanał (dźwięk monofoniczny), 2 kanały (stereofonia dwukanałowa) lub więcej (stereofonia dookólna). Reprezentacja dźwięku próbkowana z częstotliwością 44,1 kHz i rozdzielczością 16 bitów na próbkę (216 = 65536 możliwych wartości amplitudy fali dźwiękowej na próbkę) jest uważana za bardzo wierną swemu oryginałowi, ponieważ pokrywa cały zakres pasma częstotliwości słyszalnych przez człowieka oraz prawie cały zakres rozpiętości dynamicznej słyszalnych dźwięków. (źródło: http://pl.wikipedia.org/) 18 Cyfrowy tor foniczny Rys. 4.11. Cyfrowy tor foniczny (źródło: http://edu.pjwstk.edu.pl) 19 Cyfrowy tor foniczny c.d. Rys. 4.12. Układ próbkująco-pamiętający (źródło: http://edu.pjwstk.edu.pl) 20 Kodowanie protekcyjne Przykładem stosowanego w cyfrowym torze fonicznym kodowania jest kodowanie protekcyjne. Jego zadaniem jest zabezpieczenie sygnału cyfrowego przed skutkami błędów mogących powstać w procesie zapisu i odczytu. Stosowane jest kodowanie nadmiarowe. Błędy w sygnale cyfrowym mogą być spowodowane przez np. wady nośnika, uszkodzenia mechaniczne, kurz, zabrudzenia. Przykładem kodu protekcyjnego jest kod CRC (ang. Cyclic Redundancy Check – cykliczny kod nadmiarowy) to matematyczna suma kontrolna wykorzystywana do wykrywania uszkodzonych danych binarnych. Kod CRC zwykle dodawany jest do ramki lub pakietu (np. w standardzie USB) w celu późniejszej weryfikacji integralności danych. Jest to algorytm wykrywania błędów bardziej niezawodny niż prosta suma kontrolna (w przypadku sumy błędy potrafią się zniwelować, czyli nie zmienić sumy, w CRC jest to dużo trudniejsze). Wartość CRC określana jest w sposób bardziej rygorystyczny niż wartość sumy kontrolnej - otrzymuje się ją w wyniku podziału wartości otrzymanej w wyniku odczytania ciągu binarnego przez wcześniej określoną liczbę binarną. CRC jest resztą z binarnego dzielenia ciągu danych przez relatywnie krótki dzielnik, zwany generatorem lub wielomianem CRC. 21 Cyfrowa rejestracja dźwięku Uwe Koder PCM (Code Pulse Modulation) Rejestracja informacji na nośniku Dekoder PCM Uwy Rys. 4.13. Cyfrowa rejestracja dźwięku 22 Cyfrowa rejestracja dźwięku c.d. Zalety cyfrowej rejestracji dźwięku: • małe szumy w porównaniu z zapisem analogowym, • brak zniekształceń i przesłuchów, • wysoka gęstość zapisu, • możliwość równoczesnego zapisu wielu sygnałów • możliwość komputerowej obróbki, • trwałość zapisu. 23 Cyfrowa rejestracja dźwięku c.d. Mikrofon Mikrofon – przetwornik elektroakustyczny służący do przetwarzania fal dźwiękowych na impulsy elektryczne. Rys. 4.14. Mikrofony (od lewej):mikrofon firmy Grundig; Shure SM58 i Shure Beta 58A – mikrofony dynamiczne, bardzo popularne w zastosowaniach estradowych; mikrofon komputerowy marki Tracer (źródło: http://pl.wikipedia.org) 24 Cyfrowa rejestracja dźwięku c.d. Zasada działania mikrofonu W tradycyjnych mikrofonach dynamicznych fale dźwiękowe powodują drgania cienkiej elastycznej membrany wraz z cewką, która jest do niej umocowana. Drgania cewki, która umieszczona jest między biegunami magnesu, wzbudzają w niej przemienny prąd elektryczny o częstotliwości odpowiadającej częstości drgań fal dźwiękowych. W wyniku przetwarzania otrzymuje się z mikrofonu przebieg elektryczny – sygnał foniczny w postaci siły elektromotorycznej E, napięcia wyjściowego U oraz prądu I odpowiadającego przebiegowi akustycznemu. 25 Cyfrowa rejestracja dźwięku c.d. Rodzaje mikrofonów Ze względu na sposób przetwarzania drgań membrany na sygnał foniczny mikrofony dzielimy na: • stykowe (węglowe), • piezoelektryczne, • dynamiczne (magnetoelektryczne), • pojemnościowe (elektrostatyczne), • pojemnościowe elektretowe, • laserowe. 26 Cyfrowa rejestracja dźwięku c.d. Wybrane parametry mikrofonu Charakterystyka częstotliwościowa – diagram zależności czułości mikrofonu (w dB) od częstotliwości (Hz) (zwykle w zakresie 20Hz-20 kHz). Czasami zamiast wykresu podaje się tylko pasmo przenoszenia (ang. frequency response), czyli zakres częstotliwości akustycznych skutecznie przetwarzanych przez mikrofon. Charakterystyka kierunkowości – wykres w układzie współrzędnych biegunowych przedstawiający skuteczność mikrofonu przy danej częstotliwości i kącie padania dźwięku, unormowany względem maksymalnej skuteczności mikrofonu. Ze względu na kształt charakterystyki kierunkowej, mikrofony dzieli się na: wszechkierunkowe (dookólne, kołowe), dwukierunkowe (ósemkowe), jednokierunkowe (kardioidalne, nerkowe) i ultrakierunkowe. (źródło: http://pl.wikipedia.org) 27 Rys. 4.15. Charakterystyki częstotliwościowe mikrofonów wokalowych: pojemnościowego Oktava 319 (u góry) i dynamicznego Shure SM58 (na dole). (źródło: http://pl.wikipedia.org) 28 •poziomu przy oddalaniu[4]. Zjawisko to nie występuje w mikrofonach wszechkierunkowych. dookólna subkardioidalna hiperkardioidalna kardioidalna ósemkowa superkardioidalna ultrakierunkowa Rys.4.16. Charakterystyka kierunkowości mikrofonów (źródło: http://pl.wikipedia.org) 29 Głośniki Głośnik - przetwornik elektroakustyczny (odbiornik energii elektrycznej) przekształcający prąd elektryczny w falę akustyczną. Idealny głośnik przekształca zmienny prąd elektryczny o odpowiedniej częstotliwości na falę akustyczną proporcjonalnie i liniowo. Rzeczywisty zakres częstotliwości, w którym głośnik wytwarza falę ciśnienia proporcjonalnie do napięcia (z dopuszczalnym odchyleniem) nazywa się pasmem przenoszenia głośnika. Potocznie głośnikiem nazywa się również zespół głośników zamknięty w wspólnej obudowie poprawnie nazywanej kolumną głośnikową. 30 Rys. 4.17. Głośnik dynamiczny: przekrój przez głośnik (po lewej); w obudowie (po prawej) (źródło: http://pl.wikipedia.org) 31 Formaty plików audio - przykłady • WAV (ang. wave form audio format) — format plików dźwiękowych stworzony przez Microsoft oraz IBM. • MP3 (ang. MPEG-1/2 Audio Layer-3) - standard (format) zapisu dźwięku poddanego stratnej kompresji (najpopularniejszy obecnie). • AIFF (z ang. Audio Interchange File Format) to format plików dźwiękowych współtworzony przez firmę Apple. Dane audio zapisane są jako nieskompresowany PCM. Format jest wykorzystywany głównie przez Apple na komputerach Macintosh. • RealAudio – format kompresji dźwięku stworzony przez firmę RealNetworks. Kodek został opracowany głównie z myślą o wykorzystaniu go w strumieniowaniu dźwięku przy łączu internetowym o niskiej przepustowości. • Vorbis to stratny kodek dźwięku z rodziny Ogg. Jakość dźwięku zakodowanego w formacie Ogg Vorbis jest wyższa niż MP3 o tej samej przepływności. 32 Formaty plików audio – MP3 Z modelu psychoakustycznego wynika, że najlepiej słyszymy dźwięki w okolicach 2-4 kHz. Czym częstotliwość dźwięku bardziej odbiega od tego pasma, tym coraz gorzej go słyszymy. Z tego wynika, że skrajne częstotliwości mogą zostać zapisane z dużo mniejszą dokładnością (na mniejszej licznie bitów). Z modelu psychoakustycznego wynika również zjawisko maskowania (głośne dźwięki maskują ciche). Zatem w pobliżu głośnych dźwięków również można zmniejszyć liczbę bitów, gdyż szum kwantyzacji nie będzie słyszany. Subiektywna jakość dźwięku zależy również od modelu psychoakustycznego zaimplementowanego w koderze, a także od słuchacza. Jeśli jego słuch będzie bardzo odbiegał od modelu użytego w kodeku, oceniona jakość dźwięku może być odebrana jako znacznie różna od oryginału. MP3 opiera się na wcześniej wspomnianym modelu psychoakustycznym i jest to metoda stratna. Polega na tym, że zostają „usunięte” (stratność) te informacje o dźwięku, które są niezauważalne lub mało istotne dla człowieka (psychoakustyczność). 33 Dźwięk wielokanałowy Dźwięk wielokanałowy, dźwięk dookólny, dźwięk przestrzenny (ang. surround sound) – technika będąca rozwinięciem stereofonii, pozwalająca na utrwalanie i odtwarzanie co najmniej trzech kanałów dźwięku. Zastosowanie dodatkowych kanałów i odpowiadających im głośników po bokach i z tyłu słuchacza pozwala na zwiększenie poczucia otoczenia dźwiękiem. Większość nagrań wielokanałowych jest tworzona na potrzeby filmów i gier wideo. Dźwięk wielokanałowy jest wykorzystywany w salach kinowych, systemach kina domowego i konsolach do gier. (źródło: http://pl.wikipedia.org/) 34 Dźwięk wielokanałowy c.d. System 5.1 składa się z pięciu kanałów pełnopasmowych (przednie: lewy, prawy i centralny, oraz tylne: lewy i prawy) oraz kanału subwoofera. Jest najczęściej stosowany w filmach DVD i nagraniach muzycznych na płytach DVD Audio. W formacie Dolby Surround Pro Logic występuje 6 całkowicie odseparowanych od siebie kanałów. Rys. 4.18. Ustawienie głośników w systemie 5.1 (źródło: http://pl.wikipedia.org/) 35 Dźwięk wielokanałowy c.d. Rys. 4.19. Dźwięk dookólny - Dolby Surround Pro Logic (źródło: http://electronics.howstuffworks.com, http://www.kopernik.silesianet.pl/) 36 Dźwięk wielokanałowy c.d. System 6.1 jest rozwinięciem systemu 5.1 o kanał tylny (rear). System 6.1 w swojej najbardziej rozwiniętej wersji dostarcza sześciu kanałów pełnopasmowych (20 Hz – 20 kHz) oraz jednego niskoczęstotliwościowego. Poszczególne kanały to: • Dwa kanały przednie (lewy i prawy) – L i R • Kanał centralny – C • Dwa kanały dookólne – (lewy dookólny i prawy dookólny) – Ls i Rs • Jeden kanał tylny – Bs • Jeden kanał niskoczęstotliwościowy – LFE Jednym z formatów tego systemu w przemyśle kinowym jest Dolby Pro Logic IIx. Rys. 4.20. Ustawienie głośników w systemie 6.1 (źródło: http://pl.wikipedia.org/) 37 Dźwięk wielokanałowy c.d. System 7.1 jest rozwinięciem systemu 6.1 o drugi kanał tylny (rear). Poszczególne kanały to: • Dwa kanały przednie (lewy i prawy) – L i R • Kanał centralny – C • Dwa kanały dookólne – (lewy dookólny i prawy dookólny) – Ls i Rs • Dwa kanały tylne (lewy i prawy) – Lb i Rb • Jeden kanał niskoczęstotliwościowy – LFE Rys. 4.21. Ustawienie głośników w systemie 7.1 (źródło: http://pl.wikipedia.org/) 38 Dźwięk wielokanałowy c.d. Rys. 4.22. Dźwięk dookólny (źródło: http://electronics.howstuffworks.com) 39 Animacja komputerowa Animacja komputerowa to sztuka tworzenia ruchomych obiektów z wykorzystaniem komputerów. Jest poddziedziną grafiki komputerowej i animacji. W coraz większym zakresie jest ona realizowana jako animacja 3D (trójwymiarowa), choć w zastosowaniach dysponujących niską przepustowością sprzętową i wymagających przetwarzania obrazów w czasie rzeczywistym cały czas ważną pozycję utrzymuje animacja 2D (dwuwymiarowa, płaska). Czasami docelowym medium animacji jest sam system komputerowy, ale zdarza się, ze animacja przeznaczona jest dla innych mediów, takich jak film. Animację komputerową czasami określa się skrótem CGI (od ang. Computer Generated Imagery, lub Computer Generated Imaging) - szczególnie w zastosowaniach kinematograficznych. By stworzyć iluzję ruchu, na ekranie komputera wyświetlany jest określony obraz, po czym szybko zamienia się go na następny - podobny do poprzedniego, lecz z nieznacznymi zmianami w pozycji obiektów. Technika ta jest identyczna z zastosowaniami telewizyjnymi i kinowymi. (źródło: http://pl.wikipedia.org) 40 Rys. 4.23. Przykład animacji komputerowej (źródło: http://pl.wikipedia.org) Rys. 4.24. Przykład animacji renderowanej komputerowo (źródło: http://pl.wikipedia.org) 41 Wyjaśnienie zjawiska animacji By oko i mózg dały się nabrać na iluzję gładko poruszającego się obiektu, kolejne klatki animacji (kompletne obrazy) powinny się pojawiać z częstotliwością co najmniej 12 razy na sekundę. Gdy częstotliwość pojawiania się nowych klatek spada poniżej 12 razy na sekundę, większość obserwatorów odczuwa "rwanie" się animacji i zauważa proces pojawiania się kolejnych klatek, co psuje iluzję realistycznie płynnego ruchu. Tradycyjnie animowane kreskówki podają widzowi w ciągu sekundy 15 nowych klatek obrazu, by możliwa była oszczędność w ilości niezbędnych do wykonania rysunków. 42 Morfing – przykład animacji Morfing (ang. morphing) – technika przekształcania obrazu polegająca na płynnej zmianie jednego obrazu w inny, stosowana w filmie i animacji komputerowej. Rys. 4.25. Morfing (źródło: http://pl.wikipedia.org) 43 Morfing – przykład animacji c.d. Rys. 4.26. Morfing (źródło: http://pl.wikipedia.org) 44 Fotografia cyfrowa Fotografia cyfrowa - polega na utrwaleniu obrazu w postaci cyfrowej, a nie, jak w fotografii tradycyjnej, na chemicznym nośniku światłoczułym. Utrwalenie obrazu w aparatach cyfrowych odbywa się poprzez pomiar jasności poszczególnych pikseli (punktów) matrycy, na którą pada światło poprzez obiektyw. Szeroko stosowana matryca CCD (ang. Charge Coupled Device) jest układem wielu elementów światłoczułych, z których każdy rejestruje, a następnie pozwala odczytać sygnał elektryczny proporcjonalny do ilości padającego na niego światła. Poszczególne elementy matrycy mierzą ilość światła dla jednej ze składowych RGB, dlatego też na każdy piksel wynikowego obrazu w postaci bitmapy przypada pomiar z kompletu elementów światłoczułych. 45 Fotografia cyfrowa c.d. Formaty zapisu danych Ze względu na oszczędność zasobów pamięciowych w aparatach cyfrowych, do zapisu fotografii najczęściej stosuje się format pliku JPEG, który charakteryzuje się kompresją stratną. Oznacza to, że zmniejszenie pliku odbywa się kosztem utraty pewnych szczegółów zdjęcia lub niewielkimi zniekształceniami. Z reguły użytkownik może wybrać, czy zależy mu na silniejszej kompresji (zmieści w pamięci więcej zdjęć) czy lepszej jakości. Droższe aparaty pozwalają także na zapis alternatywny w postaci formatu RAW lub TIFF, co daje większe możliwości manipulacji obrazem. Zdjęcia takie zajmują jednak znacznie więcej miejsca. Format RAW (pojawiający się także pod innymi nazwami, np. w aparatach firmy Nikon jako NEF) zawiera nieprzetworzone dane, pobrane bezpośrednio z sensora aparatu i pozwala na ingerencję w sposób ich przetworzenia już po zrobieniu zdjęcia. 46 Wideofonia Akwizycja i edycja sygnału wideofonicznego Do akwizycji i edycji sygnału fonicznego niezbędny jest odpowiedni sprzęt oraz oprogramowanie. Nakręcenie materiału wideo wymaga użycia kamery (zwykle kamkodera, tj. kamery rejestrującej obraz), zaś wykonanie zdjęć – aparatu fotograficznego. Aby zarejestrowany obraz był dobrej jakości, filmowana lub fotografowana scena powinna być odpowiednio oświetlona. Do akwizycji dźwięku niezbędne są mikrofony, zaś do odsłuchu dźwięku głośniki. Montaż materiałów multimedialnych obecnie odbywa się najczęściej cyfrowo, po zgraniu zarejestrowanego materiału wideofonicznego do komputera multimedialnego z odpowiednim oprogramowaniem. 47 Kamery, kamkodery Podstawowym wyposażeniem niezbędnym do zarejestrowania obrazu wideo jest kamera. Kamery sprzed epoki kamer cyfrowych tzw. kamery analogowe rejestrowały ruchomy obraz, poprzez zamianę sygnałów optycznych na sygnały elektryczne, na analogowym nośniku danych, np. VHS. Rys. 4.27. Kamera wideo standardu Video 8 firmy Sony z 1985 roku (źródło: http://pl.wikipedia.org) 48 Kamery, kamkodery c.d. Kamera cyfrowa (ang. DVC – Digital Video Camcorder) – urządzenie rejestrujące obraz oraz dźwięk i zapisujące sygnał audiowizualny w postaci cyfrowej, na taśmie Digital Video w kasetach DV albo MiniDV, na płycie DVD, karcie pamięci, czy dysku twardym. Istota obrazowania kamer cyfrowych opiera się na specjalnych przetwornikach, tak zwanych matrycach, wyróżnia się dwa rodzaje matryc: • matryca CCD – Charge Coupled Device , • matryca CMOS – Complementary MOS. Rys. 4.28. Amatorska kamera cyfrowa firmy JVC (źródło: http://pl.wikipedia.org) 49 Wideofonia Formaty wideo - przykłady AVI Nieskompresowany materiał video. MPEG MPEG (ang. Moving Picture Experts Group) - grupa robocza ISO/IEC zajmująca się rozwojem standardów kodowania audio i wideo, a także zatwierdzona przez ISO grupę powszechnie stosowanych formatów zapisu danych zawierających obraz i dźwięk. Wśród tych standardów znajdują się m.in. najpopularniejszy format kompresji dźwięku, stosowany w komputerach osobistych i odtwarzaczach przenośnych MP3 oraz opracowany dość dawno przez grupę niezależnych ekspertów standard używany jest do zapisu filmów Video CD, DVD i transmisji telewizji cyfrowej (MPEG 2), czy wprowadzony ostatnio MPEG-4 mający zastosowanie w filmach wideo wysokiej jakości, np na Blu-ray Disc. 50 Formaty wideo – przykłady c.d. MPEG-2 Każda sekunda wysokiej jakości, filmowego nieskompresowanego obrazu w europejskim standardzie PAL ma wielkość prawie 30 megabajtów. Taka ilość danych drastycznie utrudniałaby składowanie, przesyłanie i odczyt. Cyfrowe odtwarzanie wideo wymagało opracowania wydajnych standardów kompresji. Dlatego powstał standard kompresji MPEG-2, który jest wykorzystywany do zapisu na nośnikach DVD. MPEG-4 Wprowadzony pod koniec 1998 jest oznaczeniem grupy standardów kodowania audio i wideo wraz z pokrewnymi technologiami, opracowanej przez grupę ISO/IEC MPEG. Główne zastosowania MPEG-4 to media strumieniowe w sieci Web, dystrybucja CD, wideokonferencje i telewizja, oraz kamery cyfrowe. MPEG-4 jest jak na razie najlepszym formatem jeśli chodzi o stosunek jakości obrazu do wielkości pliku wideo. 51 Wideofonia Formaty wideo – przykłady FLV Flash Video (FLV) jest standardem filmowym używanym do dystrybucji plików wideo przez internet. Odtworzyć plik .flv możemy za pomocą zwykłej przeglądarki internetowej z dodatkiem Adobe Flash Player lub osobnych programów, np. udostępnianych bezpłatnie: Moyea FLV Player , FLV Player 2.0 czy też VLC media player. WMV Windows Media Video - format kompresji filmów stworzony przez Microsoft. (źródło http://videopr.pl/) 52