Dźwięk wielokanałowy cd

Transkrypt

Dźwięk wielokanałowy cd
Interfejsy i multimedia w technice
Wykład
Dźwięk cyfrowy, animacja,
wideofonia
Opracował dr inż. Dariusz Trawicki
Gdańsk 28.04.2010
1
Sygnał dyskretny
Sygnał dyskretny – model wielkości zmiennej, która jest
określona tylko w dyskretnych chwilach czasu. Najczęściej jest to
sygnał powstały poprzez próbkowanie sygnału ciągłego.
Rys.4.1. Sygnał dyskretny
(źródło: http://pl.wikipedia.org /)
2
Sygnał dyskretny c.d.
W odróżnieniu od sygnału ciągłego, sygnał dyskretny nie jest
funkcją zdefiniowaną dla ciągłego przedziału argumentów, lecz
ciągiem liczbowym. Każda wartość ciągu nazywa się próbką
(ang. sample).
W odróżnieniu od sygnału cyfrowego, poszczególne próbki
sygnału dyskretnego analogowego mogą przyjmować dowolne
wartości z nieograniczonego lub ograniczonego zbioru.
3
Sygnał cyfrowy
Sygnał cyfrowy – sygnał, którego dziedzina i zbiór wartości są
dyskretne.
Rys. 4.2. Sygnał cyfrowy
(źródło: http://pl.wikipedia.org /)
4
Próbkowanie
Próbkowanie (dyskretyzacja, kwantowanie w czasie) - proces
tworzenia sygnału dyskretnego, reprezentującego sygnał ciągły za
pomocą ciągu wartości nazywanych próbkami.
Rys. 4.3. Próbkowanie
(źródło: http://pl.wikipedia.org /)
5
Próbkowanie - twierdzenie Kotielnikowa-Shannona
Aby spróbkowany sygnał z postaci cyfrowej dało się przekształcić bez straty
informacji z powrotem do postaci analogowej, musi być spełnione twierdzenie
Kotielnikowa-Shannona o próbkowaniu. Mówi ono, że częstotliwość
próbkowania nie może być mniejsza niż podwojona szerokość pasma sygnału
(warunku Nyquista). Jeśli ten warunek nie jest spełniony, wówczas występuje
zjawisko aliasingu.
Rys. 4.4. Widmo sygnału o pasmie B i warunek Nyquista
(źródło: http://pl.wikipedia.org /)
6
Próbkowanie – zjawisko aliasingu
Aliasing to nieodwracalne zniekształcenie sygnału w procesie próbkowania
wynikające z niespełnienia warunku Nyquista. Zniekształcenie to objawia się
obecnością w sygnale składowych o błędnych częstotliwościach (aliasów).
Aliasing wynika z niejednoznacznej reprezentacji sygnału okresowego przez
ciąg jego wartości chwilowych (próbek) pobranych w równych odstępach.
Rys. 4.5. Przykład dwóch różnych sinusoid pasujących do tego samego wzoru
próbek. W rzeczywistości jest nieskończenie wiele takich sinusoid, które
przechodzą przez ten sam zbiór punktów (źródło: http://pl.wikipedia.org /)
7
Próbkowanie – zjawisko aliasingu c.d.
W dziedzinie częstotliwości widmo sygnału zostaje w procesie próbkowania
zwielokrotnione w ten sposób, że kopia widma pierwotnego zostaje
umieszczona w każdej całkowitej wielokrotności fs po obu stronach osi
częstotliwości.
Rys. 4.6. Zwielokrotnione widmo (warunek Nyquista spełniony)
(źródło: http://pl.wikipedia.org /)
8
Próbkowanie – zjawisko aliasingu c.d.
Jeśli maksymalna częstotliwość sygnału próbkowanego (szerokość jego
widma) przekracza połowę częstotliwości próbkowania fs, to kolejne
powtarzające się widma zaczynają się na siebie nakładać. Zgodnie z
twierdzeniem Kotielnikowa-Shannona nie da się odtworzyć oryginalnego
sygnału z tak zniekształconych próbek.
Rys. 4.7. Zwielokrotnione widmo (warunek Nyquista nie spełniony-aliasing)
(źródło: http://pl.wikipedia.org /)
9
Uniknięcie aliasingu
Aby uniknąć aliasingu należy zapewnić, aby sygnał próbkowany był ograniczony
pasmowo do częstotliwości Nyquista czyli połowy częstotliwości próbkowania. Można
to uzyskać przez ograniczenie widma sygnału przy pomocy filtru, nazywanego filtrem
anty-aliasingowym. Filtr ten powinien mieć szerokość pasma mniejszą niż połowa
częstotliwości próbkowania. Zazwyczaj stosuje się filtry o wyraźnie mniejszej
szerokości pasma przepustowego po to, aby uwzględnić niewielkie tłumienie, które
zachodzi na odcinku przejściowym charakterystyki filtru oddzielającego pasmo
przepustowe od pasma zaporowego.
W praktyce, ze względu na to, że żaden sygnał o skończonym czasie trwania nie ma
ograniczonego pasma, a żaden filtr nie tłumi idealnie w swoim paśmie zaporowym,
aliasing występuje zawsze. W prawidłowo zaprojektowanym systemie
wykorzystującym próbkowanie sygnału dąży się do minimalizacji tego zjawiska, aby
amplituda składowych aliasowych była pomijalnie mała. (źródło: http://pl.wikipedia.org /)
10
Kwantyzacja
Kwantyzacja to proces polegający na przypisaniu wartości
analogowych do najbliższych poziomów reprezentacji. Liczba
tych poziomów jest ograniczona, dlatego aproksymacja może
powodować błędy zwane błędami kwantyzacji.
W procesie analogowo-cyfrowego przetwarzania sygnału, czyli
zamiany analogowego na cyfrowy, kwantyzacja jest najczęściej
etapem następującym po próbkowaniu.
11
Rys. 4.8. Kwantyzacja
(źródło: http://pl.wikipedia.org/)
12
Rys. 4.9. Przebieg analogowy i odpowiadający mu odtworzony przebieg przy 4bitowym kodowaniu
(źródło: http://pl.wikipedia.org /)
13
Kwantyzacja - Szum kwantyzacji
Szum kwantyzacji powstaje w przetwornikach analogowo-cyfrowych z
powodu błędu zaokrąglenia. Podczas konwersji ciągłego sygnału analogowego
na postać cyfrową, każda wartość jest zaokrąglana do najbliższej wartości
dyskretnej. Powstający w ten sposób błąd określany jest mianem szumu
kwantyzacji.
Rys4.10. Szum kwantyzacji – przypadek 2-bitowej konwersji analogowo
cyfrowej (źródło: http://en.wikipedia.org /)
14
Szum kwantyzacji c.d.
Odstęp sygnału od szumu
(SQNR) )wyznacza zależność:
(ang.
Signal-to-quantization-noise
ratio
SQNR = 20 * log (2n) ≈ 6,02 *n dB.
15
Dynamika dźwięku
Dynamika (ang. Dynamic range, abbreviated DR) określa stosunek
najmniejszej do największej wartości z poziomów reprezentacji możliwych do
uzyskania w wyniku procesu kwantyzacji.
DR = 20 * log (2n) ≈ 6,02 *n dB,
gdzie: n - liczba bitów.
Dla przypadku konwersji 16-bitowej dynamika wynosi
DR ≈ 6*16=96 dB.
16
"Dźwięk cyfrowy "- PCM
PCM (ang. Pulse Code Modulation) – to najpopularniejsza metoda
reprezentacji analogowego sygnału audio w systemach cyfrowych. Używana
jest w telekomunikacji, w cyfrowej obróbce sygnału (np. w procesorach
dźwięku), do przetwarzania obrazu, do zapisu na płytach CD (CD-Audio)
i w wielu zastosowaniach przemysłowych.
Metoda polega na reprezentacji wartości chwilowej sygnału (próbkowaniu)
w określonych (najczęściej równych) odstępach czasu, czyli z określoną
częstością, zwaną częstotliwością próbkowania. Wartość chwilowa sygnału jest
przedstawiana za pomocą słowa kodowego, którego wartości odpowiadają
wybranym przedziałom kwantyzacji sygnału wejściowego.
17
"Dźwięk cyfrowy "- PCM c.d.
Dźwięk w formacie PCM może być zapisywany z różną częstotliwością
próbkowania, najczęściej jest to 8 kHz (niektóre standardy telefonii), 44,1 kHz
(płyty CD-Audio), oraz różną rozdzielczością, najczęściej 8, 16, 20 lub 24
bitów na próbkę, może reprezentować 1 kanał (dźwięk monofoniczny),
2 kanały (stereofonia dwukanałowa) lub więcej (stereofonia dookólna).
Reprezentacja dźwięku próbkowana z częstotliwością 44,1 kHz
i rozdzielczością 16 bitów na próbkę (216 = 65536 możliwych wartości
amplitudy fali dźwiękowej na próbkę) jest uważana za bardzo wierną swemu
oryginałowi, ponieważ pokrywa cały zakres pasma częstotliwości słyszalnych
przez człowieka oraz prawie cały zakres rozpiętości dynamicznej słyszalnych
dźwięków. (źródło: http://pl.wikipedia.org/)
18
Cyfrowy tor foniczny
Rys. 4.11. Cyfrowy tor foniczny
(źródło: http://edu.pjwstk.edu.pl)
19
Cyfrowy tor foniczny c.d.
Rys. 4.12. Układ próbkująco-pamiętający
(źródło: http://edu.pjwstk.edu.pl)
20
Kodowanie protekcyjne
Przykładem stosowanego w cyfrowym torze fonicznym kodowania jest kodowanie protekcyjne.
Jego zadaniem jest zabezpieczenie sygnału cyfrowego przed skutkami błędów mogących powstać
w procesie zapisu i odczytu. Stosowane jest kodowanie nadmiarowe. Błędy w sygnale cyfrowym
mogą być spowodowane przez np. wady nośnika, uszkodzenia mechaniczne, kurz, zabrudzenia.
Przykładem kodu protekcyjnego jest kod CRC (ang. Cyclic Redundancy Check – cykliczny kod
nadmiarowy) to matematyczna suma kontrolna wykorzystywana do wykrywania uszkodzonych
danych binarnych.
Kod CRC zwykle dodawany jest do ramki lub pakietu (np. w standardzie USB) w celu późniejszej
weryfikacji integralności danych. Jest to algorytm wykrywania błędów bardziej niezawodny niż
prosta suma kontrolna (w przypadku sumy błędy potrafią się zniwelować, czyli nie zmienić sumy,
w CRC jest to dużo trudniejsze). Wartość CRC określana jest w sposób bardziej rygorystyczny niż
wartość sumy kontrolnej - otrzymuje się ją w wyniku podziału wartości otrzymanej w wyniku
odczytania ciągu binarnego przez wcześniej określoną liczbę binarną.
CRC jest resztą z binarnego dzielenia ciągu danych przez relatywnie krótki dzielnik, zwany
generatorem lub wielomianem CRC.
21
Cyfrowa rejestracja dźwięku
Uwe
Koder PCM
(Code Pulse
Modulation)
Rejestracja
informacji
na nośniku
Dekoder PCM
Uwy
Rys. 4.13. Cyfrowa rejestracja dźwięku
22
Cyfrowa rejestracja dźwięku c.d.
Zalety cyfrowej rejestracji dźwięku:
• małe szumy w porównaniu z zapisem analogowym,
• brak zniekształceń i przesłuchów,
• wysoka gęstość zapisu,
• możliwość równoczesnego zapisu wielu sygnałów
• możliwość komputerowej obróbki,
• trwałość zapisu.
23
Cyfrowa rejestracja dźwięku c.d.
Mikrofon
Mikrofon – przetwornik elektroakustyczny służący do przetwarzania fal
dźwiękowych na impulsy elektryczne.
Rys. 4.14. Mikrofony (od lewej):mikrofon firmy Grundig; Shure SM58 i Shure Beta
58A – mikrofony dynamiczne, bardzo popularne w zastosowaniach estradowych;
mikrofon komputerowy marki Tracer (źródło: http://pl.wikipedia.org)
24
Cyfrowa rejestracja dźwięku c.d.
Zasada działania mikrofonu
W tradycyjnych mikrofonach dynamicznych fale dźwiękowe powodują drgania
cienkiej elastycznej membrany wraz z cewką, która jest do niej umocowana.
Drgania cewki, która umieszczona jest między biegunami magnesu, wzbudzają
w niej przemienny prąd elektryczny o częstotliwości odpowiadającej częstości
drgań fal dźwiękowych.
W wyniku przetwarzania otrzymuje się z mikrofonu przebieg elektryczny –
sygnał foniczny w postaci siły elektromotorycznej E, napięcia wyjściowego U
oraz prądu I odpowiadającego przebiegowi akustycznemu.
25
Cyfrowa rejestracja dźwięku c.d.
Rodzaje mikrofonów
Ze względu na sposób przetwarzania drgań membrany na sygnał foniczny
mikrofony dzielimy na:
• stykowe (węglowe),
• piezoelektryczne,
• dynamiczne (magnetoelektryczne),
• pojemnościowe (elektrostatyczne),
• pojemnościowe elektretowe,
• laserowe.
26
Cyfrowa rejestracja dźwięku c.d.
Wybrane parametry mikrofonu
Charakterystyka częstotliwościowa – diagram zależności czułości mikrofonu (w dB) od
częstotliwości (Hz) (zwykle w zakresie 20Hz-20 kHz). Czasami zamiast wykresu podaje
się tylko pasmo przenoszenia (ang. frequency response), czyli zakres częstotliwości
akustycznych skutecznie przetwarzanych przez mikrofon.
Charakterystyka kierunkowości – wykres w układzie współrzędnych biegunowych
przedstawiający skuteczność mikrofonu przy danej częstotliwości i kącie padania
dźwięku, unormowany względem maksymalnej skuteczności mikrofonu. Ze względu na
kształt charakterystyki kierunkowej, mikrofony dzieli się na: wszechkierunkowe
(dookólne, kołowe), dwukierunkowe (ósemkowe), jednokierunkowe (kardioidalne,
nerkowe) i ultrakierunkowe.
(źródło: http://pl.wikipedia.org)
27
Rys. 4.15. Charakterystyki częstotliwościowe mikrofonów wokalowych:
pojemnościowego Oktava 319 (u góry) i dynamicznego Shure SM58
(na dole). (źródło: http://pl.wikipedia.org)
28
•poziomu przy oddalaniu[4]. Zjawisko to nie występuje w mikrofonach wszechkierunkowych.
dookólna
subkardioidalna
hiperkardioidalna
kardioidalna
ósemkowa
superkardioidalna
ultrakierunkowa
Rys.4.16. Charakterystyka kierunkowości mikrofonów
(źródło: http://pl.wikipedia.org)
29
Głośniki
Głośnik - przetwornik elektroakustyczny (odbiornik energii elektrycznej)
przekształcający prąd elektryczny w falę akustyczną. Idealny głośnik
przekształca zmienny prąd elektryczny o odpowiedniej częstotliwości na falę
akustyczną proporcjonalnie i liniowo. Rzeczywisty zakres częstotliwości, w
którym głośnik wytwarza falę ciśnienia proporcjonalnie do napięcia (z
dopuszczalnym odchyleniem) nazywa się pasmem przenoszenia głośnika.
Potocznie głośnikiem nazywa się również zespół głośników zamknięty w
wspólnej obudowie poprawnie nazywanej kolumną głośnikową.
30
Rys. 4.17. Głośnik dynamiczny: przekrój przez głośnik (po lewej);
w obudowie (po prawej) (źródło: http://pl.wikipedia.org)
31
Formaty plików audio - przykłady
• WAV (ang. wave form audio format) — format plików dźwiękowych
stworzony przez Microsoft oraz IBM.
• MP3 (ang. MPEG-1/2 Audio Layer-3) - standard (format) zapisu dźwięku
poddanego stratnej kompresji (najpopularniejszy obecnie).
• AIFF (z ang. Audio Interchange File Format) to format plików dźwiękowych
współtworzony przez firmę Apple. Dane audio zapisane są jako
nieskompresowany PCM. Format jest wykorzystywany głównie przez Apple na
komputerach Macintosh.
• RealAudio – format kompresji dźwięku stworzony przez firmę
RealNetworks. Kodek został opracowany głównie z myślą o wykorzystaniu go
w strumieniowaniu dźwięku przy łączu internetowym o niskiej przepustowości.
• Vorbis to stratny kodek dźwięku z rodziny Ogg. Jakość dźwięku
zakodowanego w formacie Ogg Vorbis jest wyższa niż MP3 o tej samej
przepływności.
32
Formaty plików audio – MP3
Z modelu psychoakustycznego wynika, że najlepiej słyszymy dźwięki w okolicach
2-4 kHz. Czym częstotliwość dźwięku bardziej odbiega od tego pasma, tym coraz
gorzej go słyszymy. Z tego wynika, że skrajne częstotliwości mogą zostać zapisane
z dużo mniejszą dokładnością (na mniejszej licznie bitów). Z modelu
psychoakustycznego wynika również zjawisko maskowania (głośne dźwięki
maskują ciche). Zatem w pobliżu głośnych dźwięków również można zmniejszyć
liczbę bitów, gdyż szum kwantyzacji nie będzie słyszany.
Subiektywna jakość dźwięku zależy również od modelu psychoakustycznego
zaimplementowanego w koderze, a także od słuchacza. Jeśli jego słuch będzie
bardzo odbiegał od modelu użytego w kodeku, oceniona jakość dźwięku może być
odebrana jako znacznie różna od oryginału.
MP3 opiera się na wcześniej wspomnianym modelu psychoakustycznym i jest to
metoda stratna. Polega na tym, że zostają „usunięte” (stratność) te informacje o
dźwięku, które są niezauważalne lub mało istotne dla człowieka
(psychoakustyczność).
33
Dźwięk wielokanałowy
Dźwięk wielokanałowy, dźwięk dookólny, dźwięk przestrzenny (ang. surround
sound) – technika będąca rozwinięciem stereofonii, pozwalająca na utrwalanie
i odtwarzanie co najmniej trzech kanałów dźwięku. Zastosowanie dodatkowych
kanałów i odpowiadających im głośników po bokach i z tyłu słuchacza pozwala
na zwiększenie poczucia otoczenia dźwiękiem.
Większość nagrań wielokanałowych jest tworzona na potrzeby filmów i gier
wideo. Dźwięk wielokanałowy jest wykorzystywany w salach kinowych,
systemach kina domowego i konsolach do gier.
(źródło: http://pl.wikipedia.org/)
34
Dźwięk wielokanałowy c.d.
System 5.1 składa się z pięciu kanałów pełnopasmowych (przednie: lewy, prawy
i centralny, oraz tylne: lewy i prawy) oraz kanału subwoofera. Jest najczęściej
stosowany w filmach DVD i nagraniach muzycznych na płytach DVD Audio.
W formacie Dolby Surround Pro Logic występuje 6 całkowicie odseparowanych
od siebie kanałów.
Rys. 4.18. Ustawienie głośników w systemie 5.1
(źródło: http://pl.wikipedia.org/)
35
Dźwięk wielokanałowy c.d.
Rys. 4.19. Dźwięk dookólny - Dolby Surround Pro Logic
(źródło: http://electronics.howstuffworks.com, http://www.kopernik.silesianet.pl/)
36
Dźwięk wielokanałowy c.d.
System 6.1 jest rozwinięciem systemu 5.1 o kanał tylny (rear). System 6.1 w swojej
najbardziej rozwiniętej wersji dostarcza sześciu kanałów pełnopasmowych (20 Hz – 20
kHz) oraz jednego niskoczęstotliwościowego. Poszczególne kanały to:
• Dwa kanały przednie (lewy i prawy) – L i R
• Kanał centralny – C
• Dwa kanały dookólne – (lewy dookólny i prawy dookólny) – Ls i Rs
• Jeden kanał tylny – Bs
• Jeden kanał niskoczęstotliwościowy – LFE
Jednym z formatów tego systemu w przemyśle kinowym jest Dolby Pro Logic IIx.
Rys. 4.20. Ustawienie głośników w systemie 6.1
(źródło: http://pl.wikipedia.org/)
37
Dźwięk wielokanałowy c.d.
System 7.1 jest rozwinięciem systemu 6.1 o drugi kanał tylny (rear).
Poszczególne kanały to:
• Dwa kanały przednie (lewy i prawy) – L i R
• Kanał centralny – C
• Dwa kanały dookólne – (lewy dookólny i prawy dookólny) – Ls i Rs
• Dwa kanały tylne (lewy i prawy) – Lb i Rb
• Jeden kanał niskoczęstotliwościowy – LFE
Rys. 4.21. Ustawienie głośników w systemie 7.1
(źródło: http://pl.wikipedia.org/)
38
Dźwięk wielokanałowy c.d.
Rys. 4.22. Dźwięk dookólny
(źródło: http://electronics.howstuffworks.com)
39
Animacja komputerowa
Animacja komputerowa to sztuka tworzenia ruchomych obiektów z wykorzystaniem
komputerów. Jest poddziedziną grafiki komputerowej i animacji. W coraz większym
zakresie jest ona realizowana jako animacja 3D (trójwymiarowa), choć
w
zastosowaniach
dysponujących
niską
przepustowością
sprzętową
i wymagających przetwarzania obrazów w czasie rzeczywistym cały czas ważną
pozycję utrzymuje animacja 2D (dwuwymiarowa, płaska). Czasami docelowym
medium animacji jest sam system komputerowy, ale zdarza się, ze animacja
przeznaczona jest dla innych mediów, takich jak film. Animację komputerową
czasami określa się skrótem CGI (od ang. Computer Generated Imagery, lub
Computer Generated Imaging) - szczególnie w zastosowaniach kinematograficznych.
By stworzyć iluzję ruchu, na ekranie komputera wyświetlany jest określony obraz, po
czym szybko zamienia się go na następny - podobny do poprzedniego, lecz
z nieznacznymi zmianami w pozycji obiektów. Technika ta jest identyczna
z zastosowaniami telewizyjnymi i kinowymi.
(źródło: http://pl.wikipedia.org)
40
Rys. 4.23. Przykład animacji komputerowej
(źródło: http://pl.wikipedia.org)
Rys. 4.24. Przykład animacji renderowanej komputerowo
(źródło: http://pl.wikipedia.org)
41
Wyjaśnienie zjawiska animacji
By oko i mózg dały się nabrać na iluzję gładko poruszającego się obiektu, kolejne
klatki animacji (kompletne obrazy) powinny się pojawiać z częstotliwością
co najmniej 12 razy na sekundę. Gdy częstotliwość pojawiania się nowych klatek
spada poniżej 12 razy na sekundę, większość obserwatorów odczuwa "rwanie" się
animacji i zauważa proces pojawiania się kolejnych klatek, co psuje iluzję
realistycznie płynnego ruchu. Tradycyjnie animowane kreskówki podają widzowi w
ciągu sekundy 15 nowych klatek obrazu, by możliwa była oszczędność w ilości
niezbędnych do wykonania rysunków.
42
Morfing – przykład animacji
Morfing (ang. morphing) – technika przekształcania obrazu polegająca na płynnej
zmianie jednego obrazu w inny, stosowana w filmie i animacji komputerowej.
Rys. 4.25. Morfing
(źródło: http://pl.wikipedia.org)
43
Morfing – przykład animacji c.d.
Rys. 4.26. Morfing
(źródło: http://pl.wikipedia.org)
44
Fotografia cyfrowa
Fotografia cyfrowa - polega na utrwaleniu obrazu w postaci cyfrowej, a nie, jak w
fotografii tradycyjnej, na chemicznym nośniku światłoczułym.
Utrwalenie obrazu w aparatach cyfrowych odbywa się poprzez pomiar jasności
poszczególnych pikseli (punktów) matrycy, na którą pada światło poprzez obiektyw.
Szeroko stosowana matryca CCD (ang. Charge Coupled Device) jest układem wielu
elementów światłoczułych, z których każdy rejestruje, a następnie pozwala odczytać
sygnał elektryczny proporcjonalny do ilości padającego na niego światła.
Poszczególne elementy matrycy mierzą ilość światła dla jednej ze składowych RGB,
dlatego też na każdy piksel wynikowego obrazu w postaci bitmapy przypada pomiar
z kompletu elementów światłoczułych.
45
Fotografia cyfrowa c.d.
Formaty zapisu danych
Ze względu na oszczędność zasobów pamięciowych w aparatach cyfrowych,
do zapisu fotografii najczęściej stosuje się format pliku JPEG, który charakteryzuje
się kompresją stratną. Oznacza to, że zmniejszenie pliku odbywa się kosztem utraty
pewnych szczegółów zdjęcia lub niewielkimi zniekształceniami. Z reguły
użytkownik może wybrać, czy zależy mu na silniejszej kompresji (zmieści w pamięci
więcej zdjęć) czy lepszej jakości. Droższe aparaty pozwalają także na zapis
alternatywny w postaci formatu RAW lub TIFF, co daje większe możliwości
manipulacji obrazem. Zdjęcia takie zajmują jednak znacznie więcej miejsca. Format
RAW (pojawiający się także pod innymi nazwami, np. w aparatach firmy Nikon jako
NEF) zawiera nieprzetworzone dane, pobrane bezpośrednio z sensora aparatu
i pozwala na ingerencję w sposób ich przetworzenia już po zrobieniu zdjęcia.
46
Wideofonia
Akwizycja i edycja sygnału wideofonicznego
Do akwizycji i edycji sygnału fonicznego niezbędny jest odpowiedni sprzęt oraz
oprogramowanie. Nakręcenie materiału wideo wymaga użycia kamery (zwykle
kamkodera, tj. kamery rejestrującej obraz), zaś wykonanie zdjęć – aparatu
fotograficznego.
Aby zarejestrowany obraz był dobrej jakości, filmowana lub fotografowana scena
powinna być odpowiednio oświetlona. Do akwizycji dźwięku niezbędne
są mikrofony, zaś do odsłuchu dźwięku głośniki.
Montaż materiałów multimedialnych obecnie odbywa się najczęściej cyfrowo,
po zgraniu zarejestrowanego materiału wideofonicznego do komputera
multimedialnego z odpowiednim oprogramowaniem.
47
Kamery, kamkodery
Podstawowym wyposażeniem niezbędnym do zarejestrowania obrazu wideo jest
kamera.
Kamery sprzed epoki kamer cyfrowych tzw. kamery analogowe rejestrowały
ruchomy obraz, poprzez zamianę sygnałów optycznych na sygnały elektryczne, na
analogowym nośniku danych, np. VHS.
Rys. 4.27. Kamera wideo standardu Video 8 firmy Sony z 1985 roku
(źródło: http://pl.wikipedia.org)
48
Kamery, kamkodery c.d.
Kamera cyfrowa (ang. DVC – Digital Video Camcorder) – urządzenie rejestrujące obraz oraz
dźwięk i zapisujące sygnał audiowizualny w postaci cyfrowej, na taśmie Digital Video w
kasetach DV albo MiniDV, na płycie DVD, karcie pamięci, czy dysku twardym.
Istota obrazowania kamer cyfrowych opiera się na specjalnych przetwornikach, tak zwanych
matrycach, wyróżnia się dwa rodzaje matryc:
• matryca CCD – Charge Coupled Device ,
• matryca CMOS – Complementary MOS.
Rys. 4.28. Amatorska kamera cyfrowa firmy JVC
(źródło: http://pl.wikipedia.org)
49
Wideofonia
Formaty wideo - przykłady
AVI
Nieskompresowany materiał video.
MPEG
MPEG (ang. Moving Picture Experts Group) - grupa robocza ISO/IEC zajmująca się
rozwojem standardów kodowania audio i wideo, a także zatwierdzona przez ISO
grupę powszechnie stosowanych formatów zapisu danych zawierających obraz
i dźwięk. Wśród tych standardów znajdują się m.in. najpopularniejszy format
kompresji dźwięku, stosowany w komputerach osobistych i odtwarzaczach
przenośnych MP3 oraz opracowany dość dawno przez grupę niezależnych ekspertów
standard używany jest do zapisu filmów Video CD, DVD i transmisji telewizji
cyfrowej (MPEG 2), czy wprowadzony ostatnio MPEG-4 mający zastosowanie
w filmach wideo wysokiej jakości, np na Blu-ray Disc.
50
Formaty wideo – przykłady c.d.
MPEG-2
Każda sekunda wysokiej jakości, filmowego nieskompresowanego obrazu w
europejskim standardzie PAL ma wielkość prawie 30 megabajtów. Taka ilość danych
drastycznie utrudniałaby składowanie, przesyłanie i odczyt. Cyfrowe odtwarzanie
wideo wymagało opracowania wydajnych standardów kompresji. Dlatego powstał
standard kompresji MPEG-2, który jest wykorzystywany do zapisu na nośnikach
DVD.
MPEG-4
Wprowadzony pod koniec 1998 jest oznaczeniem grupy standardów kodowania
audio i wideo wraz z pokrewnymi technologiami, opracowanej przez grupę ISO/IEC
MPEG. Główne zastosowania MPEG-4 to media strumieniowe w sieci Web,
dystrybucja CD, wideokonferencje i telewizja, oraz kamery cyfrowe. MPEG-4 jest
jak na razie najlepszym formatem jeśli chodzi o stosunek jakości obrazu do wielkości
pliku wideo.
51
Wideofonia
Formaty wideo – przykłady
FLV
Flash Video (FLV) jest standardem filmowym używanym do dystrybucji plików
wideo przez internet. Odtworzyć plik .flv możemy za pomocą zwykłej przeglądarki
internetowej z dodatkiem Adobe Flash Player lub osobnych programów, np.
udostępnianych bezpłatnie: Moyea FLV Player , FLV Player 2.0 czy też VLC media
player.
WMV
Windows Media Video - format kompresji filmów stworzony przez Microsoft.
(źródło http://videopr.pl/)
52

Podobne dokumenty