Kompresja danych – kompresja stratna i bezstratna (charakterystyka).

Transkrypt

Kompresja danych – kompresja stratna i bezstratna (charakterystyka).
Justyna Korycińska
Polega na zmianie sposobu zapisu informacji tak, aby
użyć jak mniejszej liczby bitów.
 Kompresja stratna
 Kompresja bezstratna
 Stosuje się ją w celu zmniejszenia wielkości strumienia
czy pliku z danymi. Częścią algorytmu jest odrzucenie
mniej ważnych informacji w celu polepszenia. W
przypadku muzyki kompresja stratna gorszej jakości
może się objawiać bardziej metalicznym dźwiękiem o
wyraźnie słyszalnych przekłamaniach dźwięku, ale
przy użyciu nowoczesnych kodeków straty są mało
zauważalne. W przypadku wideo zbyt mocna lub złej
jakości kompresja stratna może się objawiać np.
charakterystycznymi artefaktami w kształcie
kwadratów lub zmniejszeniem głębi kolorów i
rozmyciem obrazu.
 Metody transformacyjne- wykorzystywane są np.
transformacje Fouriera, falkowa . Przykładowo
dzielony jest obraz na bloki i każdy blok jest
poddawany transformacji. Współczynniki
transformacji poddawane są kwantyzacji, a następnie
te dane są poddawane kompresji bezstratnej
 Kompresja fraktalna- obraz dzielimy na rozłączne
obszary Ri . Szukamy dziedziny Di, która będzie
odwzorowaniem każdego obszaru. Dla każdej
wybranej pary (Di , Rj ) wybrać możliwie najlepsze
przekształcenie przeprowadzające Di w Rj .
 Mp3
 jpg
Metody kompresji informacji do postaci zawierającej
zmniejszoną liczbę bitów, pod warunkiem, że metoda
ta gwarantuje możliwość odtworzenia informacji z
postaci skompresowanej do identycznej postaci
pierwotnej.
Kodowanie:
 Słownikowe- poszukują dokładnych wystąpień danego
ciągu znaków, np. zastępują 'the ' krótszą ilością bitów
niż jest potrzebna na zakodowanie 4 niezwiązanych
znaków. '
 Statystyczne- używają mniejszej ilości bitów dla
częściej występujących symboli, w przypadku
praktycznie wszystkich oprócz najprostszych metod,
prawdopodobieństwa zależą od kontekstu. A więc np.
dla 'h' występującego po 't' używają mniejszej ilości
bitów niż dla innych znaków w tym kontekście
 Kodowanie długości serii- gdy w pliku występują serie
takich samych danych to zapisywana jest tylko jego
zawartość wraz z ilością wystąpień i na których
miejscach
 Podstawą metody jest budowa drzewa Huffmana.
Inaczej niż zwykle bo zaczynamy budowanie od liści, a
nie od korzenia. Każdy liść to symbol z dziedziny
danych. Wartość liścia oznacza liczbę wystąpień
symbolu w strumieniu danych. Do każdego znaku
prowadzi tylko jedna droga. Jeżeli rozgałęzienia na
prawą stronę oznaczone zostaną 0 a na lewą 1 to dla
każdego znaku można określić unikatowy kod binarny.
 TIFF
 PNG
 GIF

Podobne dokumenty