Kompresja danych – kompresja stratna i bezstratna (charakterystyka).
Transkrypt
Kompresja danych – kompresja stratna i bezstratna (charakterystyka).
Justyna Korycińska Polega na zmianie sposobu zapisu informacji tak, aby użyć jak mniejszej liczby bitów. Kompresja stratna Kompresja bezstratna Stosuje się ją w celu zmniejszenia wielkości strumienia czy pliku z danymi. Częścią algorytmu jest odrzucenie mniej ważnych informacji w celu polepszenia. W przypadku muzyki kompresja stratna gorszej jakości może się objawiać bardziej metalicznym dźwiękiem o wyraźnie słyszalnych przekłamaniach dźwięku, ale przy użyciu nowoczesnych kodeków straty są mało zauważalne. W przypadku wideo zbyt mocna lub złej jakości kompresja stratna może się objawiać np. charakterystycznymi artefaktami w kształcie kwadratów lub zmniejszeniem głębi kolorów i rozmyciem obrazu. Metody transformacyjne- wykorzystywane są np. transformacje Fouriera, falkowa . Przykładowo dzielony jest obraz na bloki i każdy blok jest poddawany transformacji. Współczynniki transformacji poddawane są kwantyzacji, a następnie te dane są poddawane kompresji bezstratnej Kompresja fraktalna- obraz dzielimy na rozłączne obszary Ri . Szukamy dziedziny Di, która będzie odwzorowaniem każdego obszaru. Dla każdej wybranej pary (Di , Rj ) wybrać możliwie najlepsze przekształcenie przeprowadzające Di w Rj . Mp3 jpg Metody kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, pod warunkiem, że metoda ta gwarantuje możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej. Kodowanie: Słownikowe- poszukują dokładnych wystąpień danego ciągu znaków, np. zastępują 'the ' krótszą ilością bitów niż jest potrzebna na zakodowanie 4 niezwiązanych znaków. ' Statystyczne- używają mniejszej ilości bitów dla częściej występujących symboli, w przypadku praktycznie wszystkich oprócz najprostszych metod, prawdopodobieństwa zależą od kontekstu. A więc np. dla 'h' występującego po 't' używają mniejszej ilości bitów niż dla innych znaków w tym kontekście Kodowanie długości serii- gdy w pliku występują serie takich samych danych to zapisywana jest tylko jego zawartość wraz z ilością wystąpień i na których miejscach Podstawą metody jest budowa drzewa Huffmana. Inaczej niż zwykle bo zaczynamy budowanie od liści, a nie od korzenia. Każdy liść to symbol z dziedziny danych. Wartość liścia oznacza liczbę wystąpień symbolu w strumieniu danych. Do każdego znaku prowadzi tylko jedna droga. Jeżeli rozgałęzienia na prawą stronę oznaczone zostaną 0 a na lewą 1 to dla każdego znaku można określić unikatowy kod binarny. TIFF PNG GIF