Kodowanie informacji

Transkrypt

Kodowanie informacji
Kodowanie informacji
Przygotował:
Ryszard Kijanka
Komputer jest urządzeniem służącym do
przetwarzania informacji. Informacją są
liczby, ale także inne obiekty, takie jak litery,
wartości logiczne, obrazy itp. Ponieważ
komputer jest urządzeniem zbudowanym z
układów cyfrowych to, jak powiedziano,
każda informacja przetwarzana przez niego musi
być reprezentowana za pomocą dwóch stanów wysokiego i niskiego. Duża część tej informacji to
liczby, stąd przyjęło się nazywać te stany
jedynką i zerem (1 i 0).
Proces przekształcania jednego rodzaju postaci informacji na inną
postać nazywamy kodowaniem.
Definicja
Kodowaniem nazywamy przyporządkowanie
poszczególnym obiektom zbioru kodowanego
odpowiadających im elementów zwanych słowami
kodowymi, przy czym każdemu słowu kodowemu
musi odpowiadać dokładnie jeden element kodowany.
Sposób określenia kodu, czyli procesu
kodowania, może być różnoraki. Może to być opis
słowny, wzór, tabela przekodowująca lub każdy inny
sposób zapewniający spełnienie warunków
podanych w definicji.
Przykłady kodów liczbowych
Definicja
Kodem liczbowym nazywamy taki kod, który
liczbom dowolnego systemu będzie
przyporządkowywał słowa kodowe w postaci
zerojedynkowej.
Przykład
Naturalny kod binarny (NKB)
Definicja
Jeżeli dowolnej liczbie dziesiętnej przyporządkujemy
odpowiadającą jej liczbę binarną, to otrzymamy
naturalny kod binarny (NKB).
Przykłady słów kodu N K B
Sposób konstruowania słowa kodowego w kodzie prostym BCD
1. Każdej cyfrze dziesiętnej przyporządkowujemy czterocyfrową liczbę
dwójkową (zwaną tetradą) w kodzie NKB (gdyby zamiast słów kodu
NKB został użyty inny kod, np. Graya, wówczas otrzymalibyśmy kod
BCD Graya).
2. Słowo kodowe w kodzie prostym BCD odpowiadające danej
liczbie otrzymujemy, zapisując każdą cyfrę tej liczby w postaci
czwórki cyfr binarnych
Bramki logiczne i operatory (działania) logiczne
Jedną z ważnych grup działań wykonywanych
podczas przetwarzania informacji są działania
logiczne. Wykonywanie tych działań wiąże się z
operowaniem dwoma wartościami logicznymi
zwanymi prawdą (ang. true) i fałszem (ang. false).
Wartości te są w logice pojęciami pierwotnymi, czyli
nie są to pojęcia definiowane. Działania logiczne
operują na wartościach logicznych i ich wynikiem
również jest wartość logiczna (podobnie jak działania
arytmetyczne operują na liczbach, dając w wyniku
liczbę).
Reprezentacja danych
Znaki pisarskie są reprezentowane przez liczby, określające pozycję
(wskaźnik)danego symbolu w tablicy kodowej.
Tablice kodowe:
•ASCII (ang. American Standard Code for Information Interchange)7-bitowy kod przyporządkowujący liczby z zakresu 0-127: literom
(alfabetu angielskiego), cyfrom, znakom przestankowym i innym
symbolom oraz poleceniom sterującym
•Rozszerzony kod ASCII - posiada 256 pozycji (pierwsze 128 tak jak
ASCII, następne kody narodowe i inne symbole). Problemem są różne
kody dla różnych organizacji i krajów
•Kody rodziny EBCDIC (ang. Extended Binary Coded Decimal
Interchange Code) - EBCDIC to rozszerzony zapisywany dziesiętnie
kod wymiany informacji, używany w systemach firmy IBM.
•UNICODE
•ISO 8859-x
ASCII
•Opracowany dla urządzeń dalekopisowych, później przyjęty
dla komputerów
•128 pozycji, w tym 95 znaków widocznych i 33 niewidoczne
(znaki niewidoczne: spacja, odstępy i inne kody
formatujące)
•Posiada kody sterujące transmisją i urządzeniami (pozycje
0..31)
•Spacja - kod 32
•Cyfry 0..9 - kody od 48 do 57 (0x30...0x39)
•Litery w kolejności alfabetycznej (wielkie: 65..90 (0x41.
0x5a), małe: 97.122 (0x61.0x7a))
•Odstęp pomiędzy małą i wielką literą wynosi 32 (0x20)
•127 - kod specjalny (kasowanie znaku)
Rozszerzone kody na bazie ASCII
•256 pozycji kodowych - reprezentacja 8-bitowa
•pierwsze 128 pozycji identycznych z ASCII
•kolejne 128 pozycji reprezentuje znaki wybranej grupy
alfabetów narodowych lub inne (np. znaki alfabetów
słowiańskich, znaki alfabetów skandynawskich, alfabet
grecki, cyrylica itp.)
•Wiele tablic kodowych pochodzących z wielu źródeł,
między innymi:
» IS08859 - kilkanaście tablic (znaki polskie - IS08859-2)
» Microsoft - kilkadziesiąt tablic, tzw.: „strony kodowe”- CP
Własne o lokalnym zasięgu, np. Mazovia, Polgaz
UNICODE
UNICODE - uniwersalny kod znakowy, umożliwiający
reprezentację wszystkich znaków pisarskich zapisu fonetycznego
(głoskowego) używanych na całym świecie.
Liczba pozycji kodowych jest praktycznie
nieograniczona, (pierwotnie 216 obecnie 2 32).
Wersja kodu 3.2 obejmuje 95.156 znaków
(alfabet chiński, japoński, koreański, rosyjski,
hebrajski, perski, tajski oraz szereg innych
języków + symbole matematyczne i graficzne).
ISO 8859-1 Latin-1
•formalnie ISO/IEC 8859-1, czy też Latin-1, "kodowanie
zachodnioeuropejskie",
•pierwsza część ISO/IEC 8859 — standardu kodowania
znaków ustalonego przez Międzynarodową
Organizację Normalizacyjną (później ISO i IEC)
•Standard po rozszerzeniu o dodatkowe przypisania
znaków, jest podstawą dla dwóch powszechnie
używanych odwzorowań znaków, znanych jako ISO8859-1 i Windows-1252.
•Znak jest kodowany jako pojedyncza, 8-bitowa
wartość.
ISO 8859-2
•formalnie ISO/IEC 8859-2, Latin-2, środkowo i
wschodnioeuropejskie
•druga częścią standardu kodowania znaków
zdefiniowanego przez organizację ISO.
•191 znaków łacińskiego pisma, z czego każdy
jest zapisywany przy pomocy ośmiu bitów.
Kodowanie informacji ciągłej
- przy przekształcaniu tak zwanej informacji ciągłej, czyli
analogowej, na informację cyfrową, który to sposób pozwala
kodować w postaci binarnej takie wielkości jak napięcie
(będące wielkością wyjściową wielu przetworników, na
przykład mikrofonów, termometrów cyfrowych i wielu innych).
Informacja analogowa charakteryzuje się tym, że może
przybierać wiele wartości, przy czym zmiany pomiędzy tymi
wartościami są płynne. Zmiany wielkości analogowej na
wykresie przedstawiamy w postaci ciągłej krzywej.
Proces kodowania informacji analogowej, czyli ciągłej, jaką
jest przykładowo dźwięk (dźwięk jest zmianą ciśnienia
akustycznego rozchodzącą się w powietrzu lub innym
materiale), wymaga realizacji kilku etapów. Są to:
 próbkowanie, polegające na cyklicznym (inaczej: z określoną
częstotliwością) sprawdzaniu wartości przebiegu analogowego
i zwykle czasowym zapamiętaniu tej wartości,
 kwantyzacja, polegająca na podziale całego obszaru
zmienności wielkości analogowej na określoną liczbę
przedziałów i stwierdzeniu, w którym przedziale znajduje się
dana pobrana próbka,
 kodowanie, polegające na przyporządkowaniu każdemu
przedziałowi zmienności wielkości analogowej określonej
kombinacji zerojedynkowej (zwykle interpretowanej jako numer
czy też wartość danego przedziału) i podaniu kodu tego
przedziału, w którym znajduje się nasza próbka.
Jednostki informacji
•bit „b” - najmniejsza jednostka informacji, odpowiada
informacji TAK-NIE, 1-0, PRAWDA-FAŁSZ
•bajt (byte) - „B" - najmniejsza jednostka informacji
adresowana przez procesor - obecnie 8 bitów
•słowo (word) - jednostka informacji, na której operuje
komputer
Bramki logiczne
i operatory logiczne