Jednostki informacji
Transkrypt
Jednostki informacji
Jednostki informacji Jednostki informacji Materny Elżbieta, KrWzEk1011 / 2004 / 2005 Wprowadzenie Informacja - (łac. informatio - wyobrażenie, pojęcie) to pojęcie o wielu definicjach w różnych dziedzinach. W teorii informacji jest nią prawdopodobieństwo zajścia zdarzenia. Zdarzenia mniej prawdopodobne dają więcej informacji. Dokładny wzór to: I = -log2(p) bit Podstawową jednostką informacji jest bit. Jednostki informacji Bit - jest to najmniejsza ilość informacji potrzebna do określenia, który z dwóch równie prawdopodobnych stanów przyjął układ. Jest to również najmniejsza jednostka informacji używana w odniesieniu do sprzętu komputerowego. Bit przyjmuje jedną z 2 wartości, które zwykle określa się jako: 0 (zero) 1 (jeden) . choć można przyjąć dowolną inną parę wartości, np.: prawda, fałsz lub -1, +1 Z tego względu, obliczenia wykonywane przez procesor opierają się na binarnym (dwójkowym) systemie liczbowym. Bajt - jest to najmniejsza adresowalna jednostka pamięci komputerowej, składająca się z bitów. Symbolem bajtu jest wielka litera B (w odróżnieniu od bitu oznaczanego małą literą b). 1 bajt to zazwyczaj 8 bitów, choć nie zostało to nigdzie określone - w pierwszych komputerach było całkowicie inaczej (4, 6, 7, 9 bitów). Przełom nastąpił dopiero w 1964 po tym jak IBM wprowadził System/360, w którym użyto 8 bitów jako bajt. Prawidłowa nazwa jednostki składającej się z ośmiu bitów to oktet. Używane jednostki, wielokrotności bajtu to: 1 kB = 1024 B (kB - kilobajt) 1 MB = 1024 kB (MB - megabajt) 1 GB = 1024 MB (GB - gigabajt) 1 TB = 1024 GB (TB - terabajt) 1 PB = 1024 TB (PB - petabajt) 1 EB = 1024 PB (EB - eksabajt) Warto zauważyć, że stosowanie przedrostków kilo, mega, giga i tera (oraz większych) w tej terminologii jest niezgodne z określeniami układu SI dla znaczenia tych przedrostków (np. kilo oznacza tysiąc, a nie 1024). Jest to częstym źródłem pomyłek a nawet oszustw (np. co do faktycznej pojemności dysków czy pamięci komputerowych. W celu odróżnienia przedrostków o mnożniku 1000 od przedrostków o mnożniku 1024 już w Jednostki informacji styczniu 1997 r. pojawiła się propozycja opracowana przez IEC dodawania litery "i". Przedrostki wyglądałyby następująco: Symbol Ki Mi Gi Ti Pi Ei Nazwa Kibibajt Mebibajt Gibibajt Tebibajt Pebibajt Exbibajt Mnożnik 10241 10242 10243 10244 10245 10246 Mnożnik (dziesiętnie) 1 024 1 048 576 1 073 741 824 1 099 511 627 776 1 125 899 906 842 624 1 152 921 504 606 846 976 I wtedy: 1 KiB = 1024 B (KiB - kibibajt) 1 MiB = 1024 KiB (MiB - mebibajt) 1 GiB = 1024 MiB (GiB - gibibajt) 1 TiB = 1024 GiB (TiB - tebibajt) Niestety, ta propozycja rozwiązania problemu niejednoznaczności przedrostków nie przyjęła się. Bajt 8-bitowy można podzielić na dwie połówki 4-bitowe nazywane tetradami (ang. nibbles). Rozróżniamy młodszą (bity 1-4) i starszą (bity 5-8) tetradę. Bajt wchodzi w skład słowa maszynowego (zwykle 2 bajty) oraz długiego słowa maszynowego (zwykle 4 bajty). Stosowane w informatyce przedrostki jednostek miary o identycznych nazwach i oznaczeniach jak przedrostki SI, ale o mnożniku zastąpionym potęgą 2 w miejsce potęgi 10. W przybliżeniu: 103 ≈ 210 Stosowane niekonsekwentnie, głównie do oznaczania pojemności pamięci i szybkości transmisji. Próbą uściślenia jest dodanie po znaku mnożnika litery i (np. kB→kiB). Przedrostek Oznaczenie kilo k mega M giga G tera T peta P eksa E zetta Z jotta Y Mnożnik 210 = 1,024 220 = 1,048,576 230 = 1,073,741,824 240 = 1,099,511,627,776 250 = 1,125,899,906,842,624 260 = 1,152,921,504,606,846,976 270 = 1,180,591,620,717,411,303,424 280 = 1,208,925,819,614,629,174,706,176 Nazwa kilobajt megabajt gigabajt terabajt petabajt eksabajt zettabajt jottabajt Jednostki informacji Pojęcia pokrewne Oktet - jest to 8 bitów. Często pojęcia oktet i bajt są używane zamiennie, jednak rozmiar bajtu jest zależny od architektury i nie zawsze wynosi 8 bitów. Z tego powodu w standardach sieciowych używa się prawie wyłącznie pojęcia "oktet". Rekord - pojedynczy zapis, który cos oznacza; w systemach DOS i UNIX można traktować bajt jako rekord, ale np. w pliku tekstowym zwykle traktuje się linie jako rekord; system VMS ma rekordy "wbudowane" w system, i nie pozwala czytać informacji po bajcie Plik - zbiór rekordów, ustawionych w określonej kolejności, które tworzą pewna całość, z możliwością operacji na nim jako całości. Bibliografia - http://www.fuw.edu.pl/~jt/p2/nauka-c.txt - http://pl.wikipedia.org/wiki/MB - Ryszard Tadeuszkiewicz „Wstęp do informatyki” - Zdzisław Płoski „Słownik encyklopedyczny. Informatyka”