Microsoft PowerPoint - IwZ_4.ppt [tryb zgodno\234ci]
Transkrypt
Microsoft PowerPoint - IwZ_4.ppt [tryb zgodno\234ci]
Chipset Zestaw układów scalonych zarządzających transferami pomiędzy procesorem, pamięcią cache, pamięcią główną i kontrolerami magistral Intel Triton 430 FX,VX,TX,HX,TX (1995-1998) – płyty główne z pojedynczą magistralą systemową 66MHz, magistrala PCI 2.0, wbudowana obsługa dysków EIDE, pamięci EDO, SDRAM (SIMM, DIMM), kontroler USB, kontroler PS2 klawiatury i myszy Wstęp do informatyki Architektura komputera PC cd. Cezary Bolek [email protected] Uniwersytet Łódzki Wydział Zarządzania Katedra Informatyki Klony: VIA, SiS, Opti, Ali, ... Wstęp do informatyki North-South Bridge Cezary Bolek <[email protected]> 2 Chipset c.d. Intel 440 LX,EX,BX,ZX,GX,NX (1997-1999) – płyty główne z magistralą back- i frontside 100MHz, magistrala AGP, obsługa trybów Ultra DMA dysków EIDE, ACPI , czujniki temperatury i obrotów, RAID North Bridge: zarządzanie szybkim transferem pomiędzy procesorem, pamięcią i AGP South Bridge: zarządzanie transferem do urządzeń we/wy Wstęp do informatyki Cezary Bolek <[email protected]> 3 Wstęp do informatyki Cezary Bolek <[email protected]> 4 1 Chipset c.d. Chipset c.d. Intel Intel E7205 chipset (2002) magistrala pamięci Dual Channel DDR266 (4.2GB/s) 400/533MHz FrontsideBus (3.2GBps - 4.2GB/s) AGP 8x USB 2.0 Intel 810,820,815,850,845 (1999-2002) – płyty główne z magistralą back- i frontside 133,266,400MHz, Accelerated Hub Architecture, AGPx4, pamięci DDR SDRAM, zintegrowany kontroler dźwięku AC97, modem, LAN Accelerated Hub Architecture • Memory Controller Hub • I/O Controller Hub, and • Firmware Hub. Intel 875P chipset (2003) 64-bit 800MHz FSB (6.4GB/s) Dual Channel DDR SDRAM: DDR400, DDR333, DDR266 Serial ATA Transfery pomiędzy hub’ami wykorzystują własną wydajną magistralę Intel 865 chipset (2003) Hyper Threading Dual Channel 64-bit DDR Communication Streaming Architecture: gigabit Ethernet Wstęp do informatyki Cezary Bolek <[email protected]> 5 Wstęp do informatyki Chipset c.d. Cezary Bolek <[email protected]> 6 Cezary Bolek <[email protected]> 8 Chipset c.d. Intel P45 chipset (2008) North bridge i865 chipset Celeron/Dual-Core, Pentium DualCore, and Core 2 Duo/Quad/Extreme 800/1066/1333MHz FSB Dual-channel DDR2-667/800, DDR3800/1066, 16/8 GB (DDR2/DDR3) PCI Express 2.0 x16 Wstęp do informatyki South bridge do 6 portów PCIEx1 (PCI-E 1.1) do 4 slotów PCI 6 portów Serial ATA II RAID 0, 1, 0+1 (10), 5 with Matrix RAID function 12 x USB 2.0 devices Gigabit Ethernet High Definition Audio (7.1) Cezary Bolek <[email protected]> 7 Wstęp do informatyki 2 Chipset c.d. Chipset c.d. Intel P55 chipset (2009) Intel H55 chipset (2009) Core i7, Core i5, Core i7 LGA1156 Core i7, Core i5 LGA1156 6 SATA 3 Gb/s ports 8 PCI-Express 2.0 slots (bandwidth limited to 250MB/s same as PCIe 1.0, normal PCIe 2.0 have 500MB/s bandwidth) 14 USB 2.0 ports Integrated LAN 10/100/1000 SMBus 2.0 Integrated clock chip buffer Intel HD Audio Intel AC'97 Technology Intel Rapid Storage Technology Wstęp do informatyki Cezary Bolek <[email protected]> 9 Wstęp do informatyki Cezary Bolek <[email protected]> 10 Chipset c.d. Intel X58 chipset (2008) Core i7 LGA1336 Intel® QuickPath Interconnect (QPI) System pamięci komputerów PC @ 6.4 and 4.8 GT/s 6 PCI Express* 2.0 Interface Intel® High Definition Audio Intel® Matrix Storage Technology Intel® Rapid Recover Technology 6 Serial ATA (SATA) 3 Gb/s eSATA 12 USB Port Wstęp do informatyki Cezary Bolek <[email protected]> 11 Wstęp do informatyki Cezary Bolek <[email protected]> 12 3 Pamięć – wąskie gardło systemu Postęp w wydajności procesorów i pamięci Podwojenie wydajności procesora: 18 miesięcy Podwojenie wydajności pamięci: 7 lat Rozwiązanie problemu wolnego dostępu do pamięci: zastosowanie b. szybkich pamięci StaticRAM – rozwiązanie bardzo kosztowne i energochłonne, nadające się tylko do specjalnych zastosowań; zastosowanie wolnych pamięci DRAM i metod poprawy transferu: szerokie magistrale, transfery blokowe; Na szybkość pamięci składają się dwa parametry: Memory access time: czas transferu podstawowej porcji danych pomiędzy procesorem i pamięcią kombinacja duŜej i wolnej oraz małej i szybkiej pamięci, zorganizowanej tak aby większość transferów odbywała się z pamięcią szybką (tzw. cache). Memory cycle time: minimalny czas pomiędzy dwoma kolejnymi odczytami/zapisami tej samej komórki pamięci Wydajny system pamięci musi mieć budowę hierarchiczną! Wstęp do informatyki Cezary Bolek <[email protected]> 13 Wstęp do informatyki Hierarchiczna organizacja pamięci Cezary Bolek <[email protected]> 14 Hierarchiczna organizacja pamięci np. CPU i rejestry wewnętrzne czas dostępu DEC Alpha 21164 (500MHz) L1 Cache im dalej od procesora tym wolniejsza pamięć Cache L2 ... Rejestry procesora Pamięć Cache level 1 (on chip) Pamięć Cache level 2 (on chip) Pamięć Cache level 3 (off chip) Główny system pamięci (DRAM) Pamięć wirtualna (na twardym dysku) 2ns 4ns 5ns 30ns 220ns ms Pamięć główna Rozmiar pamięci na kaŜdym poziomie Wstęp do informatyki Cezary Bolek <[email protected]> 15 Wstęp do informatyki Cezary Bolek <[email protected]> 16 4 Odczyt z pamięci Cache Koncepcja pamięci podręcznej - Cache adres Pamięć Cache – relatywnie mała i szybka pamięć, która powiela fragment głównego systemu pamięci, w taki sposób, aby większość odwołań procesora odnosiła się właśnie do pamięci Cache. dane Reguły działania: Procesor Podczas odczytu danej pamięci: procesor sprawdza czy dana jest w pamięci podręcznej – jeśli jest to ładuje ją, jeśli danej nie ma w Cache, procesor pobiera ją z pamięci głównej i umieszcza w rejestrze wewnętrznym, ale równieŜ w pamięci Cache. Cache Dana jest juŜ w pamięci Cache podczas próby odczytu adres Podczas zapisu danej do pamięci: procesor zapisuje daną do pamięci Cache i pamięci głównej jednocześnie (write-through). procesor zapisuje daną tylko do pamięci Cache, a zapis do pamięci głównej odbywa się dopiero gdy inna dana ma być zapisana w tym samym miejscu pamięci Cache (write-back). dane Procesor Wstęp do informatyki Cezary Bolek <[email protected]> 17 Zapis do pamięci Cache Wstęp do informatyki Cezary Bolek <[email protected]> Pamięć operacyjna RAM inne dane (o ile były zmienione) Układ pamięci podręcznej pośredniczy w dostępie procesora do RAM. Look – Throgh (dostęp „przez”) Pamięć podręczna CACHE Procesor CPU adres Look – Backside (dostęp od tyłu) Procesor dane Zapis do Cache i w razie potrzeby do pamięci głównej (write-back) Wstęp do informatyki Procesor CPU Cache magistrala FSB Pamięć operacyjna magistrala BSB inne dane (o ile były zmienione) Cezary Bolek <[email protected]> Podłączona równolegle z pamięcią operacyjną RAM. Częstotliwość pracy obu pamięci jest taka sama Magistrala jest blokowana przy kaŜdym dostępie procesora do cache i nie moŜe być w tym samym czasie udostępniona innym urządzeniom Pamięć podręczna CACHE Cache Zapis do Cache i pamięci głównej (write-thruogh) 18 Procesor odwołuje się do cache wykorzystując magistralę pamięciową. Look – Aside (dostęp bezpośredni) Procesor CPU dane inne dane (o ile były zmienione) Metody dołączenia pamięci cache do procesora adres Procesor Cache Danej nie ma w pamięci Cache podczas próby odczytu Hit rate – współczynnik trafień – proporcja liczby udanych transferów z pamięci Cache w stosunku do wszystkich transferów pomiędzy procesorem a pamięcią. dane Pamięć podręczna CACHE 19 Wstęp do informatyki RAM Pamięć operacyjna RAM Procesor odwołuje się do układu cache, natomiast ten układ jest dołączony przez magistralę pamięciową do RAM. Układ pamięci podręcznej jest dołączony do procesora przez oddzielną magistralę BSB (Back Side Bus). Druga magistrala FSB (Front Side Bus) łączy procesor z pamięcią główną. Częstotliwości obu magistral są niezaleŜne. MoŜliwe jest wykorzystanie FSB przez inne urządzenia zapisujące do pamięci RAM, gdy procesor komunikuje się z cache po BSB. Cezary Bolek <[email protected]> 20 5 Organizacja pamięci Cache Zasady lokalności programów Pamięć główna Cache Dlaczego pamięć Cache istotnie poprawia wydajność skoro obejmuje tylko mały fragment pamięci operacyjnej? Linia 0 Linia 1 Linia 2 Linia 3 etc... Zasada lokalności w przestrzeni: jeśli jakaś instrukcja lub dana była raz odczytana, to inne instrukcje lub dane blisko niej będą równieŜ odczytane. Pamięć Cache składa się z linii, zawierających pewną liczbę bajtów występujących kolejno po sobie w pamięci głównej. Zasada lokalności w czasie: jeśli jakaś instrukcja lub dana była raz odczytana, to będzie prawdopodobnie odczytana wkrótce jeszcze raz . Zasada lokalności w czasie i przestrzeni dotyczy programów (instrukcji) i danych, ale nie ma Ŝadnej korelacji pomiędzy instrukcjami i danymi Zalecane jest istnienie oddzielnych pamięci Cache dla instrukcji i danych tzw. architektura typu Harvard. Wstęp do informatyki Cezary Bolek <[email protected]> 21 Wstęp do informatyki Cezary Bolek <[email protected]> Pamięć Cache L2 Pamięć Cache L1 Wykonywana jako część procesora lub oddzielny układ scalony, montowany na płycie głównej obok procesora „na stałe” lub w gniazdach Główny element decydujący od wydajności systemu Słabsze ograniczenia rozmiaru, typowo od 256kB do 12MB Zawsze zintegrowana z mikroprocesorem w jednym układzie scalonym, co ogranicza jej rozmiar (4-256kB) Zbudowana jako pamięć Static RAM (przerzutniki) Zbudowana jako pamięć Static RAM (przerzutniki) Czas dostępu znacznie wolniejszy od rejestrów procesora, ale znacznie szybszy od pamięci głównej Czas dostępu niemal tak szybki jak do rejestrów procesora Strategie write-back (szybsza) i write-through (wolniejsza) Zawsze dwa oddzielne bloki: dla instrukcji i dla danych Współpraca z procesorem w trybie burst poprzez magistralę backside procesora Strategie: write-back (szybsza) i write-through (wolniejsza) Wstęp do informatyki Cezary Bolek <[email protected]> 22 Cache L3 – rozwinięcie koncepcji hierarchii pamięci poprzez dodanie jeszcze jednego poziomu, zwykle o rozmiarze kilku MB, dla wydajnych systemów serwerowych. 23 Wstęp do informatyki Cezary Bolek <[email protected]> 24 6 Pamięć główna SDRAM Zawsze wykonywana jako pamięć Dynamic RAM (DRAM), współpracująca z procesorem przez magistralę systemową lub magistralę frontside Wszystkie procesory typu Pentium (po 1993) mają magistralę danych o szerokości 64bity (8 bajtów) Synchronous Dynamic Random Access Memory – pamięć z interfejsem synchronicznym. Pamięć tradycyjna (DRAM) posiada interfejs asynchroniczny – odpowiedź jest generowana niezaleŜnie od taktowania zegara FSB. DRAM Fast Page Mode DRAM Extended Data Out DRAM Burst Extended Data Out DRAM Synchronous DRAM – 4.77-40MHz – FPM DRAM (16-66MHz) – EDO DRAM (33-75MHz) – BEDO DRAM (60-100MHz) – SDRAM (100,133MHz) Double Data Rate SDRAM DDR2 SDRAM DDR3 SDRAM – DDR SDRAM (200,266,333,400 MHZ, ...) Wstęp do informatyki SDRAM czeka na cykl zegara FSB, będąc z nim zsynchronizowana. Dane pojawiają się po określonej liczbie cykli zegara od momentu wysłania Ŝądania odczytu. Maksymalna przepustowość pamięci: PC100 SDRAM = 8 * 100MHz = 800MB/s PC133 SDRAM = 8 * 133MHz = 1.1GB/s Cezary Bolek <[email protected]> 25 Wstęp do informatyki DDR SDRAM 26 DDR2 SDRAM Koncepcja podobna do SDRAM Dwukrotne zwiększenie przepustowości poprzez transfer danych podczas narastającego i opadającego zbocza zegara. Pojedynczy transfer danych - 64 bitów. Transfer DDR SDRAM = (częstotliwość zegara) × 2 (dwa zbocza) × 64 (liczba bitów na transfer) / 8 (liczba bitów/byte). Dla taktowania 100 MHz, transfer 1600 MB/s. Wstęp do informatyki Cezary Bolek <[email protected]> Cezary Bolek <[email protected]> 27 WyŜsza efektywna częstotliwością taktowania (533, 667, 800, 1066 MHz) Dwukrotne zwiększenie przepustowości w stosunku do DDR W pojedynczym cyklu zegara – 4 bity WyŜsze czasy latencji (latency) NiŜszy pobór prądu. Wstęp do informatyki Cezary Bolek <[email protected]> 28 7 Moduły pamięci DDR3 SDRAM (najpopularniejsze) Ośmiokrotny transfer danych w cyklu zegara (osiem bitów). czas latencji (latency) NiŜszy pobór prądu. DIP (dual inline package) – DRAM, najstarsze typy pamięci do komputerów z procesorami 8086, 80286 Większy SIMM (single inline memory module) – FPM, EDO do komp. z procesorami 386 (30 końcówki, 16 bit), 486 (moduły 72 końcówkowe 32 bitowe), Pentium (72 końcówki 32b, stosowane parami) DIMM (dual inline memory module) – komputery z procesorami Pentium II i MMX (moduły 100 końcówkowe, FPM, EDO) i nowsze (moduły 168 końcówek, 64 bitowe, SDRAM, DDR RAM) SO-DIMM (Small Outline DIMM) – do komputerów typu laptop, 72 lub 144 końcówki (32 lub 64 bitowe) Wstęp do informatyki Cezary Bolek <[email protected]> 29 Wstęp do informatyki Wykrywanie typu (presence detection) – w kaŜdym module pamięci znajduje się zapisana informacja o typie pamięci, parametrach, producencie, etc. (zwykle jako mała dodatkowa pamięć) Pamięć RAM charakteryzuje się opóźnieniami generowanymi podczas operacji dostępu (odczyt adresu – kolumny i wiersza, zatrzaskiwanie adresu, transfer danych) Bity parzystości (parity bits) – moduły o podwyŜszonym stopniu niezawodności posiadają dodatkowy bit parzystości dla kaŜdego bajtu, umoŜliwiający wykrywanie błędów pamięci Dla pamięci statycznych SRAM, uŜywanymi w pamięciach Cache L2, czas opóźnienia (latency) jest na poziomie 5-12 ns, co dla zegara 200 MHz magistrali pamięci memory odpowiada 1-2 cykli zegara procesora Korekcja błędów ECC (error check code) – moduły z moŜliwością korekcji błędów, poprzez stosowanie kilku dodatkowych bitów dla kaŜdego bajtu oraz wbudowanego algorytmu korekcji danych – stosowane tylko do komputerów o wymaganej bardzo wysokiej niezawodności. Dla pamięci dynamicznych DRAM (pamięć główna), czas opóźnienia (latency) wynosi 25-60 ns, co dla zegara 200 MHz odpowiada 5-10 cyklom zegara procesora. Wstęp do informatyki Cezary Bolek <[email protected]> 30 Cechy modułów pamięci Czas opóźnienia pamięci RAM (Latency) Cezary Bolek <[email protected]> 31 Wstęp do informatyki Cezary Bolek <[email protected]> 32 8 Pamięć typu Flash Prawo Moore’a Pamięć półprzewodnikowa, której zawartość nie zanika po wyłączeniu zasilania (technologie typu EEPROM) Gordon E. Moore, 1965. "Cramming more components onto integrated circuits," Electronics, v.38, no 8 (19 April), Kompromis pomiędzy pamięcią ROM i RAM, idealny dla urządzeń przenośnych typu Palmtop, DigiCam, etc... Wzrost liczby elementów układów mikroprocesorowych ma charakter wykładniczy Liczba tranzystorów mikroprocesorów podwaja się średnio co 18 miesięcy (1980) Wydajność obliczeniowa mikroprocesorów podwaja się średnio co 18 miesięcy (1990) Wydajność komputerów w odniesieniu do ceny podwaja się średnio co 18 miesięcy (1990) Znacznie wolniejsza od typowych pamięci komputerowych, (w szczególności wolny zapis), nie nadaje się (na razie) na pamięć główną komputera PC Ograniczona liczba cyklów zapisu (setki tysięcy) Zastosowania: pamięci dla BIOS w komputerach PC, pamięci konfiguracyjne kart rozszerzeń komputera PC, układy pamięci zewnętrznej (PenDrive, karty SmartMedia i CompactFlash,...) Wstęp do informatyki Cezary Bolek <[email protected]> 33 ZłoŜoność mikroprocesorów i pamięci Wstęp do informatyki Cezary Bolek <[email protected]> Wstęp do informatyki Cezary Bolek <[email protected]> 34 Koszt wydajności komputerów 35 Wstęp do informatyki Cezary Bolek <[email protected]> 36 9 Koszt pamięci Wstęp do informatyki Cezary Bolek <[email protected]> 37 10