Klastry z polotem dla systemów Open Source
Transkrypt
Klastry z polotem dla systemów Open Source
Klastry z polotem dla systemów Open Source Jakub Janakowski ESSN Presales Consultant Agenda Wprowadzenie – portfolio rozwiązao HP w zakresie High Availability/Disaster Tolerant, Podstawowe pojęcia związane z budową klastrów HP Serviceguard- paczka, floating IP address... Jak działa klaster HP Serviceguard i co dzieje się podczas przełączania – reformowanie klastra, Wprowadzenie do rozwiązao Disaster Tolerant, Kilka słów o rozszerzeniach do HP Serviceguard (ECMT, SGeRAC, SGeEBS, Data Guard toolkit... ) 2 Metryki RPO i RTO • Recovery Point Objective (RPO) – – Maksymalna ilośd danych, która może byd utracona w przypadku awarii Powinna byd bliska zeru • Recovery Time Objective (RTO) – Maksymalny czas potrzebny do przywrócenia systemu do działania Technologie klastrowe Wks Days Hrs Mins Zero Recovery Point Tape Backup Secs Mins Hrs Days Wks Recovery Time Clustering Snapshot Incremental Asynchronous Replication Synchronous Replication Manual Migration Tape Restore Serviceguard Portfolio Serviceguard - terminologia = węzeł/node = klaster = paczka © Copyright 2010 Hewlett-Packard Development Company, L.P. Serviceguard – terminologia c.d Heartbeat Hostname:HostA IP: 192.169.2.1 Package IP adress/ floating IP IP: 192.169.5.2 Hostname:HostA IP: 192.169.2.2 App A App A © Copyright 2010 Hewlett-Packard Development Company, L.P. Quorum Device Paczka • HP Serviceguard używa koncepcji paczki na której definicję składają się następujące elementy: Serwery • – Lista jednego lub więcej węzłów na których aplikacja może zostad uruchomiona Sieci • – Adresy sieciowe, przypisane do paczki, które w przypadku przełączenia zostaną przepisane wraz z aplikacją Dane • – Grupy wolumenowe (VGs) lub współdzielone zasoby dyskowe takie jak Cluster File Systems (CFS) do ktorych aplikacja wymaga dostępu Aplikacje • – Skrypty umożliwiające uruchomienie, zatrzymanie i monitorowanie aplikacji – Serwisy aplikacji, które są monitorowane Inne zasoby • – Zasoby wykorzystywane przez aplikację • Wyróżniamy następujące typy pakietów: • Failover Package • Multi-node Packages (MNP) • System Multi-node Packages (SMNP) – HP © Copyright 2010 Hewlett-Packard Development Company, L.P. Zależności pomiędzy paczkami Przykład: • Mechanizm łączenia paczek do potrzeb takich jak – Gwarantowanie kolejności uruchamiania aplikacji – Gwarantowanie dostępności zasobu • Jeśli zasób staje się niedostępny, zależna paczka zostaje automatycznie przeniesiona na węzeł na którym zasób jest dostępny • Typy zależności: • DEPENDENCY_NAME Oracle-DB DEPENDENCY_CONDITION B = UP DEPENDENCY_LOCATION SAME_NODE W ramach tego samego węzła Paczka A wymaga aby na tym samym węźle uruchomiona była Paczka B – Paczka A nie może wystartowad przed Paczką B – Paczka B nie może zostad wyłączona zanim nie zostanie wyłączona Paczka A – • • Paczka serwera aplikacyjnego (AppServer) wymaga do działania paczki bazy danych Oracle Database (Oracle-DB) • Konfiguracja paczki App-Server: W ramach różnych wezłów Package: App-Server Successor Package: Oracle-DB Predecessor © Copyright 2010 Hewlett-Packard Development Company, L.P. Depends on Live application detach (LAD) Description Możliwość zatrzymania węzła lub klastra bez zatrzymywania paczki • Detached • Paczka jest odłączona bez przerywania jej pracy kiedy klaster był wyłaczony wykorzystując opcję –d • Odłączona paczka nie jest monitorowana przez HP Serviceguard • Re-attached • Paczka, która nie jest w trybie detached może byd znowu monitorowana przez klaster © Copyright 2010 Hewlett-Packard Development Company, L.P. Quorum service Serviceguard używa “tie-breaker’a” lub urządzenia quorum (a.k.a. a cluster lock mechanizm) aby zabezpieczyd dane na wypadek wystąpienia sytuacji tzw. “Split-Brain” klastra Cluster-wide device file names Opis Możliwość dostępu do tego samego urządzenia (dysk lub LUN) ze wszystkich węzłów klastra wykorzystując do tego tą samą nazwę zasobu co redukuje ryzyko wystąpienia błędu • Polecenie cmsetdsfgroup − Definiuje grupę węzłów − Tworzy cDSF /dev/ dsk rdsk Legacy DSFs © Copyright 2010 Hewlett-Packard Development Company, L.P. disk rdisk Persistent DSFs cdisk rcdisk Cluster-wide DSFs Modele przełączania Active / Standby Active / Active Rotating Standby Active / Active aplikacje rozproszone takie jak Oracle RAC • Jeden lub więcej węzłów przeznaczonych jest na potrzeby przełączania awaryjnego • Brak utraty wydajności w przypadku przełączania • Wszystkie węzły pracują na potrzeby różnych aplikacji • Wprzypadku przełączenia następuje: Redukcja wydajności Wyłączenie mniej krytycznych aplikacji Wykorzystanie mechanizmów VSE do gwarantowania określonych przydziałów zasobów • W przypadku awarii system zapasowy staje się nowym systemem podstawowym natomiast naprawiony system podstawowy staje się węzłem zapasowym • Wszystkie węzły pracują na potrzeby tej samej aplikacji • np, Oracle RAC • Nie jest wymagane przełączanie aplikacji • W przypadku awarii użytkownicy przełączani są na pozostałe węzły © Copyright 2010 Hewlett-Packard Development Company, L.P. Start paczki Hostname:HostA IP: 192.169.2.2 Hostname:HostA IP: 192.169.2.1 App A Cluster Start Paczka Aplikacja PPAS Interfejsy sieciowe Virtual IP 192.196.2.5 Zasoby dyskowe App A Punkty Montowania Zarządzanie Integracja z komponentami Virtual Server Environment Virtualne maszyny jako paczki SG Run Attention Fault Remote SP Present Standby Power Power Run Attention Fault Remote SP Present Standby Power Power VM Guest Package hp Integrity rx8620 cmapp server hp Integrity rx8620 app1 Serviceguard Cluster app2 VM Guest VM guest package failover hpvmsg_mon cmappmgr app1 cmappmgr app2 VM Host VM Host Primary Node Standby Node Serviceguard monitoring of applications running inside VM Guest is provided via cmappserver communication with each applications and cmappmgr HP-UX Workload Manager (WLM) WLM zwiększa poziom utylizacji zasobów zapewniając aplikacją utrzymanie wymaganej wydajności Najwyższej klasy menadżer obciążenia dla serwerów opartych na systemie HP-UX Automatycznie dopasowuje konfigurację partycji bazując na dostępnych zasobach i priorytetach Wspiera: - Partycje zasobów - Partycje wirtualne i sprzętowe - Maszyny wirtualne - Technologię iCAP oraz TiCAP HP Cappacity Advisor • Zbieranie danych (util. providers) − Standardy WBEM − Zbieranie danych w zdefiniowanych godzinach − Import i export • Symulacja komponentów VSE − Planowanie awaryjnego przełączania w klastrze, − Planowanie konsolidacji – VM, − Planowanie wykorzystania procesorów TiCAP, • Utilization Calculator − Dodawanie/odejmowanie obciążeń • Intuicyjna obsługa Rozwiązania Disaster Tolerant HP Serviceguard Solutions in Action Across Availability Spectrum Local Serviceguard Cluster Metrocluster Redundant networks carrying cluster heartbeats (1 cluster) app 4 app 3 app 2 app 1 Replication/Mirroring Synchronous or Asynchronous Replication © Copyright 2010 Hewlett-Packard Development Company, L.P. Continentalclusters Cluster Status Monitoring app 4 app 3 app 2 app 1 Extended Distance Cluster DATA CENTER 1 1 or 2 nodes DATA CENTER 2 1 or 2 nodes Data LAN + Heartbeat Data LAN + Heartbeat Heartbeat Heartbeat Up to 100 km (DWDM) SAN SAN Each data center must have the same number of nodes Cluster Lock 1 © Copyright 2010 Hewlett-Packard Development Company, L.P. Data replication using Mirrordisk/UX or VxVM mirroring Cluster Lock 2 Metrocluster using Quorum Service 3rd Location (Site 3) Each main data center (sites 1 and 2) must have the same number of nodes Quorum Service protected in a separate cluster Clients Serviceguard Sub-cluster A IP Subnet K Volume Manager: SLVM or CVM Ethernet Ethernet Network Network Serviceguard Sub-cluster B IP Subnet K or L (different subnets supported) Volume Manager: SLVM or CVM TCP/IP DWDM Channels Up to 8node Subcluster Up to 300 km w/ DWDM Up to 8node Subcluster Data Replication DWDM Channels DWDM DWDM (Site 1) DATA CENTER 1 © Copyright 2010 Hewlett-Packard Development Company, L.P. 22 Bi-directional Data replication using Continuous Access XP or EVA, or EMC SRDF (Site 2) DATA CENTER 2 Continentalclusters NOTE: each cluster may have different cluster configurations (# of nodes, etc.) Cluster 1 Router Router Router Router Clients IP Network (WAN/LAN) No Distance Limitation FC-IP Converter Site 1 Up to 16 nodes FC-IP Converter Site 2 Up to 16 nodes Supported data replication using Continuous Access XP or EVA, or EMC SRDF © Copyright 2010 Hewlett-Packard Development Company, L.P. Cluster 2 HP-UX Disaster RECOVERY Solutions Extended Distance Cluster Metrocluster Continentalclusters # of Clusters One cluster One cluster Multiple clusters # of Nodes Up to 16 Up to 16 Up to 64 nodes total Distance 100KM – Software Mirroring 300KM – XP, EMC, EVA Unrestricted Volume Manager LVM, SLVM, VxVM, CVM,CFS LVM, SLVM, VxVM, CVM,CFS LVM, SLVM, VxVM, CVM ,CFS Data Replication MirrorDisk UX VERITAS Mirroring Continuous Access SRDF Continuous Access, SRDF, Oracle Data Guard Serviceguard Extension for RAC Support Yes Yes Yes Failover Direction Bi-directional Bi-directional Bi-directional Storage All supported Serviceguard Fibre Channel storage XP, EVA, EMC XP, EVA, EMC Servers OS version HP Integrity and HP 9000 HP-UX 11i v2, 11i v3 HP Integrity and HP 9000 HP-UX 11i v2, 11i v3 HP Integrity and HP 9000 HP-UX 11i v2, 11i v3 Serviceguard extensions and toolkits Servicguard for linux i ECMT toolkit for PPAS ECMT (PPAS toolkit) ECMT toolkit HP Serviceguard Toolkit for Oracle Data Guard® Always-on database manageability with zero custom coding Integracja aplikacji – c.d. – Gotowe szablony do uruchomienia popularnych aplikacji w środowisku wysokodostepnym: EnterpriseDB (PPAS) Apache Web Server Oracle RDBMS Tomcat Sybase ASE IBM DB2 MySQL CIFS (aka SAMBA) – Wysokodostępny serwer NFS (HA NFS toolkit) Dziękuję za uwagę