Klastry z polotem dla systemów Open Source

Transkrypt

Klastry z polotem dla systemów Open Source
Klastry z polotem dla systemów
Open Source
Jakub Janakowski
ESSN Presales Consultant
Agenda

Wprowadzenie – portfolio rozwiązao HP w zakresie High
Availability/Disaster Tolerant,

Podstawowe pojęcia związane z budową klastrów HP
Serviceguard- paczka, floating IP address...

Jak działa klaster HP Serviceguard i co dzieje się podczas
przełączania – reformowanie klastra,

Wprowadzenie do rozwiązao Disaster Tolerant,

Kilka słów o rozszerzeniach do HP Serviceguard (ECMT,
SGeRAC, SGeEBS, Data Guard toolkit... )
2
Metryki
RPO i RTO
• Recovery Point Objective (RPO)
–
–
Maksymalna ilośd danych, która może byd utracona w przypadku awarii
Powinna byd bliska zeru
• Recovery Time Objective (RTO)
–
Maksymalny czas potrzebny do przywrócenia systemu do działania
Technologie klastrowe
Wks
Days
Hrs Mins
Zero
Recovery Point
Tape
Backup
Secs
Mins Hrs Days Wks
Recovery Time
Clustering
Snapshot
Incremental
Asynchronous
Replication
Synchronous
Replication
Manual
Migration
Tape Restore
Serviceguard Portfolio
Serviceguard - terminologia
= węzeł/node
= klaster
= paczka
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Serviceguard – terminologia c.d
Heartbeat
Hostname:HostA
IP: 192.169.2.1
Package IP adress/
floating IP
IP: 192.169.5.2
Hostname:HostA
IP: 192.169.2.2
App A
App A
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Quorum Device
Paczka
• HP Serviceguard używa koncepcji paczki na której definicję składają się
następujące elementy:
Serwery
•
– Lista jednego lub więcej węzłów na których aplikacja może zostad uruchomiona
Sieci
•
– Adresy sieciowe, przypisane do paczki, które w przypadku przełączenia zostaną przepisane wraz
z aplikacją
Dane
•
– Grupy wolumenowe (VGs) lub współdzielone zasoby dyskowe takie jak Cluster File Systems (CFS)
do ktorych aplikacja wymaga dostępu
Aplikacje
•
– Skrypty umożliwiające uruchomienie, zatrzymanie i monitorowanie aplikacji
– Serwisy aplikacji, które są monitorowane
Inne zasoby
•
– Zasoby wykorzystywane przez aplikację
• Wyróżniamy następujące typy pakietów:
•
Failover Package
•
Multi-node Packages (MNP)
•
System Multi-node Packages (SMNP) – HP
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Zależności pomiędzy paczkami
Przykład:
• Mechanizm łączenia paczek do potrzeb takich jak
– Gwarantowanie kolejności uruchamiania aplikacji
– Gwarantowanie dostępności zasobu
•
Jeśli zasób staje się niedostępny, zależna paczka zostaje automatycznie
przeniesiona na węzeł na którym zasób jest dostępny
• Typy zależności:
•
DEPENDENCY_NAME Oracle-DB
DEPENDENCY_CONDITION B = UP
DEPENDENCY_LOCATION SAME_NODE
W ramach tego samego węzła
Paczka A wymaga aby na tym samym węźle
uruchomiona była Paczka B
– Paczka A nie może wystartowad przed Paczką B
– Paczka B nie może zostad wyłączona zanim nie zostanie
wyłączona Paczka A
–
•
• Paczka serwera aplikacyjnego (AppServer) wymaga do działania paczki
bazy danych Oracle Database
(Oracle-DB)
• Konfiguracja paczki App-Server:
W ramach różnych wezłów
Package: App-Server
Successor
Package: Oracle-DB
Predecessor
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Depends
on
Live application detach (LAD)
Description
Możliwość zatrzymania węzła lub klastra bez zatrzymywania paczki
• Detached
• Paczka jest odłączona bez przerywania jej pracy kiedy klaster był
wyłaczony wykorzystując opcję –d
• Odłączona paczka nie jest monitorowana przez HP Serviceguard
• Re-attached
• Paczka, która nie jest w trybie detached może byd znowu
monitorowana przez klaster
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Quorum service
Serviceguard używa “tie-breaker’a” lub urządzenia
quorum (a.k.a. a cluster lock mechanizm) aby
zabezpieczyd dane na wypadek wystąpienia
sytuacji tzw. “Split-Brain” klastra
Cluster-wide device file names
Opis
Możliwość dostępu do tego samego urządzenia (dysk lub LUN) ze wszystkich węzłów klastra wykorzystując
do tego tą samą nazwę zasobu co redukuje ryzyko wystąpienia błędu
•
Polecenie cmsetdsfgroup
− Definiuje grupę węzłów
− Tworzy cDSF
/dev/
dsk
rdsk
Legacy DSFs
© Copyright 2010 Hewlett-Packard Development Company, L.P.
disk
rdisk
Persistent DSFs
cdisk
rcdisk
Cluster-wide DSFs
Modele przełączania
Active / Standby
Active / Active
Rotating Standby
Active / Active
aplikacje
rozproszone takie
jak Oracle RAC
• Jeden lub więcej węzłów przeznaczonych jest na potrzeby przełączania
awaryjnego
• Brak utraty wydajności w przypadku przełączania
• Wszystkie węzły pracują na potrzeby różnych aplikacji
• Wprzypadku przełączenia następuje:
Redukcja wydajności
Wyłączenie mniej krytycznych aplikacji
Wykorzystanie mechanizmów VSE do gwarantowania określonych
przydziałów zasobów
• W przypadku awarii system zapasowy staje się nowym systemem
podstawowym natomiast naprawiony system podstawowy staje się
węzłem zapasowym
• Wszystkie węzły pracują na potrzeby tej samej aplikacji
• np, Oracle RAC
• Nie jest wymagane przełączanie aplikacji
• W przypadku awarii użytkownicy przełączani są na pozostałe węzły
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Start paczki
Hostname:HostA
IP: 192.169.2.2
Hostname:HostA
IP: 192.169.2.1
App A
Cluster
Start
Paczka
Aplikacja
PPAS
Interfejsy
sieciowe
Virtual IP
192.196.2.5
Zasoby
dyskowe
App A
Punkty
Montowania
Zarządzanie
Integracja z komponentami Virtual Server
Environment
Virtualne maszyny jako paczki SG
Run
Attention
Fault
Remote
SP Present
Standby Power
Power
Run
Attention
Fault
Remote
SP Present
Standby Power
Power
VM Guest Package
hp Integrity rx8620
cmapp server
hp Integrity rx8620
app1
Serviceguard Cluster
app2
VM Guest
VM guest package failover
hpvmsg_mon
cmappmgr app1
cmappmgr app2
VM Host
VM Host
Primary Node
Standby Node
Serviceguard monitoring of applications running inside VM Guest is provided via
cmappserver communication with each applications and cmappmgr
HP-UX Workload Manager (WLM)
WLM zwiększa poziom utylizacji
zasobów zapewniając aplikacją
utrzymanie wymaganej
wydajności



Najwyższej klasy menadżer
obciążenia dla serwerów opartych
na systemie HP-UX
Automatycznie dopasowuje
konfigurację partycji bazując na
dostępnych zasobach i
priorytetach
Wspiera:
- Partycje zasobów
- Partycje wirtualne i sprzętowe
- Maszyny wirtualne
- Technologię iCAP oraz TiCAP
HP Cappacity Advisor
•
Zbieranie danych (util. providers)
− Standardy WBEM
− Zbieranie danych w zdefiniowanych
godzinach
− Import i export
•
Symulacja komponentów VSE
− Planowanie awaryjnego
przełączania w klastrze,
− Planowanie konsolidacji – VM,
− Planowanie wykorzystania
procesorów TiCAP,
•
Utilization Calculator
− Dodawanie/odejmowanie obciążeń
•
Intuicyjna obsługa
Rozwiązania Disaster Tolerant
HP Serviceguard Solutions in Action
Across Availability Spectrum
Local Serviceguard Cluster
Metrocluster
Redundant networks
carrying cluster
heartbeats
(1 cluster)
app 4 app 3 app 2 app 1
Replication/Mirroring
Synchronous or Asynchronous Replication
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Continentalclusters
Cluster Status
Monitoring
app 4 app 3 app 2 app 1
Extended Distance Cluster
DATA CENTER 1
1 or 2 nodes
DATA CENTER 2
1 or 2 nodes
Data LAN + Heartbeat
Data LAN + Heartbeat
Heartbeat
Heartbeat
Up to 100 km
(DWDM)
SAN
SAN
Each data center must have
the same number of nodes
Cluster Lock
1
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Data replication using Mirrordisk/UX
or VxVM mirroring
Cluster Lock
2
Metrocluster using Quorum Service
3rd Location
(Site 3)
Each main data center (sites 1 and 2)
must have the same number of nodes
Quorum Service
protected in a
separate cluster
Clients
Serviceguard Sub-cluster A
IP Subnet K
Volume Manager: SLVM or CVM
Ethernet
Ethernet
Network
Network
Serviceguard Sub-cluster B
IP Subnet K or L (different subnets supported)
Volume Manager: SLVM or CVM
TCP/IP DWDM Channels
Up to 8node Subcluster
Up to 300 km
w/ DWDM
Up to 8node Subcluster
Data Replication DWDM
Channels
DWDM
DWDM
(Site 1)
DATA CENTER 1
© Copyright 2010 Hewlett-Packard Development Company, L.P.
22
Bi-directional Data replication using
Continuous Access XP or EVA,
or EMC SRDF
(Site 2)
DATA CENTER 2
Continentalclusters
NOTE: each cluster may have different
cluster configurations (# of nodes, etc.)
Cluster 1
Router
Router
Router
Router
Clients
IP Network
(WAN/LAN)
No Distance
Limitation
FC-IP
Converter
Site 1
Up to 16 nodes
FC-IP
Converter
Site 2
Up to 16 nodes
Supported data replication using
Continuous Access XP or EVA, or EMC SRDF
© Copyright 2010 Hewlett-Packard Development Company, L.P.
Cluster 2
HP-UX Disaster RECOVERY Solutions
Extended Distance Cluster
Metrocluster
Continentalclusters
# of Clusters
One cluster
One cluster
Multiple clusters
# of Nodes
Up to 16
Up to 16
Up to 64 nodes total
Distance
100KM – Software Mirroring
300KM – XP, EMC, EVA
Unrestricted
Volume Manager
LVM, SLVM, VxVM, CVM,CFS
LVM, SLVM, VxVM,
CVM,CFS
LVM, SLVM, VxVM,
CVM ,CFS
Data Replication
MirrorDisk UX
VERITAS Mirroring
Continuous Access
SRDF
Continuous Access, SRDF,
Oracle Data Guard
Serviceguard Extension
for RAC Support
Yes
Yes
Yes
Failover Direction
Bi-directional
Bi-directional
Bi-directional
Storage
All supported Serviceguard Fibre
Channel storage
XP, EVA, EMC
XP, EVA, EMC
Servers
OS version
HP Integrity and HP 9000
HP-UX 11i v2, 11i v3
HP Integrity and HP 9000
HP-UX 11i v2, 11i v3
HP Integrity and HP 9000
HP-UX 11i v2, 11i v3
Serviceguard extensions and toolkits
Servicguard for linux i ECMT toolkit for PPAS
ECMT (PPAS toolkit)
ECMT toolkit
HP Serviceguard
Toolkit for Oracle Data Guard®
Always-on database
manageability with zero
custom coding
Integracja aplikacji – c.d.
– Gotowe szablony do uruchomienia popularnych aplikacji w środowisku
wysokodostepnym:
 EnterpriseDB (PPAS)
 Apache Web Server
 Oracle RDBMS
 Tomcat
 Sybase ASE
 IBM DB2
 MySQL
 CIFS (aka SAMBA)
– Wysokodostępny serwer NFS (HA NFS toolkit)
Dziękuję za
uwagę