Tomasz Sucharzewski EMC forum 2011
Transkrypt
Tomasz Sucharzewski EMC forum 2011
Optymalizacja aplikacji na platformie midrange. Przykład zastosowania technologii FAST, FAST Cache, Virtual Provisioning w macierzach EMC VNX. Tomasz Sucharzewski EMC forum 2011 O czym będzie prezentacja ● Opis środowiska klienta ● Virtual Provisioning w praktyce – ile rzeczywiście aplikacje zapisują danych ● Pule hybrydowe i FAST VP – prezentacja rozkładu potrzeb aplikacji ● Wykorzystanie FAST cache do przyśpieszenia pracy aplikacji 2 Opis środowiska storage klienta ‐ ‐ ‐ ‐ PTK Centertel (operator mobilny Orange) wchodzi w raz z innymi spółkami np.: Wirtualna Polska w skład grupy TP. W TP&PTK aktualnie przetwarzamy około 4 PB danych, ponad 90% to macierze EMC. 5000 portów w sieci SAN. Kilka lokalizacji, FC routing, FCIP, replikacja do ośrodka DR. 3 Kolejny temat Virtual Provisioning 4 Virtual (Thin) Provisioning w praktyce Jak zacząć przygodę ? ● Funkcjonalność dostępna już na macierzach serii Clariion CX4 – wymagany Flare rodziny 30.x ● Uruchomienie VP przez wgranie enablera. ● Virtual Provisioning wymaga dysków zorganizowanych w pule – brak wsparcia dla Raid Group. Dla pracujących konfiguracji skutkuje reorganizacją macierzy. ● Minimalna (realna) jednostka alokacji 1GB, „mapa bitowa” zmian zajmuje co najmniej 2GB – unikać małych lunów. 5 Virtual Provisioning w praktyce Virtual Provisioning w Orange: ‐ pierwsza macierz Clariion CX4 uruchomiona z VP w 2010 roku. ‐ zasilenie danymi przez migracje z innych macierzy Clariion – zyski z technologii space reclaimation (!!!) Dedykowane pule stworzono ze względu: ‐ chęć dopasowania konfiguracji do potrzeb aplikacji (pule hybrydowe) ‐ cykl życia sprzętu i rozbudowy fizyczne ‐ łatwość (?) rekonfiguracji 6 Virtual Provisioning w praktyce Wykorzystanie przestrzeni (suma dla wszystkich puli dyskowych ) CX4 (euklides) - virtual provisioned pools 80000 CONFIGURED – stworzone pule dyskowe PROVISIONED – przestrzeń wystawiona do serwerów CONSUMED – rzeczywiste zużycie przez aplikacje 70000 60000 [GB] 50000 40000 30000 Względnie stała różnica 20000 • 10000 0 2010-11-17 2011-01-17 CONFIGURED 2011-03-17 2011-05-17 PROVISIONED 2011-07-17 2011-09-17 CONSUMED • CX4 - test env. 120000 100000 • [GB] 80000 60000 Ilość ‚zaoszczędzonej’ przestrzeni względnie stała ~20 TB, ale podzielona na kilka pul. W ujęciu globalnym trend alokacji przestrzeni jest trwały i przewidywalny (ważne jeśli chcemy udostępniać > 100% przestrzeni), ale nie ma pewności, że każda aplikacja zachowuje się tak samo Od początku października udostępniamy więcej niż posiadamy (oversubscribing) Względnie stała różnica 40000 20000 0 2011-04-28 2011-05-28 2011-06-28 2011-07-28 2011-08-28 2011-09-28 2011-10-28 CONFIGURED PROVISIONED CONSUMED 7 Virtual Provisioning w praktyce Przykłady wpływu wykorzystania technologii VP dla wybranych aplikacjach w środowisku Orange. SUBSCRIBED [GB] USED [GB] % SAVED [GB] NAKWIN (AIX) 1413 1419 100,4% -6 VENUS (AIX) 609 609 100,0% 0 SAS HSM (AIX) 3538 3482 98,4% 56 Vmware DMZ 5073 2695 53,1% 2378 Vmware PROD 8277 4142 50,0% 4135 Cloud - MGMT 1500 248 16,5% 1252 Cloud - Farm 8500 74 0,9% 8426 8 Virtual Provisioning w praktyce Wnioski po roku eksploatacji macierzy EMC Clariion z uruchomionym VP: Możemy udostępniać aplikacjom ponad 100% posiadanej przestrzeni. O ile więcej? Bezpieczna granica inna dla każdej konfiguracji, wyznaczana na podstawie trendów. Dodatkowe zwiększenie zysków z VP w przypadku użycia klona lub replikacji (kopie ‚thin aware’). Podobne oszczędności obserwujemy na każdej macierz, choć nie na każdej aplikacji. VP dostarcza informacji o rzeczywistych potrzebach aplikacji na przestrzeń. Duża pula zwiększa oszczędności (agregacja wolnej przestrzeni), ale zmniejsza elastyczność. Oversubscribing utrudnia rozliczenia za zużycie i komplikuje budżetowanie – jak zagospodarować oszczędności? Dla niektórych aplikacji np.: przestrzeń na backup rekomendacja dla thick provisioning. Rozbudowa puli w dużym uproszczeniu skutkuje zwiększeniem pojemności, a nie wydajności (nie dotyczy niezaalokowanych przestrzeni w urządzeniach typu ‚thin’, oraz pul hybrydowych). Złośliwa aplikacja może wygenerować niewielką stratę przestrzeni, konieczność przechowywania mapy bloków na dyskach. Istnieje narzut wydajnościowy dla zapisów nowych bloków, pomijalny w większości przypadków 9 Kolejny temat Pule hybrydowe i FAST VP 10 Pule hybrydowe, FAST VP w praktyce • • Pule hybrydowe to możliwości mieszania dysków różnych typów w ramach tej samej puli. FAST VP to technologia umożliwiająca zmianę położenia danych tak, aby dopasować potrzeby aplikacji na wydajność. Tylko jak dobrze dobrać te ilości dysków ? EMC Engineering suggests a 5/20/75 split 5% FLASH, 20% FC, 75% SATA (by usable capacity) W Orange proponujemy inny model, ułatwiający definiowanie potrzeb i wycen dla projektów. Wprowadzamy współczynnik gęstości IO (IO density) definiowany jako: gęstość IO / TB czyli iloraz (GB)/IOPS IO density to model kosztowo wydajnościowy: pozwala na czytelne zobrazowanie projektom, jakiej wydajności (statystycznie) mogą się spodziewać z zakupionej przestrzeni. Domyślną wartością proponowaną projektom jest IO density = 400, co oznacza, że na każdy zakupiony 1 TB aplikacja może skorzystać z potencjału 400 IO/s. 11 Pule hybrydowe, FAST VP – Orange setup Przykład konfiguracji macierzy CX4 ‐ euklides nazwa puli farmafraud VMWare midtier hightier SSD FC [200 GB] [300 GB] 0 25 0 16 0 35 5 40 SATA IO density [2 TB] [IOPS/TB] 10 214 8 188 5 363 5 971 Nie ma jedynie słusznej konfiguracji ! ‐ ‐ znajomość aplikacji pomaga w dobraniu konfiguracji np.: farma fraud (profil IO znany, bo aplikacja napisana wewnętrznie). Virtual provisioning uzupełnia korzyści płynące z korzystania z pul hybrydowych – oszczędność w rzeczywistej zajętości miejsca poprawia efektywność wykorzystania drogich dysków. 12 Pule hybrydowe, FAST VP – Orange setup Dane aplikacji są automatycznie rozkładane na odpowiednie dyski w puli zgodnie z politykami, które ustawiamy dla każdego luna: • • • Highest Available Tier – nowe dane alokowane w możliwie najwyższej warstwie Lowest Available Tier – nowe dane alokowane w możliwie najniższej warstwie Auto‐tier – rozkłada według Algorytmu. Pytanie czy to najlepsze rozwiązanie ? Za cenę idealnego dopasowania nie wykorzystuje potencjału konfiguracji. W Orange zdecydowaliśmy się na politykę HighestAvailableTier. Wykorzystuje ona maksymalnie potencjał konfiguracji, ale przyrost danych wpływa na wydajność aplikacji – coraz więcej danych rywalizuje o najwyższą warstwę. Przy tej polityce wolne miejsce pozostaje przede wszystkich na dyskach SATA. 13 Pule hybrydowe - przykład implementacji 14 Pule hybrydowe, FAST VP - wnioski Wnioski z wykorzystania puli hybrydowych: Macierz automatycznie dopasowuje rozkład danych zgodnie z polityką high/low/auto. Wykorzystując ‚lun migration’ można relokować dane między pulami ‐ dopasować profil IO. Rozbudowa puli hybrydowej o wyższą warstwę zwiększa wydajność puli – dane zostaną rozłożone na nowe dyski. Pule hybrydowe dostarczają informacji o rzeczywistych potrzebach aplikacji na wydajność przy ustawionej polityce na Auto‐tier – teoretycznie (!!!). EMC dysponuje narzędziami umożliwiającymi analizę aktualnego środowiska pod kątem doboru dysków dla pul hybrydowych – TierAdvisor. SSD + SATA – potencjalnie doskonała konfiguracja dla VMware – oszczędność prądu i miejsca. Podobnie jak dla Virtual Provisioningu pule hybrydowe utrudniają rozliczanie aplikacji – w Orange wprowadzono model IO density. Mechanizm przenoszenia danych może ‚nie nadążać’ za złośliwą aplikacją. W ramach puli wszystkie warstwy muszą mieć ten sam poziom RAID (rekomendowany RAID6 dla dysków SATA). Podobno ma się to zmienić ;‐) 15 Kolejny temat FAST cache 16 FAST cache FAST cache to możliwość rozciągnięcia pamięci DRAM na dyski SSD skonfigurowane w RAID1. Macierz klasy middrange może posiadać nawet 2TB pamięci cache na dane. • • • • • • Służy wyłącznie poprawie czasów odpowiedzi do aplikacji dla operacji odczyt/zapis Jak każdy cache wymaga rozgrzania. Jednostka alokacji 64 KB (pule hybrydowe ‐ 1 GB, DRAM – typowo 8KB) Statystyki wykorzystania dostępne w Navisphere Analyzer, dostępne na poziomie puli zasobów, a nie pojedynczego lunu. Uruchomienie FAST może dać doskonałe rezultaty, albo … żadne. Silnie zależny od korzystnego profilu IOPS. Trudny w modelowaniu, ale EMC dostarcza narzędzia (Unified Block Locality Analyze) dla analizy środowiska klienta. 17 FAST cache - przykład Fast cache w Orange wdrożony razem z VP i pulami hybrydowymi i traktowany jako uzupełnienie tych technologii. Uruchamiany przez skonfigurowanie dysków SSD i włączenie per każda pula. Wpływ Fast cache najlepiej badać wyłączając jego działanie na wybranej puli – trudne do realizacji dla produkcyjnych aplikacji. Przykład aplikacji, która efektywnie korzysta z tego mechanizmu – cały odczyt ponad 3500 IO z cache. 18 Podsumowanie Tak naprawdę wszystkie omawiane techniki się uzupełniają i ich komplet najlepszy efekt: • • • • • • W przypadku Orange ‐ oszczędności w $$ Poprawa wydajności aplikacji Możliwość reagowania na zwiększone/zmniejszone potrzeby Informacji o profilu IO aplikacji (często tak samo cenne jak $$) Zmniejszenie poboru mocy (efektywne korzystanie z dysków SATA) Samostrojenie się macierzy – zmniejszenie obciążenia administratorów Dziękuję za uwagę: Email: [email protected] 19