Hadoop for System Administrators
Transkrypt
Hadoop for System Administrators
Kod szkolenia: Tytuł szkolenia: Dni: H6C60S Hadoop for System Administrators 3 Opis: Adresaci szkolenia Administratorzy systemów odpowiedzialni za zarządzanie klastrami Hadoop Cel szkolenia Kurs ten zawiera podstawowe informacje nt wdrażania klastrów Apache™ Hadoop®. W trakcie szkolenia każdy z uczestników stworzy swój własny klaster Hadoop używając dystrybucji CDH (Cloudera’s Distribution, wraz z Apache Hadoop) lub Hortonworks Data Platform. Główne usługi Hadoop zostaną omówione w szczegółach wraz ze sposobami rozwiązywania problemów oraz przywracania funkcjonalności po awarii klastra. Szkolenie dostarcza także fundamentalnej wiedzy nt usług takich jak Ambari, Zookeeper, Pig, Hive, HBase, Sqoop, Flume, oraz Oozie. Główne korzyści Po szkoleniu uczestnicy zdobędą wiedzę i umiejętności: niezbędne do poprawnego wdrażania i zarządzania klastrami Hadoop Wymagania Uczestnicy powinni posiadać wiedzę pozwalającą na biegłe i komfortowe posługiwanie się komendami w systemie Linux, nie jest wymagane wcześniejsze doświadczenie z klastrami Hadoop Parametry szkolenia 3*8 godzin (3*7 godzin netto) wykładów i warsztatów. Wielkość grupy: maks. 8-10 osób. Program szkolenia: Moduł 1: "Big Data", the big picture Centralna architektura Hadoop: HDFS, MapReduce Dystrybucje Hadoop: Cloudera, MapR, Hortonworks Ekosystem Hadoop: Ambari, Pig, Hive, Zookeeper, HBase, Sqoop, Flume, Oozie Moduł 2: HDFS Projekt i działanie: NameNode oraz Secondary NameNode, Meta-data storage oraz aktualizacje, Data storage oraz przepływy Planowanie i tworzenie: Założenia wydajnościowe, ładowanie i zarządzanie plikami danych, udoskonalanie działania Moduł 3: MapReduce Historia i teoria działania Implementacja Apache Hadoop: Jobtracker, Tasktrackers , DataNodes Moduł 4: Autentykacja i Autoryzacja Użytkownicy Hadoop HDFS: Właściciele plików i uprawnienia Moduł 5: Kolejkowanie w MapReduce FIFO Fair Moduł 6: Monitorowanie i obsługa klastra Dodawanie i usuwanie węzłów DataNodes Monitorowanie i balansowanie w HDFS storage Statusy Jobtracker i Tasktracker Moduł 7: Rozwiązywanie problemów Wolne i długie wykonywanie zadań Lokalizacja i wykorzystanie plików log Przywracanie po awarii Rebalansowanie klastra Powered by TCPDF (www.tcpdf.org)