Hadoop for System Administrators

Transkrypt

Hadoop for System Administrators
Kod szkolenia:
Tytuł szkolenia:
Dni:
H6C60S
Hadoop for System Administrators
3
Opis:
Adresaci szkolenia
Administratorzy systemów odpowiedzialni za zarządzanie klastrami Hadoop
Cel szkolenia
Kurs ten zawiera podstawowe informacje nt wdrażania klastrów Apache™ Hadoop®. W
trakcie szkolenia każdy z uczestników stworzy swój własny klaster Hadoop używając
dystrybucji CDH (Cloudera’s Distribution, wraz z Apache Hadoop) lub Hortonworks Data
Platform. Główne usługi Hadoop zostaną omówione w szczegółach wraz ze sposobami
rozwiązywania problemów oraz przywracania funkcjonalności po awarii klastra. Szkolenie
dostarcza także fundamentalnej wiedzy nt usług takich jak Ambari, Zookeeper, Pig, Hive,
HBase, Sqoop, Flume, oraz Oozie.
Główne korzyści
Po szkoleniu uczestnicy zdobędą wiedzę i umiejętności:
niezbędne do poprawnego wdrażania i zarządzania klastrami Hadoop
Wymagania
Uczestnicy powinni posiadać wiedzę pozwalającą na biegłe i komfortowe posługiwanie się
komendami w systemie Linux, nie jest wymagane wcześniejsze doświadczenie z klastrami
Hadoop
Parametry szkolenia
3*8 godzin (3*7 godzin netto) wykładów i warsztatów.
Wielkość grupy: maks. 8-10 osób.
Program szkolenia:
Moduł 1: "Big Data", the big picture
Centralna architektura Hadoop: HDFS, MapReduce
Dystrybucje Hadoop: Cloudera, MapR, Hortonworks
Ekosystem Hadoop: Ambari, Pig, Hive, Zookeeper, HBase, Sqoop, Flume, Oozie
Moduł 2: HDFS
Projekt i działanie: NameNode oraz Secondary NameNode, Meta-data storage oraz
aktualizacje, Data storage oraz przepływy
Planowanie i tworzenie: Założenia wydajnościowe, ładowanie i zarządzanie plikami
danych, udoskonalanie działania
Moduł 3: MapReduce
Historia i teoria działania
Implementacja Apache Hadoop: Jobtracker, Tasktrackers , DataNodes
Moduł 4: Autentykacja i Autoryzacja
Użytkownicy Hadoop
HDFS: Właściciele plików i uprawnienia
Moduł 5: Kolejkowanie w MapReduce
FIFO
Fair
Moduł 6: Monitorowanie i obsługa klastra
Dodawanie i usuwanie węzłów DataNodes
Monitorowanie i balansowanie w HDFS storage
Statusy Jobtracker i Tasktracker
Moduł 7: Rozwiązywanie problemów
Wolne i długie wykonywanie zadań
Lokalizacja i wykorzystanie plików log
Przywracanie po awarii
Rebalansowanie klastra
Powered by TCPDF (www.tcpdf.org)

Podobne dokumenty