課程介紹
本課程涵蓋FusionInsight HD解決方案架構、設計、部署和維護,大數據常用組件技術原理、設計、部署、管理與維護(包括HDFS、MapReduce、Yarn、Saprk2x、Hbase、Hive、Streaming、Loader、Flume、Kafka、Zookeeper等)。
學員報讀條件
大數據運維與開發(fā)人員,應用開發(fā)高級人員,企業(yè)IT系統(tǒng)架構師,企業(yè)CTO
標題圖標課程目標
系統(tǒng)理解大數據架構、技術原理
掌握華為大數據FusionInsight HD方案
具備大數據平臺的規(guī)劃設計、部署和運維能力
熟悉HDFS、MapReduce、Yarn、Spark
熟悉HBase、Hive、Loader、Flume
熟悉Kafka、Streaming
熟悉ZooKeeper
課程大綱:
模塊名稱 |
課程內容 |
大數據行業(yè)與技術趨勢 |
1.?大數據時代 2.?大數據的應用領域 3.?大數據時代的機遇和挑戰(zhàn) 4.?華為大數據解決方案 |
HDFS分布式文件系統(tǒng) |
1.?HDFS概述及應用場景 2.?HDFS在FusionInsight產品中的位置 3.?HDFS系統(tǒng)架構 4.?關鍵特性介紹 |
MapReduce分布式離線批處理和Yarn資源協(xié)調 |
1.?MapReduce與YARN基本介紹 2.?MapReduce與ARN功能與架構 3.?YARN的資源管理和任務調度 4.?增強特性 |
Spark基于內存的分布式計算框架 |
1.?Spark概述 2.?Spark原理與架構 3.?Spark在FusionInsight中的集成情況 |
HBase分布式NoSQL數據庫 |
1.?Hbase基本介紹 2.?Hbase功能與架構 3.?Hbase關鍵流程 4.?Hbase華為增強特性 |
Hive分布式數據倉庫 |
1.?Hive概述 2.?Hive功能與架構 3.?Hive基本操作 |
Streaming分布式流計算引擎 |
1.?Streaming簡介 2.?系統(tǒng)架構 3.?關鍵特性介紹 4.?StreamSQL介紹 |
Flink流計算處理和批處理平臺 |
Flink概述 Flink原理與技術架構 Flink在FusionInsight HD中的集成情況 |
Loader數據轉換 |
1.?Loader簡介 2.?Loader作業(yè)管理 |
Flume海量日志聚合 |
1.?Flume簡介及架構 2.?Flume關鍵特性介紹 3.?Flume應用舉例 |
Kafka分布式消息訂閱系統(tǒng) |
1.?Kafka簡介 2.?Kafka架構與功能 3.?Kafka關鍵流程 |
ZooKeeper集群分布式協(xié)調服務 |
1.?Zookeeper簡介 2.?Zookeeper在產品中的位置 3.?系統(tǒng)架構 4.?關鍵特性介紹 5.?與組件的關系 |
FusionInsight HD解決方案介紹 |
1.?FusionInsight概述 2.?FusionInsight特性介紹 3.?FusionInsight HD成功案例 |