
大數(shù)據(jù)處理技術基于Hadoop培訓
第一講 云計算及大數(shù)據(jù)處理技術介紹
1)云計算的概念
2)云計算發(fā)展現(xiàn)狀
3)大數(shù)據(jù)的概念
4)大數(shù)據(jù)的應用
5)大數(shù)據(jù)關鍵技術
第二講 Google中的關鍵技術
1)GFS文件系統(tǒng)
2)Chubby中的Paxos算法
3)MapReduce技術機制
4)Bigtable表管理技術
第三講 Hadoop文件系統(tǒng)HDFS及其文件結構
1) Hadoop項目簡介
2) HDFS體系結構
3) HDFS關鍵運行機制
4) Hadoop vs Google
5) Hadoop API
第四講 MapReduce編程模型及其應用開發(fā)
1) MapReduce產生背景
2) MapReduce編程模型
3) MapReduce實現(xiàn)機制
4) MapReduce案例分析
第五講 Pig Latin及其使用
1)Pig 設計的
2)Pig Latine介紹
3)Pig關鍵性技術
4)Pig的實用案例
第六講 數(shù)據(jù)倉庫Hive使用
1) Hive設計
2) Hive數(shù)據(jù)模型
3) Hive關鍵性技術
4) Hive的使用案例
第七講 HBase和ZooKeeper使用
1) Hbase運行機制簡介
2) HBase與 HDFS
3) HBase的對外接口
4) ZooKeeper的數(shù)據(jù)模型
5) ZooKeeper的讀寫機制
6) ZooKeeper的使用方法
第八講 數(shù)據(jù)抽取工具Sqoop使用
1)數(shù)據(jù)抽取技術介紹
2)Sqoop中的關鍵技術
3)Sqoop數(shù)據(jù)抽取策略
4)數(shù)據(jù)挖掘及分析
第九講 當前數(shù)據(jù)中心的改造和轉換分析
1)主流商業(yè)大數(shù)據(jù)解決方案比較
2)主流開源云計算系統(tǒng)比較
3)國內代表性大數(shù)據(jù)平臺比較
第十講 各廠商新的大數(shù)據(jù)產品介紹
1)IBM的大數(shù)據(jù)技術
2)HP的大數(shù)據(jù)技術
3)Teradata的大數(shù)據(jù)技術
4)其它廠商的大數(shù)據(jù)處理
第十一講 針對Spark、Storm等實時分析技術介紹
六、培訓
1, 了解大數(shù)據(jù)處理技術的相關知識。
2,學習Hadoop的核心技術方法以及應用特征。
3,深入使用Hadoop相關工具在大數(shù)據(jù)中的使用。
4,掌握傳統(tǒng)數(shù)據(jù)中心向云計算中心轉換的關鍵技術。