大數(shù)據分析(Hadoop)與云計算實踐培訓班的通知
講師:錢興會 朱永春 瀏覽次數(shù):2626
課程描述INTRODUCTION
大數(shù)據與云計算培訓
日程安排SCHEDULE
課程大綱Syllabus
大數(shù)據與云計算培訓
一、課程目標
二、培訓師資
錢興會 大數(shù)據專家。在電信、電力、金融行業(yè)從事Java開發(fā)和架構設計的工作;資深云計算研發(fā)工程師。作為項目的主要成員和負責人參與并領導完成了多個大型復雜項目,并成功應用于行業(yè)解決方案,如海量數(shù)據匹配系統(tǒng)、電力行業(yè)實時數(shù)據采集分析系統(tǒng)等。設計并實現(xiàn)了實時索引系統(tǒng)-云搜,成功應用與某國企知識庫系統(tǒng)。并可應用與互聯(lián)網行業(yè)的搜索等應用。完成多個云計算解決方案的架構,涉及到金融韓行業(yè)海量數(shù)據分析與數(shù)據處理系統(tǒng)、海量日志分析系統(tǒng)、電力用電信息統(tǒng)計系統(tǒng)等,獲得業(yè)界認可。朱永春 十余年IT行業(yè)經驗,IBM企業(yè)數(shù)據分析與大數(shù)據專家,數(shù)據中心系統(tǒng)架構設計,性能管理與容量評估專家,主要專業(yè)特長包括基礎架構云平臺設計、服務器及存儲虛擬化、數(shù)據庫優(yōu)化、性能管理、容量評估等領域。具有豐富的教學和實踐經驗,對IT職業(yè)培訓有深刻的理解。曾參與多家大型銀行系統(tǒng)架構設計,在高可用性高性能大容量系統(tǒng)領域的虛擬化和大數(shù)據處理有深入的研究,能夠結合實際,在復雜的應用環(huán)境中選擇適合的分析技術來降低運維風險、縮短停機時間、提高系統(tǒng)及數(shù)據庫性能。多次全國巡講。授課過程理論與實踐并重,深入淺出,講課詼諧幽默、氣氛活躍,深受廣大學員好評。
三、學習對象
軟件工程師、數(shù)據庫開發(fā)人員、網絡后臺開發(fā)人員、運維人員;地方政府云計算物聯(lián)網產業(yè)負責人;各地云計算中心負責人;云計算物聯(lián)網產業(yè)規(guī)劃負責人;云計算產業(yè)投資團隊;云計算應用開發(fā)商;云計算硬件設備提供商;云服務運營服務提供商;高校、科研院所云計算項目負責人。
四、課程大綱
(第一專題:大數(shù)據分析與Hadoop開發(fā))
第一天
第1個主題:Hadoop的來源和動機
1.傳統(tǒng)大規(guī)模系統(tǒng)存在的問題
2.對一種新的解決方案的需求
3.Hadoop應用案例解析
4.Hadoop 版本介紹
5.Hadoop與傳統(tǒng)分布式環(huán)境的區(qū)別
第2個主題:Hadoop安裝和部署準備
1. Hadoop系統(tǒng)模塊組件概述
2. Hadoop試驗集群的部署結構
3. Hadoop 安裝依賴關系
4. Hadoop 生產環(huán)境的部署結構
第3個主題:Hadoop集群安裝和部署
第4個主題:Hadoop組件詳解
1. Hadoop HDFS 基本結構
2. Hadoop HDFS 副本存放策略
3. Hadoop NameNode 詳解
4. Hadoop SecondaryNameNode 詳解
5. Hadoop DataNode 詳解
6. Hadoop JobTracker 詳解
7. API 使用Eclipse進行快速開發(fā)
8. 新MapReduce API
第5個主題:Hadoop 核心代碼剖析
1.Hadoop Mapper 類核心代碼剖析
2.Hadoop Reducer 類核心代碼剖析
第6個主題:HDFS分布式文件系統(tǒng)編程
1.Hadoop HDFS 剖析
2.Hadoop NameNode 剖析
3.Hadoop DataNode 剖析
4.hadoop I/O 操作
5.使用Hadoop HDFS API對HDFS編程
第二天
第1個主題:Hadoop MapReduce
1.Hadoop JobTracker 剖析
2.Hadoop TaskTracker 剖析
3.Hadoop 任務提交流程剖析
第2個主題: Hadoop MapReduce Streaming編程
1.Hadoop Streaming 和 Java MapReduce Api 差異
2.使用 MapReduce 實現(xiàn)數(shù)據庫功能
第3個主題:MapReduce分布式程序
1.MapReduce流程
2.剖析一個MapReduce程序
3.基本MapReduceAPI 概念
4.驅動代碼
第4個主題:Hadoop Mapreduce高級編程
1.ToolRunner介紹
2.使用MRUnit進行測試
3.利用Combiners來減少中間數(shù)據
4.使用Configure和Close方法來進行Map/Reduce設置和關閉
5.編寫Partitioner來優(yōu)化負載平衡
6.直接訪問Hadoop分布式文件系統(tǒng)(HDFS)
7.使用分布式緩存(Distributed Cache)
第5個主題:MapReduce的優(yōu)化
1.map優(yōu)化
2.reduce優(yōu)化
3.小文件優(yōu)化
第6個主題:MapReduce的任務調度
1.Queue調度的使用
2.公平調度的使用
3.能力調度的使用
第7個主題Hadoop 生態(tài)系統(tǒng)介紹
分布式管理組件-Zookeeper
分布式數(shù)據倉庫-Hive
分布式數(shù)據庫-Hbase
數(shù)據導入導出-Sqoop
工作流管理- Ozzie
Hadoop數(shù)據倉庫-Hive
Hive基礎
Hive的作用和原理說明
Hadoop倉庫和傳統(tǒng)數(shù)據倉庫的協(xié)作關系;Hive與傳統(tǒng)數(shù)據庫的對接使用
Hadoop/Hive倉庫數(shù)據數(shù)據流
第三天
Hadoop數(shù)據倉庫-Hive
Hive Cli 的基本用法
HQL基本語法
自行編寫數(shù)據庫與Hadoop相互ETL工具的思路
Hadoop 分布式數(shù)據倉庫-Hbase
Hbase概念與架構
hbase核心知識點
hbase安裝、部署
Hbase配置優(yōu)化綜述
表設計優(yōu)化相關參數(shù)
監(jiān)控工具使用方法及注意事項
常見異常現(xiàn)象級處理方法
(第二專題:大數(shù)據與云計算架構)
日程 授課主題 課程安排
第四天
云計算概述 云的理想
云的挑戰(zhàn)
發(fā)展的趨勢
云是什么
不同工作負載適用不同的云
選擇合適的云平臺
幾個云應用案例
我們身邊的云
云架構 云多層架構視圖
IaaS、PaaS與SaaS的定位與異同
云平臺的發(fā)展現(xiàn)狀
云數(shù)據中心技術架構
IAAS云層的原理與應用 IaaS的基礎:虛擬化
虛擬化相關技術
Power云部署方案介紹
VMWare云部署方案介紹
OpenStack云部署方案介紹
SONAS云存儲方案介紹
應用實例
第五天
PaaS云層的原理與應用 PaaS的架構原理
基于WebSphere的PaaS設計實踐
SaaS云層的原理與應用 SaaS的架構原理
一個公有云SaaS的設計實踐
云計算的性能管理與容量規(guī)劃
什么是性能容量管理
性能容量管理參考案例
壓力測試基本理論
系統(tǒng)性能設計與調優(yōu)
第六天
大數(shù)據云的原理與架構 存儲子系統(tǒng)
傳統(tǒng)文件系統(tǒng)
松耦合網絡文件系統(tǒng)
共享存儲文件系統(tǒng)
基于對象的存儲子系統(tǒng)
大數(shù)據存儲子系統(tǒng)
Google GFS
Facebook Haystack
Amazon Dynamo
Yahoo PNUTS
Google BigTable
云存儲服務
Amazon Simple Storage Service
Google Storage for Developers
六、培訓證書
證書可作為專業(yè)技術人員職業(yè)能力考核的證明,以及專業(yè)技術人員崗位聘用、任職、定級和晉升職務的重要依據。
大數(shù)據與云計算培訓
轉載:http://santuchuan.cn/gkk_detail/153.html