培訓時間、地點:10月25日至10月27日 杭州
Hadoop大型應用開發實戰培訓-課程內容:
第一天:第1個主題:Hadoop MapReduce
第2個主題: Hadoop MapReduce Streaming編程
第3個主題:MapReduce分布式程序
第4個主題:Hadoop 核心代碼剖析
第5個主題:HDFS分布式文件系統編程
第二天:第1個主題:Hadoop Mapreduce高級編程
第2個主題:MapReduce的優化
第3個主題:MapReduce的任務調度
第4個主題:MapReduce編程實戰
第5個主題:flume+hadoop日志收集實戰
第三天:第1個主題:Hadoop的來源和動機
第2個主題:Hadoop安裝和部署準備
第3個主題:Hadoop集群安裝和部署
第4個主題:Hadoop集群配置:機架感知,開啟壓縮和任務均衡
第5個主題:Hadoop 集群維護與管理查看集群狀態
第6個主題:Hadoop 集群規劃和測試集群規劃(硬件,系統,網絡)
Hadoop的優點:
Hadoop是一個能夠對大量數據進行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。Hadoop 是可靠的,因為它假設計算元素和存儲會失敗,因此它維護多個工作數據副本,確保能夠針對失敗的節點重新分布處理。Hadoop 是高效的,因為它以并行的方式工作,通過并行處理加快處理速度。Hadoop 還是可伸縮的,能夠處理 PB 級數據。此外,Hadoop 依賴于社區服務器,因此它的成本比較低,任何人都可以使用。
Hadoop是一個能夠讓用戶輕松架構和使用的分布式計算平臺。用戶可以輕松地在Hadoop上開發和運行處理海量數據的應用程序。