閱讀375 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《Hadoop與大數據挖掘》一2.7 本章小結

本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第2章 ,第2.7節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。

2.7 本章小結

本章首先介紹了Hadoop的基本概念、原理以及Hadoop生態係統各個框架。接著,介紹了Hadoop的安裝配置以及開發環境IDE配置。在此基礎上介紹了Hadoop常用的集群命令、Hadoop MapReduce編程開發原理,針對MapReduce編程開發,詳細介紹了Map-Reduce原理、單詞計數源碼分析,結合源碼分析了MapReduce原理。在本章的最後兩個小節,分別介紹了數據挖掘中的經典算法:K-Means算法、TF-IDF算法,並針對其Hadoop MapReduce實現進行了詳細分析。同時,本章中包含大量動手實踐章節,這些動手實踐章節要求讀者自行完成(部分有示例代碼參考),通過這些動手實踐環節,可以加深讀者對Hadoop、Hadoop HDFS、Hadoop MapReduce的理解,同時對如何針對經典算法或者單機算法使用Hadoop MapReduce模式來實現肯定會有自己的心得體會。
相信通過本章的學習,讀者不僅可以對Hadoop、Hadoop MapReduce的原理有更深入的了解,而且對開發Hadoop MapReduce程序也可以說初窺門徑了。

最後更新:2017-06-26 11:02:00

  上一篇:go  Blender 2.78 發布,三維繪圖及渲染軟件
  下一篇:go  keytool 錯誤: java.io.IOException: Keystore was tampered with, or password was incorrect