閱讀389 返回首頁    go 阿裏雲 go 技術社區[雲棲]


《Hadoop與大數據挖掘》一2.4 Hadoop編程開發

本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第2章 ,第2.4節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。

2.4 Hadoop編程開發

Hadoop框架最核心的設計就是HDFS和MapReduce。HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算。本節就MapReduce開發相關內容進行分析,包括HDFS Java API操作、MapReduce原理、MapReduce相關流程組件配置及編程等。最後將給出兩個算法:Kmeans算法、Tf-idf算法的動手實踐,加深對MapReduce編程的認識和理解。

最後更新:2017-06-26 10:02:19

  上一篇:go  activiti 工作流的 整合視頻教程 SSM和獨立部署 web 流程設計器
  下一篇:go  《Hadoop與大數據挖掘》一2.3.5 動手實踐:運行MapReduce任務