《Hadoop與大數據挖掘》一2.4 Hadoop編程開發
本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第2章 ,第2.4節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。
2.4 Hadoop編程開發
Hadoop框架最核心的設計就是HDFS和MapReduce。HDFS為海量的數據提供了存儲,則MapReduce為海量的數據提供了計算。本節就MapReduce開發相關內容進行分析,包括HDFS Java API操作、MapReduce原理、MapReduce相關流程組件配置及編程等。最後將給出兩個算法:Kmeans算法、Tf-idf算法的動手實踐,加深對MapReduce編程的認識和理解。
最後更新:2017-06-26 10:02:19