《Hadoop與大數據挖掘》一2.3.5 動手實踐:運行MapReduce任務
本節書摘來華章計算機《Hadoop與大數據挖掘》一書中的第2章 ,第2.3.5節,張良均 樊 哲 位文超 劉名軍 許國傑 周 龍 焦正升 著 更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。
2.3.5 動手實踐:運行MapReduce任務
實驗步驟如下:
1)上傳/root/anaconda-ks.cfg文件到HDFS文件係統/user/root目錄;
2)使用yarn jar的方式提交任務,其中,
- jar文件:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.6.0.jar
- 主類為:wordcount
- 輸入參數:/user/root/anaconda-ks.cfg
- 輸出參數:/user/root/wc_00 3)查看輸出運行結果; 4)使用mapred job命令查看任務狀態及對應日誌輸出; 5)再次執行任務,查看輸出信息; 6)產生一個大數據文件,上傳到HDFS,使用該大數據文件執行單詞計數MapReduce任務,在執行到一半後,使用mapred job的kill命令,殺死該任務,查看相關輸出信息。 思考: 1)執行第5步的時候會報錯嗎?報什麼錯?怎麼解決? 2)可以在Hadoop IDE中直接提交Job嗎?如果可以怎麼做?如果不可以,為什麼?
最後更新:2017-06-26 10:02:19
上一篇:
《Hadoop與大數據挖掘》一2.4 Hadoop編程開發
下一篇:
《Hadoop與大數據挖掘》一2.3.3 MapReduce常用命令mapred job
在Linux係統中存儲設備的兩種表示方法
nagios報錯:.stdio.h4561 error 'gets' undeclared here (not in a function)
《Docker容器:利用Kubernetes、Flannel、Cockpit和Atomic構建和部署》——1.4 小結
麥科文大學
zabbix3.2監控Windows網卡流量
tomca的用戶設置
Substring的用法
Action Bar示例代碼 (一)
“互聯網+智慧景區”已不僅僅隻是趨勢了...
用戶 'sa' 登錄失敗。原因: 該帳戶被禁用。 (Microsoft SQL Server,錯誤: 18470)