90
人物
編寫MapReduce__快速開始_大數據計算服務-阿裏雲
本文章節的目的是介紹在安裝好 MaxCompute 客戶端後,如何快速運行MapReduce WordCount示例程序。使用Maven的用戶可以從Maven庫中搜索”odps-sdk-mapred”獲取不同版本的Java SDK,相關配置信息:
<dependency>
<groupId>com.aliyun.odps</groupId>
<artifactId>odps-sdk-mapred</artifactId>
<version>0.20.7</version>
</dependency>
備注:
- 編譯、運行MapReduce需要安裝JDK1.6版本;
- MaxCompute 客戶端的快速部署請參閱 快速開始 。更多關於 MaxCompute 客戶端的使用,請參考 ODPS客戶端參考手冊 ;
- 如果外部用戶需要使用MapReduce功能,需要在工單係統上提交申請,提供項目空間名稱,簡單描述使用場景。隻有申請通過,開通好權限後才可以使用。
1.創建輸入輸出表,創建表的語句請參閱 創建表(CREATE TABLE) :
CREATE TABLE wc_in (key STRING, value STRING);
CREATE TABLE wc_out (key STRING, cnt BIGINT);
-- 創建輸入、輸出表
2.上傳數據
- 使用tunnel命令上傳數據:
tunnel upload kv.txt wc_in
-- 上傳示例數據
kv.txt文件中的數據如下:
238,val_238
186,val_86
186,val_86
您也可以用sql語句直接插入數據,比如:
insert into table wc_in select '238',' val_238' from (select count(*) from wc_in) a;
3.編寫MapReduce程序並編譯
MaxCompute 為用戶提供了便捷的Eclipse開發插件,方便用戶快速開發MapReduce程序,並提供了本地調試MapReduce的功能。
用戶需要先在Eclipse中創建一個項目工程,而後在此工程中編寫MapReduce程序。本地調試通過後,將編譯好的程序(jar包)導出並上傳至ODPS。詳細介紹請參考 MapReduce開發插件介紹。
4.添加jar包到project資源(比如這裏的jar包名為word-count-1.0.jar):
add jar word-count-1.0.jar;
5.在ODPS客戶端運行jar命令:
jar -resources word-count-1.0.jar -classpath /home/resources/word-count-1.0.jar com.taobao.jingfan.WordCount wc_in wc_out;
6.在ODPS客戶端查看結果:
select * from wc_out;
備注:如果在java程序中使用了任何資源,請務必將此資源加入-resources參數。jar命令的詳細介紹請參考Jar命令介紹。
最後更新:2016-12-14 10:42:19
上一篇:
編寫UDF__快速開始_大數據計算服務-阿裏雲
下一篇:
編寫Graph__快速開始_大數據計算服務-阿裏雲
AutoSnapshotPolicyType__數據類型_API 參考_雲服務器 ECS-阿裏雲
負載均衡性能指標__負載均衡性能常見問題_常見問題_負載均衡-阿裏雲
雲服務器 ECS包月ECS帶寬按流量計費FAQ
數據庫緊急救援__工作說明書_尊享服務_支持計劃-阿裏雲
步驟1:選配證書__快速入門_證書服務-阿裏雲
默認規則事件通知__事件通知使用幫助_控製台使用幫助_消息服務-阿裏雲
SetListenerAccessControlStatus__Listener相關API_API 參考_負載均衡-阿裏雲
API 概述__API參考_容器服務-阿裏雲
性能測試流程指南__性能測試流程體係_性能測試體係_性能測試-阿裏雲
步驟 4:購買域名__搭建 WordPress 網站_建站教程_雲服務器 ECS-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲