351
iPhone_iPad_Mac_手機_平板_蘋果apple
E-MapReduce SDK 發布說明__開發人員指南_E-MapReduce-阿裏雲
說明
emr-core 包:實現 Hadoop/Spark 與 OSS 數據源的交互,默認已經存在集群的運行環境中,用戶作業打包時 不需要 將 emr-core 打進去,或者要和集群中的 emr-core 版本保持一致。
emr-sdk_2.10 包:實現 Spark 與阿裏雲其他數據源的交互,例如 Log Service、MNS、ONS 和 ODPS 等等。用戶作業打包時 必須 將 emr-sdk_2.10 打包進去,否則會出現相關類找不到的錯。
<dependency>
<groupId>com.aliyun.emr</groupId>
<artifactId>emr-core</artifactId>
<version>1.1.3.1</version>
</dependency>
<dependency>
<groupId>com.aliyun.emr</groupId>
<artifactId>emr-sdk_2.10</artifactId>
<version>1.1.3.1</version>
</dependency>
v1.1.3.1
SDK
解決 MNS 與 Spark/Hadoop 包的依賴衝突問題。
解決 Spark Streaming + MNS 某些場景下拋空指針問題。
解決 Python SDK 的部分 BUG。
Spark Streaming + Loghub 支持自定義時間位置的功能。
Core
解決 Hadoop 無法支持原生 Snappy 文件問題。目前 E-MapReduce 支持處理 Log Service 以 Snappy 格式歸檔到 OSS 的文件。
解決 Spark 無法支持 Snappy 壓縮文件的問題。
解決 OSS 不支持 Hadoop 2.7.2 OutputCommitter 兩種算法的問題。
改善 Hadoop/Spark 讀寫 OSS 的性能。
解決 Spark 作業打印的 Log4j 異常輸出的問題。
v1.1.2
解決作業慢讀寫 OSS 出現的“ConnectionClosedException”問題。
解決OSS數據源時部分 Hadoop 命令不可用問題。
解決“java.text.ParseException: Unparseable date”問題。
優化 emr-core 支持本地調試運行。
兼容老版本的產生的“_$folder$”文件,解釋成目錄,不再當作普通文件處理。
Hadoop/Spark 讀寫 OSS 增加失敗重試機製。
v1.1.1
解決本地寫 OSS 臨時文件時導致多磁盤使用不均衡的問題。
去除作業執行過程中創建 OSS 目錄時同時創建的 $_folder$ 標記文件。
v1.1.0
升級 LogHub SDK 到 0.6.2,廢棄 Client DB 模式,使用 Server DB 模式。
升級 OSS SDK 到 2.2.0,修複 OSS SDK BUG 導致的運行異常。
新增對 MNS 的支持。
兼容性
- 對於 1.0.x 係列 SDK
- 接口:
- 兼容
- 命名空間:
- 不兼容:調整包結構,將包名稱 com.aliyun 更換為 com.aliyun.emr。
- 接口:
- 對於 1.0.x 係列 SDK
修改項目的 groupId,從 com.aliyun 改為 com.aliyun.emr。修改後的 POM 依賴為:
<dependency>
<groupId>com.aliyun.emr</groupId>
<artifactId>emr-sdk_2.10</artifactId>
<version>1.1.3.1</version>
</dependency>
v1.0.5
優化 LoghubUtils 接口,優化參數輸入。
優化 LogStore 數據的輸出格式,增加“topic” 和“source”兩個字段。
增加 LogStore 數據拉取的時間間隔參數配置。參數“spark.logservice.fetch.interval.millis”,默認值 200 毫秒。
更新依賴 ODPS SDK 版本到 0.20.7-public。
v1.0.4
將 guava 的依賴版本降為 11.0.2,避免和 Hadoop 中的 guava 版本衝突。
計算任務支持數據超過 5GB 的文件大小。
v1.0.3
- 增加 OSS Client 相關的配置參數。
v1.0.2
- 修複 OSS URI 解析出錯的 BUG。
v1.0.1
優化 OSS URI 設置。
增加對 ONS 的支持。
增加 Log Service 的支持。
支持 OSS 的追加寫特性。
支持以 multi part 方式上傳 OSS 數據。
- 支持以 upload part copy 方式拷貝 OSS 數據。
Java Doc
本 Do c中介紹了在 Spark 環境中使用 SDK 來讀寫阿裏雲 OSS、ODPS、Log Service 以及 ONS 產品中的數據。請點擊下載最新版 doc 文檔。
最後更新:2016-11-23 16:04:18
上一篇:
HBase備份__開發人員指南_E-MapReduce-阿裏雲
下一篇:
API一覽__API參考_E-MapReduce-阿裏雲
ColumnCondition__DataType_API 參考_表格存儲-阿裏雲
聯係我們__聯係方式_業務實時監控服務 ARMS-阿裏雲
錯誤碼說明__調用方式_API參考手冊_開放搜索-阿裏雲
阿裏雲若勝訴我們就欠快播一個會員,阿裏雲敗訴判賠26萬
簽名密鑰綁定API__後端簽名密鑰相關接口_API_API 網關-阿裏雲
技術幹貨:阿裏雲構建千萬級架構演變之路
阿裏雲推出新一代企業級ECS 讓天下沒有難做的生意
修改連接串__實例管理_API 參考_雲數據庫 RDS 版-阿裏雲
轉換證書格式__證書管理_用戶指南_負載均衡-阿裏雲
離線排查、防火牆ACL配置__Agent_服務器安全(安騎士)-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲