閱讀964 返回首頁    go 小米


DRDS數據導入__開發手冊_分布式關係型數據庫 DRDS-阿裏雲

使用DRDS的一個常見問題是,如何將曆史數據導入到DRDS中,本文檔將指導您快速完成數據導入工作。

首先,根據數據來源的不同可以分為兩種場景:

  • 場景1:數據來自您自建的數據庫

  • 場景2:數據來自RDS

針對兩種場景,有三種具體解決方案:

對於場景1,按照數據量不同,有兩種最佳實踐:

  • 數據總量少於500萬條:推薦使用Navicat、sqldump等工具,參考下文中 1.1 小數據量導入 小節。

  • 數據總量超過500萬條:推薦先將數據導入到RDS,再從RDS中導入到DRDS,參考下文中 1.2 大數據導入 小節。

對於場景2,可以使用DRDS的數據導入功能完成導入,使用方法見下文 2.數據來自RDS 小節。

1. 從自建數據庫導入

1.1 小數據量導入

通常采用單線程導入,其劣勢是導入的速度會比較慢,無法發揮分布式數據庫非常高的係統並行度優勢,但實際使用相當方便。

推薦的方式有兩種:

  1. 使用sqldump導出數據後,用mysql source命令導入到DRDS,參考官方手冊 / 中文教程

  2. 使用Navicat可以從CSV、TXT、XML、DBF 以及更多格式的文件中導入數據,參考 官方手冊 高級工具->導入向導部分。

1.2 大數據導入

對於數據量比較大的場景,導入需要分兩步完成。

  1. 首先將數據導入到RDS,參考數據遷入RDS

  2. 再使用DRDS的數據導入功能完成 RDS->DRDS 的數據遷移,使用方法見 2.從RDS導入 小節。

2. 從RDS導入

DRDS 數據導入功能用於完成 RDS->DRDS 的數據遷移。

數據導入流程分為 建表->配置->遷移->切換 四個步驟

2.1 建表

在導入數據之前,首先需要在DRDS上創建相同結構的表,建表可以使用控製台上的DDL功能完成。

或是通過命令行執行,語法參考DRDS DDL語句,

2.2 配置

數據導入任務的配置入口在DRDS控製台DB詳情頁麵的最上方,如下圖所示:

數據導入配置頁麵

點擊 數據導入 按鈕進入配置頁麵,首先需要填寫源信息和目標信息:

  • 源信息:RDS上數據庫的信息,包括RDS實例ID、數據庫名、編碼、賬號和密碼。

  • 目標信息:DRDS信息,包括創建DRDS數據庫時填寫的賬號、密碼。

數據庫信息配置頁麵

點擊 下一步 後,進入表選擇頁麵,控製台會預先檢查哪些表是允許遷移的,在該頁麵中會顯示檢查結果:

表選擇頁麵

勾選需要遷移的數據表,並點擊 開始導入 提交數據導入任務。

2.3 遷移

數據導入任務提交後,可以在控製台右上角的任務列表中看到導入任務的進度:

數據導入任務進度

2.4 切換

任務執行完成後會顯示 切換取消 按鈕

關於任務完成:導入的數據包含全量(所有曆史數據)和增量(全量遷移期間產生的數據)兩部分,執行順序是導入全量再導入增量。導入任務顯示 成功 時,代表目前DRDS中數據已經和 RDS 實例中數據同步,此時後台數據遷移進程還在運行,以保證維持同步狀態。當點擊 切換 才會停止增量數據的遷移。切換後,數據導入完成。

數據導入任務完成

點擊 切換 按鈕後,數據導入完成。

3. 注意事項

  1. 導入前需要先在DRDS上創建好需要寫入數據的表。

  2. 大數據量時保證源RDS有充足的空間(數據+binlog),避免出現因為空間不足導致binlog被刪除,進而導致增量遷移失敗問題。

  3. 若源RDS同時掛載在DRDS下,大數據量時保證 RDS 有充足的空間(2份數據+binlog),避免出現導入問題。

最後更新:2016-11-23 17:31:29

  上一篇:go DRDS慢SQL明細__開發手冊_分布式關係型數據庫 DRDS-阿裏雲
  下一篇:go 全局唯一數字序列使用__開發手冊_分布式關係型數據庫 DRDS-阿裏雲