閱讀832 返回首頁    go 阿裏雲 go 技術社區[雲棲]


ETL工具之——kettle使用簡介

今天我們打斷一下ELK工具的使用講解過程,來說說ETL工具kettle。首先我們要了解一下什麼是ETL工具:
ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫。

把數據從源取出,通過處理後放到標準的數據庫中,你可以初略的這麼去認為,這對於需要大量操作數據表格的人來說是有福了額(集團對賬,片區分銷體係匯總,無數的Excel),你可以在保證在數據格式安全合法的情況下UI試的吧元數據規規矩矩的導入到你的表裏麵,然後在進行相關的操作。ETL工具有很多,相關信息大家可以參考這篇文章:https://blog.csdn.net/hfxl1108/article/details/8564941 。而我今天要說的就是其中一款開源開源工具:kettle 下載地址:https://kettle.pentaho.com/
kettle ,是一款很好用的開源工具。期精準的UI操作非常的省事。我今天要說的是Windows版本,當然Windows版本和LIunx的操作是一樣的。首先我們去下載好kettle,然後解壓至指定目錄。進入目錄運行spoon.bat
image

出現UI界麵:
image

最終界麵:
image

你可以選擇新建一個準換,然後在左側的組件界麵選擇組件,拉去到右側的空白麵板上,我們今天一一個Excel數據到數據庫為例子:需要選取三個組件,分別是:獲取文件名、Excel輸入、表輸出
選取完成以後是這個樣子的:
image

我們需要按照先後順序對其進行連接:按住shift然後連接:
image

好了,現在開始我們的UI操作,
第一步:雙擊獲取文件名

image

完成以後的設置應該是這個樣子的:
image

至此第一步完成

第二步:雙擊Excel輸入
1、編輯文件麵板:

image

完成後的文件麵板:
image

2、編輯工作表麵板:這裏需要注意的是,你要明確你的表頭在在第幾行第幾列(從0開始)不然後麵獲取字段的時候會出現問題。
image
完成後的麵板:
image
3、編輯字段麵板:
image
至此Excel輸入完成。

第三步:雙擊表輸出
1、新建一個數據庫練級:
image

2、選擇目標表
image
3、獲取數據字段:
image
4、映射字段:
image
打完收工。

第四步:獲取文件名

image

第五步:運行
image
image
image

到這裏就全部完成了,來看看數據是否進入了數據庫:
image
數據已存在!

好了,你可以進行你操作了,還有很多很多的好用的功能沒有介紹,自己去看看吧,很好玩的。

最後更新:2017-08-13 22:38:03

  上一篇:go  CCAI2017|智能金融論壇:聽大佬們講人工智能在金融領域的那些事兒
  下一篇:go  企業財務分析的方法