ETL工具之——kettle使用簡介
今天我們打斷一下ELK工具的使用講解過程,來說說ETL工具kettle。首先我們要了解一下什麼是ETL工具:
ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程。ETL一詞較常用在數據倉庫,但其對象並不限於數據倉庫。
把數據從源取出,通過處理後放到標準的數據庫中,你可以初略的這麼去認為,這對於需要大量操作數據表格的人來說是有福了額(集團對賬,片區分銷體係匯總,無數的Excel),你可以在保證在數據格式安全合法的情況下UI試的吧元數據規規矩矩的導入到你的表裏麵,然後在進行相關的操作。ETL工具有很多,相關信息大家可以參考這篇文章:https://blog.csdn.net/hfxl1108/article/details/8564941 。而我今天要說的就是其中一款開源開源工具:kettle 下載地址:https://kettle.pentaho.com/
kettle ,是一款很好用的開源工具。期精準的UI操作非常的省事。我今天要說的是Windows版本,當然Windows版本和LIunx的操作是一樣的。首先我們去下載好kettle,然後解壓至指定目錄。進入目錄運行spoon.bat
你可以選擇新建一個準換,然後在左側的組件界麵選擇組件,拉去到右側的空白麵板上,我們今天一一個Excel數據到數據庫為例子:需要選取三個組件,分別是:獲取文件名、Excel輸入、表輸出
選取完成以後是這個樣子的:
好了,現在開始我們的UI操作,
第一步:雙擊獲取文件名
至此第一步完成
第二步:雙擊Excel輸入
1、編輯文件麵板:
2、編輯工作表麵板:這裏需要注意的是,你要明確你的表頭在在第幾行第幾列(從0開始)不然後麵獲取字段的時候會出現問題。
完成後的麵板:
3、編輯字段麵板:
至此Excel輸入完成。
2、選擇目標表
3、獲取數據字段:
4、映射字段:
打完收工。
第四步:獲取文件名
到這裏就全部完成了,來看看數據是否進入了數據庫:
數據已存在!
好了,你可以進行你操作了,還有很多很多的好用的功能沒有介紹,自己去看看吧,很好玩的。
最後更新:2017-08-13 22:38:03