《ELK Stack權威指南》第1章　入門示例

本節書摘來自華章出版社《ELK Stack權威指南》一書中的第1章，第1節，作者饒琛琳，更多章節內容可以訪問雲棲社區“華章計算機”公眾號查看。

入門示例

什麼是Logstash？為什麼要用Logstash？怎麼用Logstash？這是本章將要介紹的內容。本章從最基礎的知識著手，從以下幾步介紹Logstash的必備知識。1）下載安裝。介紹Logstash軟件的多種安裝部署方式，並給出推薦的方式。2）初次運行。通過Hello World示例，演示Logstash最簡單的運用，解釋其邏輯上的基礎原理。3）配置語法。介紹Logstash的DSL設計，Logstash命令的運行參數。4）插件安裝。靈活和豐富的插件是Logstash最重要的優勢。本節會介紹Logstash插件的安裝方式。5）長期運行方式。從初次終端測試到長期後台穩定運行，本節會介紹幾種不同方案，供讀者根據實際場景選擇。

1.1　下載安裝

1.下載

Logstash從1.5版本開始，將核心代碼和插件代碼完全剝離，並重構了插件架構邏輯，所有插件都以標準的Ruby Gem包形式發布。

下載官方軟件包的方式有以下幾種：

壓縮包方式

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.tar.gz

Debian平台

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.deb

Redhat平台

https://artifacts.elastic.co/downloads/logstash/logstash-5.1.1.rpm

2.安裝

在上麵這些包中，你可能更偏向使用rpm、dpkg等軟件包管理工具來安裝Logstash，開發者在軟件包裏預定義了一些依賴。比如，logstash-5.0.2就依賴於jre包。

另外，軟件包裏還包含有一些很有用的腳本程序，比如/etc/init.d/logstash。

如果你必須在一些很老的操作係統上運行Logstash，那你隻能用源代碼包部署了，記住要自己提前安裝好Java：

yum install openjdk-jre

export JAVA_HOME=/usr/java

tar zxvf logstash-5.0.2.tar.gz

3.最佳實踐

但是真正的建議是：如果可以，請用Elasticsearch官方倉庫來直接安裝Logstash！

Debian平台

wget -qO - https://artifacts.elastic.co/GPG-KEY-elasticsearch | sudo apt-key add -

sudo apt-get install apt-transport-https

echo "deb https://artifacts.elastic.co/packages/5.x/apt stable main" | sudo tee -a /etc/apt/sources.list.d/elastic-5.x.list

sudo apt-get update && sudo apt-get install logstash

Redhat平台

sudo rpm --import

https://artifacts.elastic.co/GPG-KEY-elasticsearch

sudo cat > /etc/yum.repos.d/elk.repo <<EOF

[logstash-5.x]

name=Elastic repository for 5.x packages

baseurl=https://artifacts.elastic.co/packages/5.x/yum

gpgcheck=1

gpgkey=https://artifacts.elastic.co/GPG-KEY-elasticsearch

enabled=1

autorefresh=1

type=rpm-md

EOF

sudo yum install -y logstash

enabled=1

EOF

yum clean all

yum install logstash

1.2　Hello World

與絕大多數IT技術介紹一樣，我們也以一個輸出“Hello World”的形式開始學習Logstash。

1.命令行運行

在終端中，像下麵這樣運行命令來啟動 Logstash 進程：

# bin/logstash -e 'input{stdin{}}output{stdout{codec=>rubydebug}}'

首先看到終端輸出一段進程啟動過程的提示輸出。提示以"Successfully started Logstash API endpoint {:port=>9600}"結束。

然後你會發現終端在等待你的輸入。沒問題，敲入Hello World，回車，看看會返回什麼結果！

{

"message" =>"Hello World",

"@version" =>"1",

"@timestamp" =>"2014-08-07T10:30:59.937Z",

"host" =>"raochenlindeMacBook-Air.local",

}

沒錯！就是這麼簡單。

2.完整示例

命令行運行當然不是什麼特別方便的用法，所以絕大多數情況下，我們都是采用額外定義一個logstash.conf配置文件的方式來啟動Logstash。下麵是我們的第一個完整版logstash.conf的示例：

input {

stdin { }

}

output {

stdout {

codec => rubydebug {}

}

elasticsearch {

Rost=>["127.0.0.1"]

}

因為在5.0版本中，Elasticsearch和Kibana都是獨立服務。如果你按照上一節的最佳實踐配置好了yum的話，通過如下命令啟動服務即可：

# service elasticsearch start && service kibana start

然後在終端上這樣運行：

# bin/logstash -f logstash.conf

同樣，還是輸入一次Hello World。你會看到和上一次一樣的一段Ruby對象輸出。但事實上，這個完整示例可不止如此。打開另一個終端，輸入下麵一行命令：

# curl https://127.0.0.1:9200/_search?q=hello

你會看到終端上輸出下麵這麼一段內容：

{"took":15,"timed_out":false,"_shards":{"total":27,"successful":27,"failed":0},"hits":{"total":1,"max_score":0.095891505,"hits":[{"_index":"logstash-2015.08.22","_type":"logs","_id":"AU90s1eNgg_P5-w7SB32","_score":0.095891505,"_source":{"message":"Hello World","@version":"1","@timestamp":"2014-08-07T10:30:59.937Z","host":"raochenlindeMacBook-Air.local"}}]}}

這時候你打開瀏覽器，訪問https://127.0.0.1:5601地址，按照提示完成index pattern配置（正常的話隻需要點擊一下Create按鈕），即可點擊Discover頁麵看到如圖1-1所示的效果。你在終端上輸入的數據，可以從這個頁麵上任意搜索了。

圖1-1　Kibana上搜索的hello world

對index pattern配置有疑惑的讀者，可以閱讀本書第三部分關於Kibana的章節。

3.解釋

每位係統管理員都肯定寫過很多類似這樣的命令：cat randdata | awk '{print $2}' | sort | uniq -c | tee sortdata。這個管道符|可以算是Linux世界最偉大的發明之一（另一個是“一切皆文件”）。

Logstash就像管道符一樣！

輸入（就像命令行的cat）數據，然後處理過濾（就像awk或者uniq之類）數據，最後輸出（就像tee）到其他地方。

當然實際上，Logstash是用不同的線程來實現這些的。如果你運行top命令然後按下H鍵，你就可以看到下麵這樣的輸出：

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

21401 root 16 0 1249m 303m 10m S 18.6 0.2 866:25.46 |worker

21467 root 15 0 1249m 303m 10m S 3.7 0.2 129:25.59 >elasticsearch.

21468 root 15 0 1249m 303m 10m S 3.7 0.2 128:53.39 >elasticsearch.

21400 root 15 0 1249m 303m 10m S 2.7 0.2 108:35.80 <file

21403 root 15 0 1249m 303m 10m S 1.3 0.2 49:31.89 >output

21470 root 15 0 1249m 303m 10m S 1.0 0.2 56:24.24 >elasticsearch.

如上例所示，Logstash很溫馨地給每類線程都取了名字，輸入的叫<xx，過濾的叫|xx，輸出的叫>xx。

數據在線程之間以事件的形式流傳。不要叫行，因為Logstash可以處理多行事件。

Logstash會給事件添加一些額外信息。最重要的就是@timestamp，用來標記事件的發生時間。因為這個字段涉及Logstash的內部流轉，所以必須是一個joda對象，如果你嚐試自己給一個字符串字段重命名為@timestamp的話，Logstash會直接報錯。所以，請使用logstash-filter-date插件來管理這個特殊字段。

此外，大多數時候，還可以見到另外幾個：

host標記事件發生在哪裏。

type標記事件的唯一類型。

tags標記事件的某方麵屬性。這是一個數組，一個事件可以有多個標簽。

你可以隨意給事件添加字段或者從事件裏刪除字段。事實上事件就是一個Ruby對象，或者更簡單地理解為就是一個哈希也行。

每個Logstash過濾插件，都會有四個方法叫add_tag、remove_tag、add_field和remove_field，它們在插件過濾匹配成功時生效。

《ELK Stack權威指南》第1章　入門示例

上一篇：《JAVA8開發指南》為什麼你需要關注 JAVA8

下一篇：《Spark官方文檔》在YARN上運行Spark

相關內容

熱門內容

最新內容

《ELK Stack權威指南 》第1章 入門示例

上一篇： 《JAVA8開發指南》為什麼你需要關注 JAVA8

下一篇： 《Spark官方文檔》在YARN上運行Spark

相關內容

熱門內容

最新內容

《ELK Stack權威指南》第1章　入門示例

上一篇：《JAVA8開發指南》為什麼你需要關注 JAVA8

下一篇：《Spark官方文檔》在YARN上運行Spark