249
群英
統計aggregate子句__搜索子句介紹_API參考手冊_開放搜索-阿裏雲
子句說明
一個關鍵詞查詢後可能會找到數以萬計的文檔,用戶不太可能瀏覽所有的文檔來獲取自己需要的信息,有些情況下用戶感興趣的可能是一些統計的信息。
語法說明
統計子句格式為:group_key:field, range:number1~number2, agg_fun:func1#func2, max_group:number2, agg_filter:filter_clause, max_group:number
- group_key:必選參數。field為要進行統計的字段名,必須配置屬性字段,目前支持int類及literal類型的字段做統計。
- agg_fun:必選參數。func可以為count()、sum(id)、max(id)、min(id)四種係統函數,含義分別為:文檔個數、對id字段求和、取id字段最大值、取id字段最小值;支持同時進行多個函數的統計,中間用英文井號(#)分隔;sum、max、min的內容支持基本的算術運算;
- range:表示分段統計,可用於分布統計,隻支持單個range參數。表示number1~number2及大於number2的區間情況。不支持string類型的字段分布統計。
- agg_filter:非必須參數,表示僅統計滿足特定條件的文檔;
- agg_sampler_threshold:非必須參數,抽樣統計的閾值。表示該值之前的文檔會依次統計,該值之後的文檔會進行抽樣統計;
- agg_sampler_step:非必須參數,抽樣統計的步長。表示從agg_sampler_threshold後的文檔將間隔agg_sampler_step個文檔統計一次。對於sum和count類型的統計會把閾值後的抽樣統計結果最後乘以步長進行估算,估算的結果再加上閾值前的統計結果就是最後的統計結果。
- max_group:最大返回組數,默認為1000。
注意事項
- aggregate為非必選子句;
- 在aggregate中出現的字段必須在定義應用結構的時候配置為屬性字段;
- aggregate結果會在搜索節點facet節點中展示出來,具體值字段名為agg_fun的名字,如sum、count等
- aggregate支持多個key的統計,多個統計中間用英文分號(;)分隔。
示例
搜索包含“浙大”的文檔,並按照group_id字段進行統計,統計維度包含對price字段進行求和及計算最大值;並對company_id進行統計個數:
query=default:'浙大'&&aggregate=group_key:group_id,agg_fun:sum(price)#max(price);group_key:company_id,agg_fun:count()
返回結果為:
{
status: "OK",
result: {
searchtime: 0.015634,
total: 5,
num: 1,
viewtotal: 5,
items: [ //具體搜索結果
{ ... }
],
facet: [
{
key: "group_id",
items: [
{
value: 43,
sum: 81,
max: 20,
},
{
value: 63,
sum: 91,
max: 50,
},
],
},
{
key: "company_id",
items: [
{
value: 13,
count: 4,
},
{
value: 10,
count: 1,
},
],
},
],
},
errors: [ ],
tracer: "",
},
搜索包含“浙大”的文檔,並按照group_id字段進行統計,統計維度包含對price字段進行求和。其中10000以後的文檔進行抽樣,步長為5:
query=default:'浙大'&&aggregate=group_key:group_id,agg_fun:sum(price), agg_sampler_threshold:10000, agg_sampler_step:5
搜索包含“浙大”的文檔,並按照group_id字段進行統計個數,統計維度為小於10、10~50、及大於50的文檔數;
query=default:'浙大'&&aggregate=group_key:group_id,agg_fun:count(),range:10~50
搜索包含“浙大”的文檔,並按照group_id字段進行統計hits及replies的和的最大值,僅統計create_timestamp大於1423456781的文檔;
query=default:'浙大'&&aggregate=group_key:group_id,agg_fun:max(hits+replies),agg_filter:create_timestamp>1423456781
最後更新:2016-11-23 16:04:03
上一篇:
排序sort子句__搜索子句介紹_API參考手冊_開放搜索-阿裏雲
下一篇:
聚合distinct子句__搜索子句介紹_API參考手冊_開放搜索-阿裏雲
功能與限製__快速入門_雲數據庫 HybridDB-阿裏雲
Spark + MNS__Spark_開發人員指南_E-MapReduce-阿裏雲
任務實例__基本概念_基本介紹_大數據計算服務-阿裏雲
動作列表__RAM子用戶訪問_API-Reference_日誌服務-阿裏雲
Python SDK__SDK_大數據計算服務-阿裏雲
專有網絡中跨可用區部署資源__最佳實踐_用戶指南_專有網絡 VPC-阿裏雲
下載、安裝阿裏雲新版Java SDK__SDK 參考_雲服務器 ECS-阿裏雲
步驟 1:配置選型__快速入門(Linux)_雲服務器 ECS-阿裏雲
查詢API列表__API管理相關接口_API_API 網關-阿裏雲
事務說明__用戶指南_雲數據庫 PetaData-阿裏雲
相關內容
常見錯誤說明__附錄_大數據計算服務-阿裏雲
發送短信接口__API使用手冊_短信服務-阿裏雲
接口文檔__Android_安全組件教程_移動安全-阿裏雲
運營商錯誤碼(聯通)__常見問題_短信服務-阿裏雲
設置短信模板__使用手冊_短信服務-阿裏雲
OSS 權限問題及排查__常見錯誤及排除_最佳實踐_對象存儲 OSS-阿裏雲
消息通知__操作指南_批量計算-阿裏雲
設備端快速接入(MQTT)__快速開始_阿裏雲物聯網套件-阿裏雲
查詢API調用流量數據__API管理相關接口_API_API 網關-阿裏雲
使用STS訪問__JavaScript-SDK_SDK 參考_對象存儲 OSS-阿裏雲