solr語法轉化__功能篇_最佳實踐_開放搜索-阿裏雲

Schema

OpenSearch支持多種數據類型及分詞方式，可以滿足絕大多數場景下的需求。目前接觸到的不滿足的有：

OpenSearch目前支持查詢、過濾、統計、聚合、排序等功能，詳細功能說明。

q 轉化規則
‘:‘ 暫不支持
range索引，用filter的區間段來轉化
+A ==> A
-A ==> 不支持
A AND B ==> A AND B
A AND -B ==> A ANDNOT B
A OR B ==> A OR B
A OR +B ==> A RANK B
A AND B OR C ==> A AND B RANK C, e.g：紅富士 AND 蘋果 OR 山東
A OR B AND C ==> B AND C RANK A, e.g:紅富士 OR 蘋果 AND 山東
A AND B OR +C ==> A AND B AND C, e.g:紅富士 AND 蘋果 OR +山東
A OR +B AND C ==> B AND C RANK A, e.g:紅富士 OR +蘋果 AND 山東
+A OR B AND C ==> A AND B AND C, e.g:+紅富士 OR 蘋果 AND 山東
A AND B OR -C ==> (A AND B) ANDNOT C, e.g：紅富士 AND 蘋果 OR -山東
A AND -B OR C ==> A ANDNOT B RANK C, e.g：蘋果 AND -紅富士 OR 山東
-A AND B OR C ==> B ANDNOT A RANK C, e.g：-紅富士 AND 蘋果 OR 山東
A OR B AND -C ==> B ANDNOT C RANK A, e.g:紅富士 OR 蘋果 AND -山東
A OR -B AND C ==> C ANDNOT B RANK A, e.g:紅富士 OR -山東 AND 蘋果
-A OR B AND C ==> (B AND C) ANDNOT A, e.g:-紅富士 OR 山東 AND 蘋果
A OR B OR -C == A OR -C OR B == -C OR A OR B ==> (A OR B) ANDNOT C
A AND B OR C AND D ==> A AND B AND C AND D

統計轉化規則
facet.field => OpenSearch aggregate子句中的group_key參數
facet.limit => OpenSearch aggregate子句中的max_group，默認為1000
facet.mincount => 暫不支持，需要全部結果拿回去自行處理
facet.offset => 暫不支持，需要全部結果拿回去自行翻頁
facet.sort => 暫不支持，需要全部結果拿回去自行排序
facet=true&facet.field=price&facet.limit=200 ==> aggregate=group_key:price,agg_fun:count(),max_group:200

group：暫不支持。某些簡單的場景可以考慮OpenSearch中的distinct子句，並結合sort來做組內排序。
stats：部分功能對應OpenSearch中的aggregate子句，但是agg_func僅支持min, max, count, avg，暫不支持missing、sumOfSquares、mean、stddev、distinctValue、countDistinct。

深度翻頁：目前OpenSearch提供兩個查詢接口，一個是search，一個是scroll。search是常規的查詢場景，最多支持5000個結果返回，可以翻頁，每頁最大500個；scroll為數據導出場景，可以支持千萬級別數據導出，但不支持排序，可以將結果拿回去做二次分析。
統計結果準確性：為了保證更優的檢索性能，目前OpenSearch在很多情況下會做抽樣和預估，這樣會導致統計結果不是很精準。
搜索結果total值：為了保證搜索性能，數據量很大的情況下（跟總數據量無關，主要是查詢召回量超過百萬以上），仍然會做預估。
多OR查詢：目前query長度限製編碼後1K，如果OR查詢較多會導致報錯無結果，建議增加個數限製，或者並發多次查詢再自行做結果merge。

最後更新：2016-11-23 17:16:10