閱讀1021 返回首頁    go 汽車大全


模煳搜索詳解__功能篇_最佳實踐_開放搜索-阿裏雲

模煳搜索是指在用戶搜索意圖不明確時,搜索引擎將用戶的查詢(query)與待檢索的內容(doc)進行模煳匹配,找出與查詢相關的內容。是否相關主要從兩個方麵衡量:一是query是doc中某些內容的全拚或者簡拚;二是query中內容直接在doc中出現。模煳搜索無法精確理解用戶的查詢意圖,返回的結果中可能包括了一大批用戶不想要的信息,所以在使用模煳搜索時一定要結合自己的實際場景,慎重使用。

適用場景

模煳搜索主要用戶搜索意圖不明確或者數據較少想返回更多查詢結果的時候。主要包括以下場景。

拚音搜索:

拚音搜索是指doc中的數據為中文,而希望使用全拚或者簡拚進行查詢的搜索。比如,文檔中的內容為開放搜索,用戶希望查詢”kaifangsousuo” 或者”kfss”時文檔能夠被召回。模煳搜索支持這樣的功能,而且支持query的形式更豐富。以開放搜索為例,模煳搜索支持的query形式如下(注意是雙引號查詢):”kai”、”kaifang”、”sousuo”、 “kaifangsousuo”、”k”、”kf”、”ss”、”kfss”。注意:如果希望搜索內容在doc中是相連的,建議在查詢詞兩邊加上雙引號。拚音搜索中查詢詞兩邊最好都使用雙引號,這是因為用戶輸入的拚音是具有一定的意圖的,用戶搜索”kfss”(開放搜索)其實是希望這些詞是要連在一起的。

前綴搜索:

前綴搜索是指搜索以指定前綴開頭的內容的檢索,比如手機號碼搜索。模煳搜索支持的前綴標識符為’^’,如果用戶想搜以138開頭的手機號,query可寫成”^138”(注意是雙引號查詢)。

後綴搜索:

後綴搜索是指搜索以指定後綴結尾的內容的檢索,比如手機號碼搜索。模煳搜索支持的後綴標識符為’$’,如果用戶想搜以9527結尾的手機號,query可以寫成”9527$”(注意是雙引號查詢)。

單字或單字母搜索:

模煳搜索支持單字或單字母搜索,比如’開放搜索 open search’,通過’放’或者’o’都可以召回。單字或單字母這種使用場景主要是為了擴大召回結果,返回的結果可能不是很準確。

使用與限製

用戶創建應用時,將需要進行模煳搜索的字段設置為short_text即可使用模煳搜索。模煳搜索返回的結果默認按照命中的詞在字段的前後位置進行排序。比如某個應用的title字段需要模煳搜索,doc1的內容為開放搜索,doc2的內容為喜歡使用開放搜索,當搜索”kfss”時,doc1默認會排在doc2的前麵。模煳搜索在用於查詢意圖不明確時能夠很好滿足用戶的需求,但在使用過程中需要注意如下限製:

  • 模煳搜索中按照空格分隔片段,認為按照空格分開的片段在語義上是等價的,比如對電影的演員進行拚音搜索,多個演員之間是等價的,需要用空格分開。隻有檢索的內容處於同一個片段時,查詢詞兩邊才可以使用雙引號,否則不建議使用。比如doc的short_text字段內容為‘劉德華 劉若英’,查詢”ldh”或者”lry”可以把doc召回,而查詢”ldh lry”或”liudehua liuruoying”是無法把doc召回的;
  • 查詢時隻有英文、數字和拚音支持前綴和後綴搜索,中文不支持;
  • short_text字段中的標點符號會被過濾掉;
  • short_text字段過濾掉標點符號後,長度限製為100個字節,超過的內容會被丟掉
  • short_text字段可以創建下拉提示;
  • 由short_text字段創建的索引不能夠使用查詢分析。
  • 英文和數字及拚音不支持飄紅

最後更新:2016-11-23 17:16:06

  上一篇:go Array數組類型說明__功能篇_最佳實踐_開放搜索-阿裏雲
  下一篇:go solr語法轉化__功能篇_最佳實踐_開放搜索-阿裏雲