閱讀212 返回首頁    go 阿裏雲 go 技術社區[雲棲]


京東2015年和2016的搜索規則變化

京東搜索15年和16年的最新變化規則
一、召回1、商品廣告詞啟用白名單:也就是說廣告詞不再全部被召回,隻有在白名單裏麵的詞,才會被召回。白名單規則保密,想知道廣告詞是否在白名單裏,可自行測試。對於新上線的業務,需要注意和搜索部門溝通,把新業務詞加入到白名單。
2、召回詞還是包含原來的幾部分:標題、類目、店鋪名稱、廣告詞白名單、屬性、評價標簽(質量很差,還沒有做白名單處理)、同義詞(兩個詞在語義上是一致的,不同於之前的同義詞,比如吸頂燈和吊燈,以後輸入吊燈就不會把吸頂燈召回)
3、品牌詞合並:如果搜索品牌詞,商品沒出來,先查看是否有多個品牌詞,比如搜樂視,隻出來樂視手機,不出來樂視電視,這種是樂視手機和樂視電視用了不同的品牌詞。解決方案:找負責部門把兩個品牌詞合並成一個4、標題的屬性字段識別:搜索 “內衣 女”,會出來男款保暖內衣,是因為這款男款在標題裏 寫著屬性詞 男女款,所以會搜索出來。年中會把標題詞中識別為屬性詞的,就到屬性詞去召回,不召回屬性詞的標題詞。二、排序1、16年相比之前排序做的一些改變

1.1、相關性提升1.2、數據(data clean):所有的因子都是數據,包括團購秒殺。data clean :清洗不好的搜索。比如評價以前用的是全部評價,就會出現某個商品做的好,就用替品的情況,16年改為隻用最近的評價(具體多近,保密);也防止商家大量抓詞、點商品,把自己的的商品做上去的情況。1.3、搜索反作弊(lever 2):搜索反作弊開始使用覆蓋率高、準確率低的召回方式 。1.4、模型:1.4.1、按不同品類、品類下詞頻、客戶端,使用不同的排序模型1.4.2、搜索反饋因子加入移動端(app、微信手Q)1.4.3、信息質量因子:a、圖片牛皮癬,會被降權b、品牌亂綁:注冊是一個品牌,而在標題裏麵寫的是其他品牌。采取措施:先人工審核下架,後續算法成熟會直接降權。c、合並重複商品:一模一樣的商品鋪貨,合並成一個商品
1.4.4、店鋪信用因子(今年會上線):類似dsr(店鋪動態評分),dsr的因子會加進來;作弊記錄會被累積,往前補一段時間的曆史記錄(一段時間是多長保密)1.4.5、加入客服、工單:比如咚咚響應時間、交易的糾紛率、工單的處理等1.5、市場機製:穿插大品牌1.6、個性化-依賴用戶畫像(3月份在微信手Q、app上線)
a、搜索反饋:登陸情況下把用戶已關注、已購買的店鋪、品牌下的商品rerank到前麵去(千人千麵)b、識別用戶購買力和性別推送不同商品後續規劃(內容比較抽象,沒細講):
a、搜索解決新品問題:把新品或者爆品放櫥窗,更有利於被搜索到b、用戶偏好屬性識別c、分析個性化維度:比如地域、小區等d、識別用戶是否對新品、促銷、評價敏感,也會放在前麵e、商品、三級類目、購買力、品牌、店鋪關係預測f、結合線下數據,配送員終端:比如配送員去送床,會給配送員發一條信息,確認該用戶是否在裝修,如果在裝修,就給他推送冰箱、電視等家具。

最後更新:2017-11-01 02:33:07

  上一篇:go 一小時成交10+萬,KA商家如何部署工作上篇
  下一篇:go 來著能學的隻有經驗,努力還是要靠個人!!