談《百度搜索引擎網頁質量白皮書》
今年上半年,百度發布了《百度搜索引擎網頁質量白皮書》,官方給出的發布理由是“此次推出《網頁質量白皮書》,目的是開放百度在網頁質量方麵的判斷標準,給站長提供參考,希望有更多、更優質的內容產生,滿足搜索引擎用戶的需求,同時為站長帶來流量,實現共贏。”
幾乎可以肯定,用戶在瀏覽網頁時,使用最多的網站,絕大多數是搜索引擎,如百度、搜狗、360以及現在幾乎沒法用的穀歌。用戶將自己的需求傳遞給搜索引擎,搜索引擎幫助用戶在整個網頁庫中搜尋用戶希望知道的信息,並將網頁鏈接呈現給用戶。這樣,用戶可以通過搜索引擎確定的結果來獲取所需信息。
在這裏,很關鍵的一點就是,如何將與用戶輸入的關鍵字最相關的網頁反饋給用戶,或者說是質量最高的網頁反饋給用戶。這裏,就涉及到網頁質量。
白皮書中是這樣定義“網頁質量”的:網頁質量是一個網頁滿足用戶需求能力的衡量,是搜索引擎確定結果排序的重要依據。在網頁資源內容與用戶需求有相關性的基礎上,內容是否完整、頁麵是否美觀、對用戶是否友好、來源是否權威專業等因素,共同決定網頁質量的高低。
百度的搜索引擎所實現的功能就是將與用戶輸入關鍵字最相關的網頁質量最高的網頁反饋給用戶。為此,百度搜索綜合用戶對不同網頁的實際感受,製定了一套評判網頁質量的標準,基於這個標準,對百度搜索的收錄、排序、展現環境進行調整,給高質量的網頁更多的收錄、展現機會,同時對一些影響用戶體驗、欺騙搜索引擎的惡劣低質網頁進行打壓。
白皮書中對衡量網頁質量的維度進行了詳細說明。
百度搜索引擎在衡量網頁質量時,基於三個維度特征,分別是內容質量、瀏覽體驗、可訪問性。
首先是內容質量,其著眼於主體內容的好壞,以及主體內容是否可以讓用戶滿意。另外,在內容質量方麵,還分為許多子維度,如內容完整、信息真實以及安全等。
然後是瀏覽體驗,關於瀏覽體驗,白皮書中給出了“對網頁主體內容的獲取成本”的概念。用戶對網頁主體內容的獲取成本與瀏覽體驗成反比。麵對內容質量相近的網頁,瀏覽體驗佳者更容易獲得更高的排名。瀏覽體驗主要表現在網頁內容排版和廣告影響上。
最後是可訪問性。百度搜索引擎希望盡可能為用戶提供能一次性直接獲取所有信息的網頁結果。因此,當一個網頁中的可訪問性很差時,搜索引擎會視情況調整其展現幾率。百度搜索引擎從正常打開、權限限製、有效性三方麵判斷網頁的可訪問性。
另外,對於白皮書中提及的互聯網網頁資源現狀,文章中是這樣說的:
為了保證搜索質量、提高用戶使用滿意度,百度搜索引擎每周都會進行網頁質量抽樣評估。然而從近一年的評估數據中我們發現,優質網頁的絕對數量非常少,且幾乎沒有增長;普通網頁的占比在下降,相應的,質差網頁的比例卻有明顯上漲。截至2014年5月,統計數據顯示,在百度網頁搜索發現的海量網頁中,優質網頁僅占7.4%,質差網頁高達21%,其餘普通網頁為71.6%。
從上麵的數據我們應該從兩個方麵去思考:
1、目前互聯網的整體網頁質量都是很差的,對於整個互聯網行業來說,在網頁資源的整合和質量提高上任重而道遠。
2、對於從事互聯網的從業者來說,或者是創業者來說,這種數據後麵所蘊含的是巨大的商機和潛力。將網站的網頁質量提高,注重內容,優化用戶體驗,改善網站訪問速度,通過這些方法,百度搜索對網頁的排位就會上升,而這些帶來的不僅僅是廣告收入的增加,更有網站的知名度。這些影響,對於互聯網從事者和創業者來說是至關重要的。當然,通過商業買賣交易來實現搜索引擎的用戶展現優先權也是完全可行的,但那是土豪行為,對於很多小網站來說還是很有壓力的。
在上文中,提到了網頁排位通過商業買賣交易來提升,以及通過紮紮實實提高網頁質量來實現網頁排位的提升。個人的看法是,一個網頁質量高的網站是前提。當我們在整個行業有一個很好的idea時,將該idea轉化為質量高的商業網站是首要的,注重內容的豐富性,注重瀏覽體驗(排版要井井有條,信息層級扁平化),通過改善服務器性能提高網站訪問速度,這些是一個好網站的基礎。
最後,附上百度搜索引擎給站長的建議:
1、設計網頁時主要考慮的是用戶,而非搜索引擎;
2、永遠將用戶體驗放在首位;
3、根據用戶需求製作內容;
4、多考慮如何讓自己的網站具有獨特價值;
5、將目光放長遠,濫放廣告弊大於利;
6、及時刪除低質內容;
7、不要企圖用任何方式欺騙用戶和搜索引擎。
貼上自己覺得很不錯的網站的一張圖片(快課網):
PS.自己接觸互聯網的時間很短,也就是從大學以來的三年多時間,對於互聯網的認識還比較膚淺,在此僅僅是拋磚引玉。
最後更新:2017-04-03 05:39:50
上一篇:
openfire環境搭建
下一篇:
HDU1008-Elevator
線程同步2——同步通信wait和notify
微軟正式發布 Office 365 University
android 中ids.xml資源的使用
使用 ConfigurationSection 創建自定義配置節
【最近麵試遇到的一些問題】多線程有幾種實現方法,都是什麼?同步有幾種實現方法,都是什麼
搜索引擎算法原理 百度算法的原理 [
生活不止眼前的coding,還有遠方的裏約熱
如何在 CentOS 7 上安裝和安全配置 MariaDB 10
MSSQL · 應用案例 · 日誌表設計優化與實現
Mysql Group Replication in Single-Primary Mode介紹及安裝部署