蔣鑫鵬:百度搜索引擎算法的總結

關于百度算法的猜測,那是眾說風云,最近因為百度算法計劃內的大規(guī)模調整,眾多從事SEM和SEO的愛好者更是對于百度算法議論紛紛,筆者將近年來做SEO搜索引擎優(yōu)化的實戰(zhàn)經(jīng)驗做總結歸納,分享與此,與熱愛網(wǎng)絡營銷的朋友們探討……求拍磚,求吐槽,求碰撞出火花!

一、百度基礎算法分析:鏈接流行度核心算法+百度推廣+框計算+開放平臺

1.【鏈接流行度】和大多數(shù)關鍵詞搜索引擎一樣,頁面URL地址鏈接的流行程度為核心的基礎核心算法;

2.【百度推廣】起先叫做百度競價,后改為百度推廣,包括關鍵詞競價算法和網(wǎng)盟推廣算法兩部分;

3.【框計算】語義分析、行為分析、智能人機交互、海量基礎算法等。 

二、百度收錄流程

1.【頁面的收錄】搜索蜘蛛程序>收錄的頁面鏈接>現(xiàn)新的鏈接并爬行>的頁面及內容合格>錄快照并分類存儲>立頁面基本數(shù)據(jù)(頁面URL、頁面關鍵詞、頁面標題描述、收錄來源、收錄時間、內容簡述、頁面權重、更新周期);

2.【百度免費產品】百度百科、百度文庫、百度貼吧、百度知道、百度空間等百度自身免費產品的頁面收錄;

3.【百度開放平臺】主要是站長提供的結構化數(shù)據(jù)(網(wǎng)站與百度的深度合作,如汽車網(wǎng)站的參數(shù)數(shù)據(jù)、百度知道接口等)和開發(fā)者提交的各種應用(開發(fā)者加入百度開發(fā)者中心并提交相關應用通過審核);

4.【百度競價推廣】網(wǎng)站主開通百度推廣賬戶>付費并通過網(wǎng)站審核>輯關鍵詞廣告及推廣計劃>交百度推廣后臺;

5.【百度網(wǎng)盟推廣】網(wǎng)站主開通百度推廣賬戶>付費并通過網(wǎng)站審核>輯網(wǎng)盟廣告及推廣計劃>交百度推廣后臺;百度聯(lián)盟廣告合作伙伴站長參與網(wǎng)盟推廣并審核通過》預留廣告位并做好網(wǎng)盟接口。

三、百度檢索流程

搜索需求>義分析>據(jù)庫檢索>名顯示反饋

1.【百度搜索頁面的檢索】用戶輸入關鍵詞并檢索>架算(語義分析及分詞判斷、行為分析、智能人機交互、海量基礎算法)>計算結果(開放平臺的數(shù)據(jù)、傳統(tǒng)搜索結果、百度推廣結果、百度自身產品結果)>計算結果排名。

2.【百度網(wǎng)盟頁面的推薦】用戶訪問百度網(wǎng)盟某合作網(wǎng)站頁面>盟算法根據(jù)用戶瀏覽器大量有價值的搜索Cookis計算并推薦廣告>戶被有質量的廣告吸引并點擊>盟推廣后臺引導用戶進入?yún)⑴c網(wǎng)盟推廣的網(wǎng)站相應頁面。

四、百度指數(shù)權重考核因素

1.傳統(tǒng)搜索的權重考核

A.【網(wǎng)站訪問量】網(wǎng)站訪問流量(IP、PV、獨立訪客)決定網(wǎng)站權重基數(shù);

B.【關鍵詞流量】關鍵詞搜索訪問流量是百度權重指數(shù)的基本考核數(shù)據(jù);

C.【關鍵詞質量】關鍵詞搜索訪問質量(人均頁面訪問數(shù)量、人均頁面停留時間)是百度權重指數(shù)的重要考核數(shù)據(jù);

D.【關鍵詞文字鏈】高質量的關鍵詞文字外鏈是百度權重指數(shù)的重要補充考核數(shù)據(jù);

E.【多種外鏈來源】多元化的外鏈來源是提高權重的良好方式;

F.【關鍵詞匹配度】關鍵詞與頁面內容的匹配度(關鍵詞所占比例、關鍵詞位置)是百度權重站內考核的基本參數(shù);

G.【站點內容質量】網(wǎng)站內容質量(原創(chuàng)度、可讀性、豐富性)是百度權重指數(shù)站內考核的重要數(shù)據(jù);

H.【站點鏈接結構】站點鏈接結構也是百度權重指數(shù)站內考核的重要參數(shù);

I.【域名年齡】域名年齡長的頁面權重較高;

J.【網(wǎng)站年齡】網(wǎng)站年齡也是影響權重的重要的因素,沒有明顯的大面積改版且頁面標簽屬性變化不大的頁面容易獲得穩(wěn)定的權重;

K.【服務器穩(wěn)定性】服務器穩(wěn)定性、包括IP使用的年齡也會影響站點權重;

L.【百度推廣指數(shù)】購買百度廣告的站點會直接獲得權重贈分;這點已經(jīng)在很多操作實例中得以證明;

M.【百度體系指數(shù)】網(wǎng)站與百度體系的合作深度是權重參考的又一個重要依據(jù),如是否加入網(wǎng)盟、是否加入開放平臺,是否使用百度相關產品(如百度統(tǒng)計、百度分享、百度Hi等)

2.百度自身產品的頁面

根據(jù)判斷,百度自身產品權重順序一般為:百度百科、百度文庫、百度貼吧、百度知道、百度空間,百度自身產品本身因為主站www.baidu.com權重高而獲利,其次百度算法中對以上自身產品本身的排名權重較高。以上所列的百度產品對應的關鍵詞搜索內容頁面是否在搜索結果展示,主要取決于用戶瀏覽質量及參與互動程度。

3.百度開放平臺的頁面

百度開放平臺與百度自身產品類似,是否獲得好的排名,主要看頁面本身的流量及用戶參與程度,而開放平臺合作站點本身的權重決定排名次序的基本參數(shù)。

4.百度推廣的頁面

百度付費推廣的頁面排名主要是百度競價機制決定,按照參與競價的相應關鍵詞出價高低決定排名次序;百度網(wǎng)盟推廣的排名優(yōu)先程度與競價機制類似,取決于網(wǎng)盟廣告出價高低。

5.百度網(wǎng)盟合作網(wǎng)站

網(wǎng)盟合作網(wǎng)站的權重會獲得一定的贈分。因為這個給百度推廣獲得收益作了重要貢獻。

五、百度快照收錄的考核因素

(以下只針對傳統(tǒng)關鍵詞搜索的自然排名)

1.【百度快照的收錄影響因素】

(1)原創(chuàng)內容:原創(chuàng)內容是快照收錄考核的首要因素;

(2)鏈接引導:鏈入新頁面的外鏈及內鏈質量越高越容易被收錄;

(3)頁面訪問質量:包括頁面的訪問數(shù)量、訪問時間等因素;

(4)站點質量:如果站點本身的權重太低,快照收錄會受到負面影響;

(5)頁面可讀性:如果文字過少,又缺少必要的圖表配合,也會影響快照的收錄;

(6)作弊:頭部標簽關鍵詞連續(xù)堆疊、頁面內容中關鍵詞堆疊過多、出現(xiàn)暗鏈接、等作弊因素也可能影響快照收錄。

2.【關于與快照更新的影響因素】

(1)頁面的權重:頁面權重是蜘蛛程序造訪頻率的核心因素;

(2)頁面更新周期:已被收錄的快照在搜索數(shù)據(jù)庫中會有一個更新周期參數(shù),更新周期首該頁面更新歷史記錄的影響;

(3)鏈接質量:鏈入的外鏈所在頁面權重是快照跟新周期的重要補充,外鏈質量越高,快照更新越頻繁;

(4)內容跟新的幅度:內容更新幅度過小的頁面容易被忽略(一般指重要的導航頁面及站點主頁);

(5)靜態(tài)化頁面影響快照更新:這是筆者EO實例操作中發(fā)現(xiàn)的,靜態(tài)化頁面易被搜索程序判定為“死”頁面而影響更新周期;

(6)域名及網(wǎng)站年齡:老網(wǎng)站更容易獲得較頻繁的快照更新周期;

(7)網(wǎng)站收錄頁面數(shù)量:收錄頁面越多,主頁快照更新越頻繁。(上海訊道網(wǎng)絡科技出品)

六、頁面排名分析

1.【關于頭部標簽】

(1)頭部比重是分詞匹配的關鍵,主要的算法是:1.中文分詞、2.語義連貫、3.分詞所占比重

(2)頭部標簽說明:

title:關鍵詞在title中的算法:1.連貫、2.靠前、3.比重

keywords:keywords一定不能包含頁面沒有的關鍵詞,keywords必須在內容中有所體現(xiàn)

描述:描述是頁面基本的參考,包含的關鍵詞權重僅次于title

(3)頭部標簽修改后,頁面快照收錄會暫緩進入觀察期,一般為一周左右,穩(wěn)定后恢復新快照。

頭部標簽一定要與頁面內容匹配,在限定字數(shù)內,頁面頭部標簽修改頻繁,會導致搜索程序直接抓取頁面內容作為描述。

2.【關于頁面內容】

1.關鍵詞匹配級別:位置明顯的帶鏈接的錨文本,如導航條、快速通道、底部導航、H標簽;

2.主頁權重最高、其次為主頁直接鏈接指向的頁面;

3.頁面內容要豐富,圖表搭配得當,訪問量高有助于排名;

4.空頁面或者信息簡陋的頁面直接影響收錄與排名;

5.頁面訪問數(shù)量及質量是排名的重要因素。

6.多媒體多文件性質的頁面會被受到重視:如視頻、音樂、文檔、圖表、對話框、互動按鈕等。

3.【關于外部鏈接】

1.鏈出鏈接指向的頁面權重要高;

2.鏈入外鏈所在頁面權重高,關鍵詞及內容相關性匹配要高;

3.多樣化的外鏈鏈入更有效;

4.社會化分享外鏈鏈入越來越被重視;

5.購物及電子商務類的外鏈越來越有價值;

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2012-05-22
蔣鑫鵬:百度搜索引擎算法的總結
關于百度算法的猜測,那是眾說風云,最近因為百度算法計劃內的大規(guī)模調整,眾多從事SEM和SEO的愛好者更是對于百度算法議論紛紛,筆者將近年

長按掃碼 閱讀全文