百度站長門診開放日Lee問答整理-首頁百度快照更新與排名沒有關系
轉載于站長網:8月10日百度站長門診開放日Lee問答整理
問題1:我希望今天lee能對站長的問題,都盡量精準,能用數字說明的就說數字,如果一直說質量什么的、對用戶體驗什么的,這各人理解起來差距很大的,比如什么叫對用戶有幫助,哈哈,站長不需要你對所有都說出標準,但是至少這些站長們提的問題,您能確定化得數字就數字說明,謝謝了!
Lee:首先,公布數字是不可能的,任何一個搜索引擎都不會這么干,我們需要保證判斷算法的壽命。
問題2:一個網站內有部分頁面的title等設置一樣,那么會不會影響到這些頁面的相關關鍵詞排名,還是從中選擇一個權重高的合適的頁面出來參與排名競爭?
Lee:這種問題請參考《百度搜索引擎優化指南》,其中已經有非常明確的說明,多個網頁title一樣,意味著這部分網頁搜索引擎判斷其中心內容非常困難,也就不容易準確的給其一個合理的權值。
問題3:請問:百度對于網站分隔符、網站結構是否有自己的標準?目前醫療網站內容同質化嚴重,請問百度是如何來判定網站權重和自然排名的?
Lee:網站的結構在保證用戶體驗的前提下,適當的做一些對spider的優化會有助于收錄,我們推薦扁平的樹型結構。
《百度搜索引擎優化指南》中有詳細的說明。
關于同質內容,先透露一下,我們正在設計一套較完善的原創識別算法,不久之后也會邀請站長朋友給我們一些建議及抄襲的實例用做算法調整之用。
問題4:此外網站一個網頁多大合適,有的頁面大小過200k,我一般都注意在110k以內,這個有數字標準嗎?
Lee:網頁大小建議以用戶能接受的程度為準,對百度來講,我們能接受的網頁大小肯定已經超出普通網頁平均大小的數十倍,完全不用擔心。
問題5:百度對于一篇原創文章的判斷到底是怎樣的標準?比如一篇原創文章可能最先是一個新站或權重較低的站發布的,但是已經被百度收錄后,發表到其他高權重門戶網站、論壇,這些網站可能會給文章來源站一個來源網址,可能是錨文本鏈接,也可能是純網址;但過了很久,百度都無法識別文章的真正來源,總會將文章來源給那些高權重站。試問,這樣對用戶的體驗好嗎?雖然之前有人問過類似問題,百度官方也有回答,但很模糊,想具體了解下,百度到底如何界定原創文章?
Lee:近期我們會就原創識別問題和大家做專門的交流,為了保證算法的壽命周期,我們不會公布算法的細節,但大家的意見和碰到的具體問題,都考慮到算法中。
問題6:現在點擊器泛濫,導致很多內容很不好的網站排名很好,認真做內容的網站反而不能排在前面,希望這個百度能重視,用戶體驗才是第一位的
Lee:如果大家遇到此類問題,請到投訴反饋,我們有專門的同學輪流分析并安排到合適的項目中去解決,我也是其中之一。
問題7:百度對于鏈接買賣、站群和克隆站的打擊策略是怎樣的?
Lee:超鏈應該是用戶真心實意對網站的投票,買賣鏈接有違超鏈的本意,我們反對鏈接買賣。很快我們將就此類問題做一個專門的說明,同時也會說明我們對買賣鏈接的處理原則。
問題8:如果站長們不投訴,被誤傷的網站會一直被懲罰嗎?有沒有恢復的期限,是半年,還是一年?或者更長?
Lee:我們的策略都會定期的review/改進,不同的策略有不同的周期,天級到月級不等,我們會持續的改進策略,以減少誤傷。
問題9:針對一些大站 比如B2B 分類信息站 其大部分每天更新的都是產品詳細頁 因為客戶都比較懶,發布的信息都非常簡單 沒有幾個字 導致大部分頁面看起來相似度都很好(因為產品內容詳細頁都是一個模板) 請問百度是怎么來評定這個站 并對其的收錄情況及評價情況有何標準?
Lee:搜索引擎對網頁價值的判斷,不是從字數出發的,而是從其資源質量出發的
只要是對用戶有價值的內容,不論長短,我們都會給一個合理的評價如果這個網站上提供的內容或者服務非常有價值,無可替代,那對搜索引擎來講,就是一個高質量的網站。
問題10:現在憑借發布時間來判斷兩篇相同文章哪篇是原創還無法實現,這一點百度說明過,但是現在的情況是很多新站,權重低的網站站長自己辛辛苦苦一點點碼字寫出來的原創文章,被高權重網站轉載,雖然注明了出處,但是對于百度來說,如果僅僅因為轉載網站權重高就判斷為原創文章,那就意味著低權重網站被誤判為抄襲或轉載,這樣顯然很不公平,請問對于判斷文章原創問題,百度搜索團隊是否有解決方案,或者直接回答我們“百度是否能判斷出哪篇文章才是原創的”。
Lee:剛剛已經說過了,我們正在計劃在原創方面做一些改進。原創識別是一個很有技術含量的話題,不是簡單的幾種規則就能做好的,互聯網很復雜,人心更復雜,不過我們有信心逐步的去解決這個問題,其中也需要站長朋友多提供相關的問題和建議。
問題11:關于描述的抓取怎么抓取的,看到一個網站的描述,不是meta name="description" 里面的內容而是企業簡介里面的內容。感覺不是亂抓取,跪求大大回答
Lee:我們的《百度搜索引擎優化指南》算是白寫了。。。其中有很詳細的說明,建議你認真看一遍第22、23頁。
問題12:百度什么時候能發放,外鏈查詢工具,還有網站權重對百度是否有用的工具。
Lee:外鏈查詢工具請密切關注站長平臺,也許會有驚喜。
問題13:我的網站運營方式有點像中國知網文章內容沒有顯示完整的會員必須登陸并要通過上傳原創文章交換的方式獲得積分才可以下載全文這樣會不會意味著用戶體驗不好百度予以降權?
Lee:知網就已經是此類網站最佳的例子了,既然他在搜索引擎中表現很好,那還擔心什么。。。
問題14:自從大K站之后,許多的網站百度快照一直停留不動,不知道這是什么原因。是算法在調整,還是我們應該在網站自身找原因。
Lee:關于快照的更新時間,尤其是首頁的更新時間,我一直建議不要參考,這個時間跟網站的價值沒有任何的關系,近期我們也會出一個專門的說明。
問題15:您好,專家,我想請教一下。為什么帶3w的網站最近老是不穩定,有時候被收錄,有時候又找不到了。而,排名全部是集中在帶3w的上的,一沒有,排名都消失了。請問是什么原因,要如何解決?
Lee:看不到實例的話,誰也說不準到底是什么原因
建議你到百度投訴 給一下具體的實例
應該是一種異常現象
問題16:我們有一個專題專欄,里面大都是一些靜態頁面,但是百度一直不予收錄,不知道是什么原因,其他的都收錄了,就下面這個列表頁
中國文物網-深度列表
Lee:根據你提供的query,我找出這個欄目隨便看了幾個網頁,都收錄了
貴站犯了一個非常常見的錯誤,同一個網頁,有兩種以上的url形式,我們收錄的,是不帶index.aspx的那種。建議參考《百度搜索引擎優化指南》中關于url規范的部分。
問題17:很想知道,在百度眼里什么樣的站是高質量的站,每一個站都是從沒用戶到有用戶,一點點積累起來的。
看完7.19~7.31站長投訴反饋公告,只覺得有種想打人的沖動,不知道是不是普通站長太微小了,百度看不上,還是希望站長們一起放棄百度。
看見大把的垃圾站活著,自己辛辛苦苦做的站卻沒了,知道世界不公平,那也不能沒有游戲規則了吧,你們百度說別人的站是低質量,舉例也說了,那我們不是這樣的站為什么也被K了呢?你們可以把你們認為的低質量都一樣舉例說明出來嗎?
Lee:關于這個問題,請大家換位思考一下,作用一個搜索引擎,所追求的最終目標是為用戶提供最有價值的信息,我們希望大家有一個最低限度的判斷,那就是將自己作為一個普通的用戶,通過搜索引擎搜索到自己的網站時,自己相不相信自己網站上的信息,自己覺不覺得這是互聯網上最好的信息。
我們通過反饋渠道收集到聲稱自己網站是原創、高質量網站的反饋,其中80%多都是無效的,甚至大量聲稱老中醫3-5天治愈絕癥的網站,通篇內容讀不通,聲稱自己是高質量的網站。
如果互聯網非常純潔,那我們也不會花費大量人力去識別網站的質量,也就不會有誤傷。
但互聯網越來越不保險,我們的策略也越來越復雜,只要對技術有一定了解的人,都應該知道誤傷是無法避免的,我們也盡最大的努力將誤傷降到最低限度。
我不知道你的網站是不是真的非常高質量,如果確認,可以通過上面幾帖提到的反饋途徑反饋給我們來追查一下。
問題18:雖然百度的官方不承認有降權蜘蛛的說法,但是例如:123.125.*段的蜘蛛出現,網站在排名、收錄上快照、都會存在異常,是否可以理解為這段IP的蜘蛛雖然不是降權蜘蛛,但可以認為是自身網站出現了問題,百度對于網站的考察和警示呢?是百度對網站所提出的警告呢?
Lee:Baiduspider只有一種,不存在什么降權蜘蛛。不過你所提到的對網站的警示,我們會在站長平臺中考慮。
問題19:我有一個商城類網站,因為會經常產生大量下架商品,產生下架商品后,程序會返回一個只有模板的空頁面,沒有任何具體商品信息。以前我把這些下架商品所在的頁面設置為404,在日志里看到大量的404狀態碼,請問這樣會不會影響我網站的質量,長期下去造成收錄和排名下降?
Lee:我們鼓勵站長為死鏈返回規范的404代碼,不歡迎給死鏈返回200代碼。
只要是正確的返回404,對網站沒有任何影響,還可以減少baiduspider抓取給服務器造成的負擔。如果死鏈數量較多,建議通過站長平臺提交死鏈列表,更高效一些。
問題20:<meta name="keywords" content="百度" /> 內容是否還會參與排名?
Lee:meta keywords早就進歷史的垃圾堆了,我們會直接忽略。
問題21:LEE,問個技術問題。link標簽 rel=canonical 屬性百度支持嗎? 這個問題很關鍵。我們有大量同質的內容。我們想把同質內容標準化。
Lee:canonical 目前不支持,不過已計劃要支持了。
更多網站優化內容請訪問:http://www.siweb.cn/seoblog/
百度關鍵詞排名優化:http://siweb.cn/seo/baidu-seo.html