您現在的位置: 网站首頁 / seo優化 / 正文

站點流量異常追查文檔

作者: admin 发布: 2015-1-7 10:5:22 分类: seo優化 閱讀: 次 查看評論

  站點流量異常追查文檔

  百度站长平台几乎每天都会接到站长关于流量的询问,很多站长发现站点流量发生很大变化后,第一反应就是认为自己被误判降权了,情绪激动者不经审核立即开始在公开媒体声讨百度为自己造势。但经过百度站长平台追查,大部分站点都不是真的被惩罚了,或者说并不是因为站点主观原因被惩罚。所以,为了解开站长关于站点流量大幅下滑的谜团,更好地帮助站长查找原因,我们推出了《站點流量異常追查文檔》,希望能给站长一些启示。

  目錄:

  先普及一個概念:什麽是流量異常

  一,運維篇

  1、CDN

  2、robots

  3、UA/IP

  4、安全問題/管理不善

  A、域名泛解析

  B、網站被黑

  C、網頁被挂馬

  D、UGC站點被SPAMMER群發

  二,特征頁分析

  1、分析流程圖

  2、查找特征頁面

  3、分析異常特征

  A、排名無,流量無

  B、部分排名無,流量損失較大

  三,相關因素——外鏈爆增

  1、首頁、频道页、重要页面被恶意投票

  2、用戶創建頁面、垃圾個人頁、內容頁被惡意投票

  3、拼接搜索結果頁漏洞

  4、如何預防産生拼接搜索結果頁

  什麽是流量異常

  來自百度搜索的流量突然間降了50%以上,且是持續性的,即已經連續四至五天流量沒有明顯漲幅變化。如下圖所示:

  

  如果出現上述現象,建議大家從運維角度、頁面特征,以及相關因素來判斷原因。

  

  一、站点流量异常原因之運維篇

  1、CDN

  

  一些網站會使用CDN加速服務,最近每周站長平台都會接到一兩個跟CDN加速問題有關的案例。CDN這裏存在一個問題:不同的CDN服務商在全國分布的節點數不同,站點在使用CDN服務時,同一地區CDN給蜘蛛返回的IP地址要和給用戶的一致。那麽現實情況是,部分CDN服務商出于成本考慮與資源使用率的問題,會在不告知用戶的情況下變更IP地址以節約成本,這樣就導致蜘蛛在去抓的時候,會遇到新IP和老IP的問題,在站點沒有告知更換IP的情況下,蜘蛛會認爲站點目前存在問題,首先是減少抓取量,其次會判斷是否把不可訪問的頁面下掉,這時候就出現了用戶訪問IP與蜘蛛抓取IP不一致的情況。所以建議站點在選擇CDN服務時要選擇穩定的CDN服務商,其次如果IP更換最好通過站長平台抓取診斷工具抓取測試,如果IP不正確可以點擊下圖紅框“報錯”提示給站長平台

  

  2、Robots

  站長應該對robots都不陌生,但爲什麽還要提呢?有這樣一種情況:站點需要更新robots文件,對站內部分內容禁止或放開抓取。但由于操作後沒有檢查是否生效,站長會默認爲已經生效。同時還有一個生效周期的問題,那麽站點需要在百度站長平台提供的robots檢測工具中做一個抓取測試來驗證是否生效。

  如果看到robots內容和你更改後的內容不一致,有幾種可能:第一種可能是網站沒有全面布局,因爲有的站點服務器可能在很多地方,你需要確認robots是否已全部推送;第二種可能是百度沒有及時做更新,可以通過robots檢測工具下方的更新按鈕來告訴百度Robots有變化。

  

  3、UA/IP

  UA封禁一般不会是站点主观错误操作,往往是意外情况,站点在程序中过滤误操作UA封禁,而通常却不知道自己封禁了蜘蛛。只有在逐步的排查才会发现这种概率很小的问题。所以在流量异常中我们在運維篇中把这项列进去,让站点注意这些个细节。

  那么当您的网站不希望Baiduspider访问时,才需要该设置,如果您希望Baiduspider访问您的网站,useragent相关的设置中是否有Baiduspider UA,并及时修改。禁止所有来自百度的抓取: User-agent: Baiduspider Disallow: /

  IP封禁往往是遇到CC攻擊的時候不知道哪些是真百度蜘蛛和仿冒百度蜘蛛而封禁了蜘蛛IP,這裏我們建議通過DNS反查方式讓站點了解哪些是真實蜘蛛,根據平台不同驗證方法不同,如linux/windows/os三種平台下的驗證方法分別如下:

  A、在linux平台下,您可以使用host ip命令反解ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  

  B、在windows平台或者IBM OS/2平台下,您可以使用nslookup ip命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入nslookup xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  C、在mac os平台下,您可以使用dig 命令反解ip来 判断是否来自Baiduspider的抓取。打开命令处理器 输入dig xxx.xxx.xxx.xxx(IP地 址)就能解析ip, 来判断是否来自Baiduspider的抓取,Baiduspider的hostname以 *.baidu.com 或 *.baidu.jp 的格式命名,非 *.baidu.com 或 *.baidu.jp 即为冒充。

  更多內容請訪問:http://zhanzhang.baidu.com/college/articleinfo?id=34

  4、安全/管理不善

  安全問題在站長平台能觀察到的絕大多數屬于管理問題,站點被黑客鑽了漏洞而受到了懲罰等,且懲罰力度與站點漏洞的存在時間成正比。

  A、域名泛解析

  近幾個月域名泛解析是一個非常經典的案例,很多網站由于安全意識薄弱、密碼簡單被黑客鑽了空子,解析出了大量非本站內容的低質頁面,導致百度搜索引擎對整站采取了臨時措施,使得站點流量掉了很多甚至清零。

  B、網站被黑

  網站被黑跟泛解析也有相似之處,網站內有大量的垃圾頁面都是黑客創造出來的,導致受到懲罰,給站點帶來致命的打擊。

  C、網頁被挂馬

  其實這也是被黑的一種,但比被黑釋放垃圾頁面更爲隱蔽,這類案例主要出現在企業網站或者是一些比較小的網站上,黑客直接在頁面上放置展現廣告代碼,而且會判斷來訪者是普通用戶還是蜘蛛,然後區別對待;或者是僅給某一個地區的用戶訪問挂馬頁面,給蜘蛛和其他大部分所在地展現正常頁面等,這些其實都是非常隱蔽的行爲,沒有用戶舉報站點也很難發現,但百度搜索引擎無法容忍這樣的頁面出現在搜索結果裏,自然這些站點會受到懲罰。

  D、UGC站點被SPAMMER群發

  最後說UGC站點,所有以用戶貢獻內容的站點在審核機制上一定要加強防範,目前平台能夠接到的不少案例都是UGC站點存在監管不利,導致有大量的垃圾內容在線上,當垃圾內容與正常內容的比例達到一定阈值,就有可能整站被百度搜索引擎懲罰。

  二、站点流量异常原因之特征頁分析

  1、分析流程圖

  

  流程圖會按照三步來讓站點確認到底是正常下跌還是異常下跌,在此站長第一步首先要找到特征頁面

  2、查找特征頁面

  首先说什么叫特征页面,即流量下滑比较多的页面,这类页面又是结构化页面,内容不同页面所抢的关键词不同,但页面框架结构是统一的。比如关键词“北京旅游、上海旅游、天津旅游”对应A类页面,那么在此类关键词消失后,这个A类页面也没有流量,于是A类页面就是我们说的特征页面,要看看A类页面发生过哪些变化。首先找出昔日的流量对比,过去一段时间与现状的差距。其次回忆一下近期此类页面有怎样的改动,这些改动是否存在運維篇的问题,那么观察几日后给出流量损失范围。

  3、分析異常特征

  從流量損失範圍大體可以判定兩種情況:

  A、排名無,流量無

  上面所講的關鍵詞排名無,網站流量無——很有可能是受到了懲罰,可能是局部懲罰也可能是站點整體被懲罰。具體原因可以參見之前推出的石榴算法及綠蘿2.0算法,當然大量算法我們沒有公布出來,各位可以參考《百度網頁搜索質量白皮書》,觀察站點是否存在此類問題。參考鏈接:

  百度綠蘿算法2.0更新公告

  石榴算法—低質量頁面終結者

  對買賣鏈接行爲的提醒,出售鏈接同樣會受打擊

  B、部分排名無,流量損失較大

  例如,特征頁面A本對應多個關鍵詞,有些關鍵詞下已找不到A,而有些仍然可以找到,基本可以說明該頁面並不在懲罰範圍內,可能是百度算法在做調整。而如果所有關鍵詞下都難以找到A頁面,那極有可能是被懲罰了。

  三、站点流量异常原因之相关因素:外鏈爆增

  

  站长平台在接到很多案例中,有很大一部分是因为外链异常而流量受到较大影响的,在此先给大家说一下外链工具显示数据来源及规则:外链工具是统计站点在一段时间内,链接到您网站的URL、被链接网页URL、锚文本等内容,站长可以通过这些数据识别和判断哪些是符合预期的外链投票、哪些是不符合预期的。那么如果发生外鏈爆增时绝大部分站点是不符合预期的增长,这里我们从三种情况出发来剖析和解决此类问题。

  1、首頁、频道页、重点页面被恶意投票

  A、此類事件主要是在被鏈接URL被莫名的站點大量投票,如果遇到此種現象一定要注意,很有可能是惡意投票行爲,目的是通過大量垃圾站點對站點的投票,降低站點在百度搜索引擎中的評價。

  B、此類問題的措施只能是站點加大拒絕力度,從而屏蔽掉無意義的投票鏈接

  2、用戶創建頁面,垃圾個人頁,內容頁

  A、UGC站點尤其要關注這點,之前談過要加大審核及處理力度,杜絕讓用戶創建垃圾內容、個人頁面。不良分子爲了排名的效果更好,會再對這些垃圾頁進行投票。這裏特別要提醒的是,如果站點審核力度及時就不會發生此類事情,只有站點內容長期處于無人管理的狀態時才會出現如此問題。

  B、此類問題的措施只能是站點加大審核力度,關閉垃圾頁面,同時拒絕這些垃圾投票的域名及站點

  3、拼接搜索結果頁漏洞

  拼接搜索結果頁是通過地址欄參數變化而動態創建出的頁面,例如下圖這些頁面,TITLE中往往包含了過多的垃圾詞,提交給搜索引擎後,爲了排名效果再對這些頁面進行投票而産生了過量的外鏈投票。

  

  

  此類頁面不良分子就是鑽了拼接搜索結果頁的title、description可以顯示拼接代碼中的垃圾內容。理論上百度搜索引擎會拒絕收錄這樣的頁面,但畢竟站點數量巨大還會出現遺漏。所以如果想解決此類問題,可以在百度站長平台反饋中心反饋下述內容:

  1)舉例已收錄被鏈接頁面

  2)給出搜索此類頁面關鍵詞的鏈接

  3)描述頁面收錄量及外鏈量(給出外鏈分析中的數據)

  4、如何預防産生拼接搜索結果頁

  上面也說了,拼接搜索結果頁是不良分子鑽了可以控制頁面的title、description內容而制造了大量的頁面,從而進行投票的行爲。那麽如果在拼接搜索結果頁中禁止這些無效參數展示在Title和Description中自然就沒有這個漏洞,下圖以攜程爲例,拼接頁面中的title和description都是固定內容,無論頁面參數怎麽變化這些都不會改變。

  

  具體內容可以參考之前平台發布的相關文章《防止網站內部搜索被他人惡意利用

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 百度官方資料  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表