您現在的位置: 网站首頁 / seo優化 / 正文

如何批量檢測被百度收錄的死鏈的方法

作者: admin 发布: 2015-2-28 19:16:34 分类: seo優化 閱讀: 次 查看評論

  前段時間服務器被入侵,挂了很多博彩之類的黑頁,而且全部被百度收錄。

  現在把漏洞補好了,但刪除黑頁文件以後成了死鏈,要怎麽讓百度刪除收錄呢?

  在網上找了一下,似乎只有檢測網址是否被收錄的工具,而沒有檢測收錄的是不是死鏈的工具。

  自己理清了下思路,找辦法找出了所有被收錄的死鏈,並寫下這篇文章。

  不知道有沒有更好的方法,大家可以告訴我,先分享給大家,如果有大神請忽視或者告訴我更好的方法,一起學習交流吧。

  下面教程開始

  先在百度找到xenu可以模擬爬蟲爬取所有連接,我下載了個漢化版。

  我們先用這個工具查詢所有被收錄的頁面。

  打開軟件,填入簡版百度site網站地址,之所以用簡版是可以減少鏈接查詢時間和內容。(請把xxx.bizcn.com換成你的網址)

  http://www.baidu.com/s?ie=utf-8&tn=baidulocal&wd=site%3Axxx.bizcn.com

  批量检测被百度收录的死鏈的方法

  等待檢測完成。

  批量检测被百度收录的死鏈的方法

  點擊導出爲制表符分隔的文件。

  批量检测被百度收录的死鏈的方法

  導出的文件,我們可以看到格式是:網址+空格+狀態碼

  批量检测被百度收录的死鏈的方法

  那麽寫一個正則,把需要的網址提取出來就行,比如www.baidu.com下的404頁面就是

  /http:\/\/www.baidu.com(.*?)\s404/i

  (以http://www.baidu.com開頭,\s代表空格,404,/i代表匹配大小寫)

  不會正則怎麽辦?

  批量检测被百度收录的死鏈的方法

  爲了方便大家,我把文件作了修改,大家只要把head改成標致性開頭,state改成狀態碼就行,file改成導出的文件路徑就行。

  head怎麽改,舉個例子,

  你的網站是http://www.baidu.com/abc.html,那麽你就寫http://www.baidu.com/

  你的網站是http://abc.baidu.com/abc.html,那麽你就寫http://abc.baidu.com/

  把正則寫入php,在php環境下運行get.php。那麽結果就出來了。

  批量检测被百度收录的死鏈的方法

  這時你只需要全選,複制到一個txt文件,上傳到網站空間,再到百度站長平台死鏈提交填入文件路徑就行就可以。

  批量检测被百度收录的死鏈的方法

  我們知道,思路是通過爬取找出所有被收錄的鏈接,然後按條件列出來而已。

  這樣的話,只要把開頭輸入的site網址改一下,也可以查詢其他搜索引擎的收錄。

  把正則改一下,可以獲得如標題等其他內容。在此就不一一敘述。

  原創:http://blog.vg歡迎來小博逛逛

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 死鏈  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表