您現在的位置: 网站首頁 / 問答中心 / 正文

解析篇——VIP大講堂(上海站)QA集錦

作者: admin 发布: 2014-12-9 21:53:13 分类: 問答中心 閱讀: 次 查看評論

  上周爲站長朋友們獻出了VIP大講堂上海站中關于SPIDER抓取建庫方面的QA內容,本周繼續將解析方面的QA內容奉上。

  問:我們的頁面本身就很大,會不會解析不出來?

  答:頁面本身很大倒沒問題,趕集、安居客這些量都很大,沒有問題。我剛才說的例子,你每次都follow出來新鏈接,隨機把後面的參數去掉都不影響這個網頁的正常訪問,這種肯定有問題的。

  問:剛才說對URL的長度有要求,那對每一段、就是目錄名的長度有沒有要求

  答:沒有要求,我們是要求url從www開始到結束,總長度不超過1024個字節。

  問:站內重複內容是怎麽判斷的?文本內容一樣結構不一樣,算不算重複?

  答:算重複

  問:假設是整個頁面全是Flash,如果我把一些欄目或者最新的內容隱藏掉,不影響美觀隱藏掉,如果用hidden屬性能不能提取出來?CSS可不可以?

  答:hidden可以提出來,但如果是注釋就不會管。CSS不可以。

  問:頁面大小不超過1兆,是指頁面壓縮以前還是以後。

  答:指頁面壓縮以後,不要超過1兆

  問:我網站的信息已經過時了,但網頁返回的是200,會受懲罰?爲什麽呀?

  答:用戶在搜索結果裏點了你的結果,導流導到你的網站,但沒什麽可看的,對用戶沒有用,百度當然不喜歡。

  問:現在我們很多網站,爲了讓用戶覺得有意思,內容沒了就放一張圖片,寫一些有意思的話,什麽“工程師去哪啦”之類的,對百度友好不?

  答:最好不要用,我知道站點是想讓百度當內容死鏈來識別,但內容死鏈識別起來是有准確率和召回率風險的。

  問:我們團購網站的確會有過期團購的頁面,會受懲罰嗎

  答:如果量特別大、點擊量很大的話肯定會有懲罰的。有些可以當內容死鏈被分析出來,如果分析不出來,會被一些其他的策略挖出來,會有這樣的問題。

  問:剛才說資訊內容頁面,上面有個發布時間好,那如果頁面上沒有時間呢?

  答:那我們往往是按當時抓取的時間來做判定。

  問:評論裏面時間重要嗎。

  答:百度更重視主體內容的時間,評論不算主體內容。

  問:我們是個平台,很多産品其實只是一個型號變更了,其實顔色都是一模一樣的,對蜘蛛而言僅僅只是幾個字符,會被識別爲重複嗎

  答:如果是一個産品的結構化信息的話,應該不會被認爲是重複。如果你是簡單內容摘要的方式進行介紹的話,可能會存在重複問題。

  問:靜態URL和動態URL區別大嗎?

  答:不大,我們現在認爲靜態和動態都一樣的,因爲從url上面他能夠識別出來,但是抓取回來的東西不太一樣。所以現在認爲無論你是靜態還是動態,我們都認爲同樣都是url來對待。

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 百度VIP大講堂  百度官方資料  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表