您現在的位置: 网站首頁 / seo優化 / 正文

《百度搜索引擎網頁質量白皮書》官方完整版下載

作者: admin 发布: 2014-8-7 20:55:15 分类: seo優化 閱讀: 次 查看評論

百度搜索引擎網頁質量白皮書

  百度搜索引擎網頁質量白皮書完整版內容如下:

  1 引言

  网页质量是一个网页满足用户需求能力的衡量,是搜索引擎确定结果排序的重要依据。 在网页资源内容与用户需求有相关性的基础上,内容是否完整、页面是否美观、对用户是否 友好、来源是否权威专业等因素,共同决定着网页质量的高低。

  对于搜索引擎来说,给用户呈现的网页质量直接影响了最终的搜索效果和用户的需求满 足;而对于广大的站长来说,整体网页质量的提高有助于在搜索引擎中获得良好的排序和展 现,从而吸引更多用户,获得更多流量。

  百度搜索综合用户对不同网页的实际感受,制定了一套评判网页质量的标准,基于这个 标准,在百度搜索的收录、排序、展现环境进行调整,给高质量的网页更多的收录、展现机 会,同时对一些影响用户体验、欺骗搜索引擎的恶劣低质网页进行打压。

  目前互联网上的网页,仅有 7%可以达到高质量标准,百度作为最大的中文搜索引擎, 希望从互联网生态角度出发,跟站长们一起努力建立良好的互联网生态圈,更好地为网民服 务,也让内容优质的网站得到更好的发展。

  此外,搜索引擎之前相對封閉,一直以來,站長需要通過不斷的摸索發現搜索引擎對網

  页的判断标准,指导站点内容的建设。此次推出《网页质量白皮书》,目的是开放百度在网 页质量方面的判断标准,给站长提供参考,希望有更多、更优质的内容产生,满足搜索引擎 用户的需求,同时为站长带来流量,实现共赢。

  2 衡量网页质量的维度

  百度搜索引擎在衡量网页质量时,会从以下三个维度综合考虑给出一个质量打分。下面 会一一介绍这些影响网页质量判断的维度特征:

  內容質量

  浏覽體驗

  可訪問性

  一个访问流畅,内容质量高且浏览体验好的网页具有较高的质量;反之,任何一个维度 出现问题,都会影响网页的整体质量。下面我们具体介绍下这三个维度。

  2.1 衡量网页质量的维度——内容质量

  网页主体内容是网页的价值所在,是满足用户需求的前提基础。百度搜索引擎评价网页 内容质量主要看其主体内容的好坏,以及主体内容是否可以让用户满意。

  不同类型网页的主体内容不同,百度搜索引擎判断不同网页的内容价值时,需要关注的 点也有区别,如:

  首頁:导航链接和推荐内容是否清晰、有效。

  1、 文章页:能否提供清晰完整的内容,图文并茂更佳。

  2、 商品页:是否提供了完整真实的商品信息和有效的购买入口。

  3、 问答页:是否提供了有参考价值的答案。

  4、 下载页:是否提供下载入口,是否有权限限制,资源是否有效。

  5、 文档页:是否可供用户阅读,是否有权限限制。

  6、 搜索结果页:搜索出来的结果是否与标题相关。

  百度搜索引擎考量网页内容质量的维度非常多,最为重要的是:成本;内容完整;信息 真实有效以及安全。下面我们通过举例来感受一下百度搜索引擎是如何对网页的内容质量进 行分类的,请站长对比自己站点的页面,站在搜索引擎和用户的角度为自己打分:

  1、內容質量好:

  百度搜索引擎認爲內容質量好的網頁,花費了較多時間和精力編輯,傾注了編者的經驗和專業知識;內容清晰、完整且豐富;資源有效且優質;信息真實有效;安全無毒;不含任何作弊行爲和意圖,對用戶有較強的正收益。對這部分網頁,百度搜索引擎會提高其展現在用戶面前的機率。例如:

  專業醫療機構發布的內容豐富的醫療專題頁面;

  資深工程師發布的完整解決某個技術問題的專業文章;

  專業視頻網站上,播放清晰流暢的正版電影或影視全集頁面;

  知名 B2C 网站上,一个完整有效的商品购买页;

  權威新聞站原創或經過編輯整理的熱點新聞報道;

  經過網友認真編輯,內容豐富的詞條;

  問答網站內,回答的內容可以完美解決提問者的問題。

  2、內容質量中:

  內容質量中等的网页往往能满足用户需求,但未花费较多时间和精力进行制作编辑,不 能体现出编者的经验和专业知识;内容完整但并不丰富;资源有效但质量欠佳;信息虽真实 有效但属采集得来;安全无毒;不含作弊行为和意图。在互联网中,中等质量网页其实是一 个比较大的数量集合,种类面貌也繁杂多样,百度搜索引擎在评价这类网页时往往还要考虑 其它非常多因素。在这里,我们仅部分举例来让各位感受一下:

  論壇類網站裏一個普通的帖子;

  一個普通的問答網頁;

  沒有進行任何編輯,直接轉載其它網站的新聞;

  無版權信息的普通電影播放頁

  采集知名小說網站的盜版小說頁。

  3、內容質量差:

  百度搜索引擎认为主体内容信息量较少,或无有效信息、信息失效过期的都属于内容质 量差网页,对用户没有什么实质性的帮助,应该减少其展现的机会。同时,如果一个网站内 该类网页的占比过大,也会影响百度搜索引擎对站点的评级,尤其是 UGC 网站、电商网站、 黄页网站要尤其重视对过期、失效网页的管理。例如:

  已下架的商品頁,或已過期的團購頁;

  已過有效期的招聘、交易頁面;

  資源已失效,如視頻已刪除、軟件下載後無法使用等。

  4、沒有內容質量可言:

  没有内容质量可言的网页指那些制作成本很低,粗制滥造;从别处采集来的内容未经最 起码的编辑整理即放置线上;挂木马等病毒;含有作弊行为或意图;完全不能满足用户需求, 甚至含有欺骗内容的网页。例如:

  內容空短,有很少量的內容,卻不能支撐頁面的主要意圖;

  問答頁有問無答,或回答完全不能解決問題;

  站內搜索結果頁,但沒有給出相關信息

  除上述网页外,欺骗用户和搜索引擎的网页在无内容质量可言集合里占很高比例。百度搜索引擎对作弊网页的定义是:不以满足用户需求为目的,通过不正当手段欺骗用户和搜索引擎从而获利的网页。目前互联网上这部分网页还属少数,但作弊网页的价值是负向的,对 用户的伤害非常大,对这类网页,搜索引擎持坚决打击态度。

  2.2 衡量网页质量的维度——浏览体验

  不同質量的網頁帶給用戶的浏覽體驗會有很大差距,一個優質的網頁給用戶的浏覽體驗應該是正向的。用戶希望看到幹淨、易閱讀的網頁,排版混亂、廣告過多會影響用戶對網頁主體內容的獲取。在百度搜索引擎網頁質量體系中,用戶對網頁主體內容的獲取成本與浏覽體驗呈反比,即獲取成本越高,浏覽體驗越低。面對內容質量相近的網頁,浏覽體驗佳者更容易獲得更高的排位,而對于浏覽體驗差的網頁,百度搜索引擎會視情況降低其展現的機率甚至拒絕收錄。

  影響用戶浏覽體驗好壞的因素很多,目前百度搜索引擎主要從內容排版、廣告影響兩方面對網頁進行考量。

  內容排版

  用户进入网页第一眼看到的就是内容排版,排版决定了用户对网页的第一印象,也 决定了用户对内容获取的成本。

  廣告影響

  百度搜索引擎理解网站的生存发展需要资金支持,对网页上放置正当广告持支持态 度。网页应该以满足用户需求为主旨,最佳状态即“主体内容与广告一起满足用户 需求,内容为主,广告为辅”,而不应让广告成为网页主体。

  下面我们通过举例来感受一下百度搜索引擎是如何对网页的浏览体验进行分类的,站长 可以据此对比检验自己站点的浏览体验如何:

  1、浏覽體驗好:

  頁面布局合理,用戶獲取主體內容成本低,一般具有以下特征:

  排版合理,版式美觀,易于閱讀和浏覽;

  用戶需要的內容占據網頁最重要位置;

  能夠通過頁面標簽或頁面布局十分清楚地區分出哪些是廣告;

  廣告不搶占主體內容位置,不阻礙用戶對主要內容的獲取;

  2、浏覽體驗差:

  页面布局和广告放置影响了用户对主体内容的获取,提高了用户获取信息的成本,令用 户反感。包括但不仅限于以下情况:

  正文內容不換行或不分段,用戶閱讀困難;

  字體和背景顔色相近,內容辨別困難;

  頁面布局不合理,網頁首屏看不到任何有價值的主體內容;

  廣告遮擋主體內容;或者在通用分辨率下,首屏都是廣告,看不到主體內容;

  彈窗廣告過多;

  影響閱讀的浮動廣告過多

  點擊鏈接時,出現預期之外的彈窗;

  廣告與內容混淆,不易區分;

  2.3 衡量网页质量的维度——可访问性

  用户希望快速地从搜索引擎获取到需要的信息,百度搜索引擎尽可能为用户提供能一次 性直接获取所有信息的网页结果。百度搜索引擎认为不能直接获取到主体内容的网页对用户 是不友好的,会视情况调整其展现机率。

  百度搜索引擎会从正常打开、权限限制、有效性三方面判断网页的可访问性,对于可以 正常访问的网页,可以参与正常排序;对于有权限限制的网页,再通过其它维度对其进行观 察;对于失效网页,会降权其展现机制甚至从数据库中删除。

  1、可正常訪問的網頁

  無權限限制,能直接訪問所有主體內容的網頁。

  2、有權限限制的網頁

  此類網頁分爲兩種:打開權限和資源獲取權限

  1)打開權限

  指打開網頁都需要登錄權限,沒有權限完全無法看到具體內容,普通用戶無法獲取或獲取成本很高,百度搜索引擎會降低其展現機率。不包括以登錄爲主要功能的網頁。

  2)資源獲取權限

  指获取网页主要内容,如文档、软件、视频等,需要权限或者需要安装插件才能获得完 整内容。此时会分三种情况:

  提供優質、正版內容的網站,由于內容建設成本很高,盡管查看全文或下載時需要權限或安裝插件,但屬于用戶預期之內,百度搜索引擎也不認爲權限行爲對用戶造成傷害,給予與正常可訪問頁面相同的對待。

  對于一些非優質、非正版的資源,來自于用戶轉載甚至機器采集,本身成本較低,內容也不獨特,用戶獲取資源還有權限限制——需要用戶注冊登錄或者付費查看,百度搜索引擎會根據具體情況決定是否調整其展現。

  还有一些视频、下载资源页,也许自身资源质量并不差,但需要安装非常冷门的插件才能正常访问,比如要求安装“xx 大片播放器”,百度搜索引擎会怀疑其有恶意倾向。

  3、失效網頁

  往往指死链和主体资源失效的网页。百度搜索引擎认为这部分网页无法提供有价值信息, 如果站点中此类网页过多,也会影响百度搜索引擎对其的收录和评级。建议站长对此类网页 进行相应设置,并及时登录百度站长平台,使用死链提交工具告知百度搜索引擎。

  失效網頁包括但不僅限于:

  404、403、503 等网页;

  程序代碼報錯網頁;

  打开后提示内容被删除,或因内容已不存在跳转到首頁的网页;

  被删除内容的论坛帖子,被删除的视频页面(多出现在 UGC 站点)

  3 互联网网页资源现状

  CNNIC2014 年年初发布的《中国互联网络发展状况统计报告》中称:截至 2013 年 12 月,中国网页数据为 1500 亿,相比 2012 年同期增长了 22.2%。2013 年中国单个网站的 平均网页数和单个网页的平均字节数均维持增长,显示出中国互联网上的内容更为丰富:平 均网站的网页数达到 4.69 万个,较去年同期增长 2.3%。

  为了保证搜索质量、提高用户使用满意度,百度搜索引擎每周都会进行网页质量抽样评 估。然而从近一年的评估数据中我们发现,优质网页的绝对数量非常少,且几乎没有增长; 普通网页的占比在下降,相应的,质差网页的比例却有明显上涨。截至 2014 年 5 月,统计 数据显示,在百度网页搜索发现的海量网页中,优质网页仅占 7.4%,质差网页高达 21%, 其余普通网页为 71.6%。

互联网网页资源现状1

  百度网页搜索通过一系列筛选、识别、分析、赋权等工作,努力将更多优质网页呈现在 用户面前,每天约打击上万质量差网站,涉及网页达百万量级,尽可能减少质量差网页给用 户带来的干扰。从下图 2014 年 5 月的网页展现分析数据显示,目前展现在用户面前的网页 质量分布中,优质网页占比为 40%,质量差网页降为 11%——虽然这个变化已经非常明显, 但百度网页搜索还是希望能和广大站长一起努力,将质量差占比降到更低。

互联网网页资源现状2

  上述質量差網頁包括低質網頁和垃圾網頁兩部分,低質網頁問題分布如下圖所示:

互联网网页资源现状3

  从上图我们看出,目前低质网页中最严重的问题即因广告过多、占据网页主要位置以及 超预期弹窗带来的浏览体验差,内容空短、网页需要权限才能获取资源和过期信息也是低质 网页的重要组成部分。

  質量差網頁中除了低質網頁外,無任何質量可言的垃圾頁面的問題分布如下圖所示:

互联网网页资源现状4

  死链对用户、网站和搜索引擎来说都已没有存在的意义,垃圾网页中占比最大。其次是 对用户和搜索引擎伤害巨大的作弊网页,资源无效、有问无答和不相关搜索结果页这些极大 浪费用户时间的网页也是搜索引擎不希望呈现给用户的。

  4 百度搜索引擎给站长的建议

  上面介绍了百度搜索引擎对网页质量的判定标准,与这些标准相应的,站长在实际工作 中应该遵循几项原则:

  設計網頁時主要考慮的是用戶,而非搜索引擎

  永遠將用戶體驗放在首位

  根據用戶需求制作內容

  多考慮如何讓自己的網站具有獨特價值

  將目光放長遠,濫放廣告弊大于利

  及時刪除低質內容

  不要企圖用任何方式欺騙用戶和搜索引擎

  來源:百度站長平台 點擊下載完整版文檔《百度搜索引擎網頁質量白皮書》

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 百度搜索引擎網頁質量白皮書  百度官方資料  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表