您現在的位置: 网站首頁 / seo優化 / 正文

AlphaGo、深度學習及SEO

作者: admin 发布: 2016-2-16 23:28:41 分类: seo優化 閱讀: 次 查看評論

  1月28号,Nature杂志报道,Google旗下公司DeepMind(以前收购的)开发的一款名为 AlphaGo的人工智能,在2015年10月份以5:0战胜欧洲围棋冠军,老职业二段樊麾。一石激起千层浪,人工智能最难战胜人类的最后一个游戏,失守了,人工智能已经达到职业围棋水平了。

  一時間,深度學習、機器學習、AlphaGo、神經網絡等等這些概念鋪天蓋地。Google不是搜索引擎嗎?這些東西和搜索,和SEO有什麽關系?說說我的理解。

  先聲明一下,下面涉及的深度學習等概念,很可能我的理解和表述是非常粗淺的,甚至是錯誤的。雖然我也是理工出身的,所學專業聽起來還挺艱深,微波與電磁場,但那是25年前的事啦。現在看技術內容只能稀裏糊塗了解個大概了。想了解准確細節的讀者,還是網上搜一下比較保險。

  什麽是深度學習?

  深度学习(deep learning)是机器学习的(machine learning)一个分支领域。

  多层人工神经网络(artificial neural networks)模拟接近了人脑处理信息时从低层到高层不断抽象化的过程。深度学习正是将低层特征分层抽象化为高层特征表达,原来的目的就是模拟多层神经网络。神经网络研究几十年了,沉寂了一段时间,近几年深度学习才又挖掘出其潜力。

  深度学习的一个重要特点是,它不需要人工输入或标注特征,而是通过海量数据自动学习特征,也就是所谓无监督学习(unsupervised learning)。所以大数据和深度学习也搅合在一起。

  深度学习另一个特点是与具体领域无关(domain independent),既可以用在围棋,也可以用在搜索或其他方面。所以才会有这篇帖子。

  Google、Facebook、百度在深度學習領域都有很多進展,尤其是在人臉識別、圖像識別、語音識別、翻譯等方面。這方面報道挺多的。

  深度學習用在搜索引擎上是個什麽情況?

  以前經典的搜索排名算法是由工程師選擇用哪些頁面特征(也就是排名因素)來排名,各個特征占多少權重,這些都是工程師決定並寫在程序裏的,然後測試效果,再修正。

  以深度學習爲基礎的排名算法完全不是這麽個過程。深度學習的方法是,用大量數據對程序進行訓練,由程序自己學習應該用哪些特征來排名。換句話說,告訴深度學習排名算法,這些已知頁面是高質量的,那些已知頁面是低質量的,那到底高質量頁面應該有什麽特征呢?也就是面對新頁面時該用哪些特征來排名?各種特征占多大比重?讓算法自己琢磨去。

  這些學習數據哪裏來的?兩個明顯的來源可能是:

  1)Google現有經典算法做測試時的數據。搜索引擎正式上線新算法前都會做測試的,給部分用戶返回新算法結果,然後監測點擊率、跳出率、停留時間、頁面互動性、轉化率、變換查詢詞率等數據,以判斷新算法有效性。

  2)Google有不少人工質量評估員,而且老早就有,他們會評測特定頁面是高質量還是低質量。這些評估數據不直接影響所評估頁面的排名,但會顯示出算法有效性。這些數據簡直就是現成的深度學習訓練數據。去年11月Google剛剛公開了最新版本的人工質量評估指南,建議大家下載來看看。

  現在問題來了,這種方法靠譜嗎?

  如前所述,深度學習算法就是個黑箱啊,完全不用人工告訴它找什麽特征,而是它自己學習該找什麽特征,會找出什麽特征誰也不知道,有些特征可能人類壓根兒不會想到。很可能以後搜索引擎工程師也不知道排名因素有哪些了,也不知道一個頁面爲什麽會有好的排名。再想一遍:連搜索引擎工程師也不知道排名因素是什麽。這和我們的常識、直覺是不是都有相當沖突了呢?

  這麽整,能行嗎?

  事實恰恰表明,能行。AlphaGo能戰勝圍棋職業二段,乍看起來,職業二段離人類頂尖高手還有很大差距。可換個角度想,這世界上能達到職業二段的人類有幾個?記得前些天看報道,能贏職業二段的人類不超過1千個。

  這種水平,可以快樂地完虐我們幾十億人。我打了5,6年羽毛球,我前幾天剛剛9歲的女兒,在經過4個月每周一次的業余訓練後,我要贏她必須很認真費勁了。這只是新加坡,只是一個業余教練,每周兩個小時,我無法想象,我們普通愛好者與職業水平的差距那是有多大。

  站長、SEO們,少說這世界上大概得有個幾百萬吧?所以我們就是普通人。現在告訴我們,判斷我們頁面質量的算法,其判斷力目前是所有人類的前1千名,年底可能是所有人類前10名。這是什麽感覺?這是有點絕望的感覺--就別想著鑽空子啦。

  也許熊貓更新或企鵝更新就用了深度學習?

  深度學習真的有這麽厲害嗎?

  其實深度學習近兩年已經取得不少以前不敢想象的成就。

  2012年,Google Brain项目使用大量图片对神经网络进行训练,系统经过训练后能辨别出:这是一只猫。重要的是,没有输入猫长什么样这类信息,是系统自己“领悟”了猫这个概念。

  2015年,深度學習算法的人臉識別率達到了99.47%,甚至超過了人眼。

  AlphaGo將在3月份挑戰韓國九段、世界冠軍李世石。雖然我基本不懂圍棋,但樂觀預測一下吧,我覺得AlphaGo會贏。原因是,半年過去了,AlphaGo的訓練量又增加了幾千萬局棋譜,其棋力的增長不是線性的啊。

  深度學習對SEO意味著什麽?

  就我個人來說,深度學習對SEO的影響目前還不明朗,還需要一段時間觀察、思考。以後有想法了再來交流。現在需要做好心理准備,搜索引擎判斷頁面質量的准確度可能會有質的飛躍,鑽空子的難度將大大提高。

  估计还是有做中文SEO的心里在问,这对百度SEO有卵用啊?多写写百度啊?那么请思考百度为什么花大价钱成立百度深度学习研究院?肯定不是闲的了。百度把深度学习领域最牛的人物之一、Google Brain项目创建人吴恩达都给挖来了。这个吴恩达高中还是在新加坡上的呢,莱佛士书院,第一名校。这里有吴恩达讲机器学习的近20小时的线上教程。有互联网真好,不然怎么能轻易看到、听到大师亲自讲课。

  最后来点阴谋论。就在今天,Google搜索的最高负责人,Amit Singhal,辞职了。几年前,他对排名算法中使用机器学习是有些排斥的。接替他的是谁呢?John Giannandrea,原Google人工智能部门的负责人。难道由工程师设计规则的算法已成过去,以深度学习为代表的人工智能算法要全面登上舞台了?

  作者: [email protected]

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: seo  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表