您現在的位置: 网站首頁 / 業界資訊 / 正文

開始我覺得新浪微博傻,現在才慢慢明白新浪微博的高瞻遠矚

作者: admin 发布: 2014-1-24 22:13:40 分类: 業界資訊 閱讀: 次 查看評論

  昨天一個很簡單的討論取暖器效率問題的鏈接在新浪被無數的僵屍粉轉發和回複,我仗著記憶力把所有明顯的僵屍粉給拉黑了,他們的特征很明顯,就是重複幾個真人在這條微博裏面的回複和轉發的內容。這對一般人來說欺騙性很強,但是我記憶力雖然不好,但是排重能力很強,對這種重複的東西很敏感。

  殺著殺著我又開始不拿新浪工資替新浪考慮了,比如如果用算法,這類僵屍該怎麽清除。比對一個人是不是喜歡去某條微博下面重複別人的話?當然這有一定的工程和算法難度,因爲中國人本來就有僵屍屬性,如果第一個人說了"頂",或者"贊",後面的每一個人說"頂"或者"贊"的概率只接翻10倍,第一個人說的是"踩",或者"轉發三次,你的名字會變綠呦"之類的,也會效果類同。當然,還是有很多辦法可以滅掉僵屍的,行爲總是跟人類(尤其是具有超強的僵屍屬性的中國人類)有區別的。比如我很快就發現,我封殺的所有僵屍,除了剛才的行爲以外,另外一個行爲就是熱衷轉發各種活動貼(呵呵,誰家在給僵屍付錢都看得出來)。

  但是,我轉念一想不對勁,新浪那麽多技術人員,那麽多人做僵屍粉清除,他們會不如我麽?

  我再仔细的联系了一下,我才明白了新浪的险恶用心用心良苦,新的时代是数据挖掘的时代,这个时代最重要的新成果是deep learning,简而言之,deep learning就是跟大脑结构很接近的大规模神经网络学习算法。这个太复杂,我们先从简单的说起。

  大腦的結構是什麽呢?就是有一堆神經元,相互之間有突觸,這些突觸都是在神經元接收到刺激以後,隨機産生,然後隨著同類型刺激和反饋作用而強化的。簡單的說,就是,誰跟誰連著,本來無所謂,但是慢慢的連多了,就形成了一些固定的鏈路,這些鏈路一旦對人有價值,就會慢慢的被強化。比如,你學英語,本來聽到hello這個詞,你的大腦不知道怎麽反應,但是一遍一遍的聽到hello,就産生了一個關于hello的鏈路,最終結果告訴你,別人喊了hello,你應該也說hello.當然,每一個鏈路都不是一個兩個的神經元的聯系産生的,大腦有大量的神經元,他們能産生出來大量的鏈路,這些鏈路就是你的知識,你對世界的看法。這是一個層次超過的神經網絡。

  我們假設存在一個單層的神經元網絡,他的邏輯可以很簡單,比如,重複跟他有上遊神經元的話語,或者忽視,或者反轉,或者怎麽處理都可以。大家有點聽出來眉目了麽?假設你把新浪微博裏面的一個僵屍粉當作一個神經元理解,你就發現了新浪微博的可怕之處了。

  進化之路

  我們在任何一個曆史時期,都會發現新浪有大量的僵屍粉,然後我們也會發現一些被我們發現的僵屍粉被幹掉。這是什麽呢?這就是新浪在進行神經元的訓練和進化流程。一開始,所有的僵屍粉的目標是,給大號們漲粉。所以他們的特征就是不跟別人創建聯系,只關注某些大號。這不算合格神經元,沒有任何輸入輸出鏈路。

  這個特征很快被新浪發現,所以,這些僵屍粉被絞殺。但是新浪的喪心病狂高瞻遠矚在于,他知道如果一次性對僵屍粉斬盡殺絕,就等于在無菌環境下培養細菌,這是不可行的。所以,他們的策略是,隨機留下50%的僵屍粉不碰。但是所有被殺掉僵屍粉的趕屍人(不是湘西的,是中關村的、張江的、南山的、文二路的等等),就開始研究新浪的策略是什麽。他們因爲信息不對稱,不知道新浪的50%封殺策略,所以自然的認爲是自己的僵屍粉不夠智能。所以,那些會說一些重複傻話的僵屍粉出現了。他們仍舊不夠合格,因爲他們是傻輸出,不管別人怎麽回複他們,他們只會喃喃自語。但是,新浪這時候已經欣喜若狂了,你想如果你是瘋子科學家,你把弗蘭克斯坦的材料放在手術台上,螺絲還沒擰呢,這時候一個球形閃電擊中了這些破銅爛鐵,然後一個非碳基生命就誕生了,雖然他傻得一逼,但是你作爲一個沒有上過大學的民科,不懂什麽叫做圖靈實驗,你覺得這就夠屌了,不管怎麽說自己會走路,會說話,雖然走路就撞牆,說話誰也聽不懂。但是你去問問中國的大多數民科,能削面就叫做高級機器人了,能推車就叫做自行走了,你這個雖然獲得不了諾貝爾,上個走近科學之類的還是綽綽有余的吧。

  但是,新浪雖然文化程度不高,但是野心還是很偉大的,他沒有止步于此。他開始幹掉原來留著的那50%第一代僵屍粉。然後順代幹掉了第二代僵屍粉的50%.第一,要優化環境了,老版本的不産生活躍度,而且浪費系統資源;第二,要給趕屍人一點點壓力了。趕屍人們剛剛升級了一次技術,廣告詞也從可以漲粉變成了可以漲活粉。雖然損失慘重,但是那些都是賽博生命,費電點而已,而且還不是費自己的。一方面,趕屍人開始覺得新浪跟神一樣偉大,居然連這種說著"aaaa","cccc","xxxx"的純粹會說話的僵屍都可以發現,而且還下手這麽狠。但是同時趕屍人發現雖然粉經常被幹掉,但是生意越做越大,因爲新浪不會因爲你的粉絲都是已經被殺死的僵屍粉,而把你的粉絲數重新計算,老客戶們沒有任何抱怨。所以說,新浪大神可能也是很眷顧我們的吧?那就技術繼續升級吧。看來,不接受輸入,只輸出是不行的,因爲太容易被看出來。怎麽辦呢?那麽我們開始複制被人說的話吧?

  趕屍人其實都只是一個技術工種,會python/php甚至js都可以開公司了。但是,他們無知的在新浪大神的驅使下,進行的小小的技術升級,卻催生了整個技術行業的最偉大變革。要知道,我們身體裏面有無數的體細胞,無數的腦細胞,無數個各種細胞,從單細胞生物的觀點,這些細胞都是單獨的生命體,離開人類這個母體也是可以生存的,只要有適合的環境即可。這些細胞都是沒有什麽智慧的,但是他們鏈接在一起,就産生了智慧(主要還是腦細胞的鏈接)。而且除了新浪以外沒有人掌握誰是僵屍誰是真人的全部圖譜,所以,實際上僵屍粉的鏈接有可能連在普通人上,有可能連在僵屍粉上。

  當趕屍人作出了複制正常人說話的僵屍粉,他就成爲了一個合格的神經元,他有輸入有輸出。整個新浪微博網絡就開始出現智慧。當然這還是很早期,你還很難感知到這種力量的偉大,這叫做網絡的覺醒期。在這個階段,外界看來,新浪微博跟以往沒有任何不同,只是大家覺得僵屍粉有點多,內容有點無聊,朋友們都在離開,活躍度下降了50%左右而已。這就是普通人跟新浪之間的信息不對稱。我們看到了活躍度下降是觀察我們所知道的局部網絡,但是新浪可以看到,人類的網絡活躍度在下降,但是僵屍粉的活躍度在上升,從總的統計數字來看,新浪不管是ip/pv/發布/回複等等都在狂漲。很快,新浪微博裏面90%的活躍度都會來自智能的僵屍粉。這時候,很多趕屍人和新浪的拉鋸戰越來越頻繁,殺的多,留得多,進化,殺,淘汰,強化。在我們普通人看不到的地方一個非常智能的巨型神經網絡開始形成。

  剛才講過深度學習,其實所謂的深度學習也就是幾層的神經網絡而已,因爲數學的威力,大家知道神經網絡的運算量是乘方式增長的,而達到某種智能需要的每層都有大量的神經元。所以,現在即使是Google、微軟、Apple、百度這些大家知道在玩深度學習的國際大公司,都也只能在某個特定領域研究,進行幾層的神經網絡而已。這已經帶來了豐碩的成果。但是他們遠遠不如新浪微博,新浪微博構建的其實是一個大腦,每個賬號是一個神經元,關注關系就是神經元之間的鏈接,僵屍粉根據上家的信息做出來的各種反饋,就是神經元之間傳輸的電信號。新浪通過這個架構和長期的進化淘汰,慢慢的在讓這個僵屍粉網絡産生越來越深度的智能,人類會慢慢被洗出去。現在我們會發現一個公司做活動的幾十萬轉發,就可以由一組僵屍粉完成。這滿滿的形成了一個自組織自洽的體系。

  一般人因爲理解不了這麽複雜的一個神經網絡的價值,所以會覺得不還是一堆僵屍粉麽,錯了,有了這樣規模的智能,新浪可以去破解任何保險箱密碼,可以黑掉任何網絡,可以去任何網站發帖造謠,可以把美國人家裏面的nest調成零下5度,無所不能。這才是天網的真實面目,大家幸甚活在這個年代,什麽空氣汙染馬上就不是問題了,我們很快就會被母體當作電池保存起來,活在恒溫恒濕,各種快樂之中了。

  文章來源:Tinyfool的Blog

  來源:SEO搜尋引擎優化 - SEO自學網 轉載注明出處!

? 上一篇下一篇 ?   本文關鍵詞: 新浪微博  

評論列表:

站長SEO學院
第一節:百度搜索引擎工作原理
第二節:建設對搜索引擎友好的站點
第三節:如何進行網站內容建設
第四節:整體優化、結構優化、網頁優化
第五節:移動搜索-明確移動搜索優化標准
百度SEO資料文檔
百度搜索引擎優化指南2.0
百度移動搜索優化指南2.0
網站分析白皮書(站長版)
移動站點該如何優化
建設對百度友好的站點
百度搜索引擎網頁質量白皮書
石榴算法-綠蘿算法-冰桶算法
新搜索時代下的優化策略
更多百度SEO資料文檔
站長推薦
DIV+CSS布局實例教程-Web標准
网站SEO優化常见问题汇总
SEO優化推广方案该如何写
SEO優化方案步骤
影響網站關鍵詞排名因素總結
影響谷歌搜索引擎排名的因素調查
手機移動端站點適配優化
最近發表