和谷歌搶人挖微軟墻角 Facebook AI實驗室5年逆襲之路

 機(jī)氣林商城智能科技2019提供自動化零件,工控產(chǎn)品,工業(yè)機(jī)器人,以及機(jī)器人零部件。機(jī)氣林商城,一站式機(jī)器人采購平臺

  機(jī)氣林電商有話說:

 

 堅持5年能得到什么?

 

  馬云說,“對于一家創(chuàng)業(yè)公司而言,能堅持做5年,就一定是‘?!摹!?/p>

 

  同理,對于一家傳統(tǒng)互聯(lián)網(wǎng)公司而言,能堅持5年用新技術(shù)為原有業(yè)務(wù)改頭換面,更牛。

 

  而從2013年12月10日對外正式宣布成立AI實驗室FAIR至今,F(xiàn)acebook真真正正做AI正好5年時間了。這家在科技創(chuàng)新上素來以“落后、跟隨”之姿發(fā)展的公司,如今也正在期待著憑借AI再創(chuàng)互聯(lián)網(wǎng)社交傳奇。

 

  傳統(tǒng)社交數(shù)據(jù)的爆發(fā)式增長

 

  “沒有深度學(xué)習(xí),現(xiàn)在的Facebook就無法正常運營,因為它已經(jīng)深入到Facebook的方方面面了?!盕AIR創(chuàng)辦者&首席AI科學(xué)家、卷積神經(jīng)網(wǎng)絡(luò)發(fā)明者之一的Yann LeCun在總結(jié)Facebook這5年發(fā)展時說道,“但實際上,在2013年之前,F(xiàn)acebook高層并不贊同成立這個實驗室?!?/p>

 

  眾所周知,F(xiàn)acebook以傳統(tǒng)社交互聯(lián)網(wǎng)起家。而因初初創(chuàng)立時,扎克伯格還是哈佛大學(xué)的一名學(xué)生,所以這個社交平臺一開始也只在哈佛大學(xué)的學(xué)生中被廣泛熟知。

 

 

  得益于互聯(lián)網(wǎng)的快速發(fā)展,以及社交這一“有點就可擴(kuò)散至面”的特性,F(xiàn)acebook很快便成為了美國高校學(xué)生日常社交的常用工具。

 

  隨著用戶范圍的擴(kuò)大、開辟廣告業(yè)務(wù)以及接入第三方服務(wù),到2009年年初,F(xiàn)acebook的用戶數(shù)就已超1.5億,用當(dāng)時扎克伯格的話說,“如果Facebook是一個國家,那么它將是世界上人口第八多的國家,比日本、俄羅斯和尼日利亞等國都多?!?/p>

 

  但1.5億的用戶量和主要以圖片為信息承載的社交模式,顯然還不足以讓扎克伯格為數(shù)據(jù)優(yōu)化及處理憂心,而素來“后知后覺”的公司高層最關(guān)心也依舊是產(chǎn)品線的拓展。直到2013年的一次宴會,這一現(xiàn)狀才有所改變。

 

  其實,F(xiàn)acebook并不是不重視技術(shù)的發(fā)展,只是真的很“后知后覺”。這點,從歷年來的F8大會就可以窺見一二。

 

  2007年,F(xiàn)acebook召開了第一屆F8大會,推出了面向開發(fā)者的社交圖譜。次年,又推出了社交工具Facebook Connect。但實際上,這些只是基于Facebook現(xiàn)有業(yè)務(wù)所做的調(diào)整,而非技術(shù)創(chuàng)新性突破。

 

  也因此,2009年的F8大會因沒有新進(jìn)展而停辦。

 

  此后兩年時間里,雖然其做了多番調(diào)整,相繼推出了新社交插件、Timeline、開放式圖譜協(xié)議、圖譜API等。但依舊可以看出,這些技術(shù)及產(chǎn)品不具備創(chuàng)新改革的能力。

 

  為此,2013年的F8大會再次停辦了,這對才上市不久的Facebook,是個不小的打擊。

 

  相關(guān)數(shù)據(jù)統(tǒng)計,到2013年年初,F(xiàn)acebook全球日活躍用戶數(shù)已然超過了6.5億。加之第三方服務(wù)、廣告業(yè)務(wù)、視頻直播、Instagram等產(chǎn)品線的發(fā)展,以及各產(chǎn)品間數(shù)據(jù)共享需求的增加,傳統(tǒng)互聯(lián)網(wǎng)技術(shù)儼然開始無法繼續(xù)支撐下去了。

 

 

  而此時,諸如谷歌、微軟、蘋果等同類互聯(lián)網(wǎng)公司,早已開始向科技公司轉(zhuǎn)型,如谷歌早在2010年就成立了谷歌X實驗室,更是在2011年成立了谷歌大腦。而蘋果更是在2011年就推出了智能語音助理Siri,將機(jī)器語音學(xué)習(xí)從實驗室?guī)У搅舜蟊姷纳钪小?/p>

 

  此時的Facebook,顯然已經(jīng)落后了。

 

  “Facebook CTO Mike Schroepfer此前一直不同意成立AI實驗室,但事實顯示,AI對于Facebook未來發(fā)展越來越重要?!盠eCun回憶說,“在去扎克伯格家赴宴時,我和他詳談了AI的重要性。幸運的是,扎克伯格當(dāng)時也認(rèn)為‘開放創(chuàng)新’應(yīng)該成為Facebook發(fā)展的重點?!?/p>

 

  “之后沒多久,F(xiàn)AIR就成立了。”

 

  追趕深度學(xué)習(xí)

 

  從成立之初,F(xiàn)AIR的定位便是一個負(fù)責(zé)研究技術(shù)的部門,其研究重點也大多聚焦在解決推理、預(yù)測、規(guī)劃、無監(jiān)督學(xué)習(xí)等底層技術(shù)問題上。

 

  當(dāng)然,技術(shù)研發(fā)離不開人才,但Facebook于AI方面的積累幾乎為0。所幸,扎克伯格肯投入,除LeCun外,5年時間里,F(xiàn)AIR還相繼吸引來了包括VC維和SVM的締造者Vladimir Vapnik,提出隨機(jī)梯度下降法的Léon Bottou,做出高性能PHP虛擬機(jī)HHVM的Keith Adams、ICCV 2017最佳論文得主何凱明等在內(nèi)的多位深度學(xué)習(xí)頂級專家,甚至還用7位數(shù)年薪與Deepmind展開了搶人大戰(zhàn)以及大力挖角微軟。截止到目前,F(xiàn)AIR的團(tuán)隊規(guī)模就已擴(kuò)大至了近200人。

 

  如此大的人才投入下去,成果自然也不會少。

 

  · Caffe2

 

  沿襲Caffe的大量設(shè)計,2017年4月FAIR推出了兼具擴(kuò)展性、高性能和便攜性的Caffe2,一個輕量化和模塊化的深度學(xué)習(xí)框架,可在移動設(shè)備上進(jìn)行訓(xùn)練和預(yù)測。

 

  · PyTorch

 

  2017 年初,F(xiàn)AIR發(fā)布了基于Python開發(fā)的PyTorch。因其集成了Caffe2和ONNX 的模塊化、面向生產(chǎn)的功能,提供從研究原型到生產(chǎn)部署的無縫路徑,并與云服務(wù)和技術(shù)提供商進(jìn)行深度集成,在GPU速度和內(nèi)存使用率方面都極具優(yōu)勢。

 

  今年10 月,F(xiàn)acebook還舉辦了第一屆 PyTorch開發(fā)者大會,來自加州理工學(xué)院、FAIR、fast.ai、谷歌、微軟、英偉達(dá)、特斯拉等多位行業(yè)頂級專家均有參與。

 

  · FastText

 

  為了加快機(jī)器文本分類和學(xué)習(xí)速度,2016 年FAIR推出FastText,可對數(shù)十億個單詞量文本進(jìn)行快速分類。截止到目前,F(xiàn)astText已經(jīng)可以對157 種語言的文本進(jìn)行分類,也被應(yīng)用于諸如“消息回復(fù)建議”等的場景中。除此之外,F(xiàn)astText還和DeepText相結(jié)合,進(jìn)行自然語言理解和翻譯。

 

  · Fairseq機(jī)器翻譯模型

 

  基于CNN,F(xiàn)AIR推出了集速度、準(zhǔn)確性和學(xué)習(xí)能力為一體的NMT神經(jīng)機(jī)器翻譯架構(gòu)——Fairseq,其速度較谷歌的RNN提高了9倍。

 

  而為了避免需要翻譯大量的數(shù)據(jù)集(通常稱為語料庫),F(xiàn)AIR在去年發(fā)布了MUSE,通過監(jiān)督和無監(jiān)督式學(xué)習(xí)的方式,學(xué)習(xí)和翻譯110種雙語詞典以及自我構(gòu)建新的雙語詞典。

 

  · bAbI

 

  長期記憶能力不足是神經(jīng)網(wǎng)絡(luò)的缺陷之一,為此,F(xiàn)AIR開發(fā)了一個支持內(nèi)存網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)模型,它能夠參考此前的對話內(nèi)容做記憶性回答。比如,在學(xué)習(xí)了《魔界》這部電影的劇情后,其就能概括出故事的最后戒指是出現(xiàn)在了Mount Doom中。

 

  而為了讓模型有足夠的數(shù)據(jù)學(xué)習(xí),F(xiàn)AIR還構(gòu)建了一個問答任務(wù)數(shù)據(jù)集——bAbI,包含數(shù)千個對話示例,可以提高模型理解文本的準(zhǔn)確性。

 

  · Mask R-CNN

 

  作為一個以圖片分享為核心的社交平臺,每天上傳至Facebook上的圖片數(shù)據(jù)量是極為龐大的。而為了在合適的時間為用戶展示合適的圖片,F(xiàn)AIR通過理解圖片中的不同部分的像素,以理解圖片的特殊含義,比如分析人手部動作的具體含義,實現(xiàn)圖像實例分割。

 

  目前,Mask R-CNN已被應(yīng)用于檢測劣質(zhì)內(nèi)容等場景中。未來,F(xiàn)acebook還將會應(yīng)用它為AR、智能相機(jī)等業(yè)務(wù)賦能。

 

  5年堅持下的“煥新”

 

  可以看到,5年時間,F(xiàn)acebook在AI,尤其是深度學(xué)習(xí)基礎(chǔ)技術(shù)研發(fā)上已初具規(guī)模。當(dāng)然,任何高端技術(shù)在走出實驗室之前,都無法創(chuàng)造實際價值。為此,在FAIR技術(shù)成果轉(zhuǎn)化過程中,F(xiàn)acebook還成立了其第二大人工智能實驗室AML,旨在研究AI技術(shù)的具體應(yīng)用。

 

  一般而言,如這樣分成兩個部門應(yīng)該存在著很大的溝通交流問題,不過很顯然,F(xiàn)acebook在這方面做的很好。所有來自FAIR的預(yù)測推理、視覺、語義理解技術(shù)都被廣泛應(yīng)用到Facebook的各個產(chǎn)品中,如其圖片濾鏡已可以跟Snapchat媲美,不同用戶主頁News Feed上呈現(xiàn)的內(nèi)容是由機(jī)器圖像分析后決定的以及清除垃圾數(shù)據(jù)、內(nèi)容及郵件翻譯、智能攝像監(jiān)控、簡化版數(shù)字助理“M”等,都是AI賦能的結(jié)果。

 

  而在Facebook近年大力發(fā)展的VR/AR業(yè)務(wù)方面,上述中多項技術(shù)都有所應(yīng)用。甚至還有消息稱,F(xiàn)acebook內(nèi)部已經(jīng)在緊鑼密鼓的研發(fā)語音助理,代號為 “Aloha”。

 

 

  可以說,AI已經(jīng)成為了互聯(lián)網(wǎng)社交外,F(xiàn)acebook最核心的部分。從2014年開始,即便在今年遭遇重大數(shù)據(jù)泄露問題的情況下,F(xiàn)8大會再未出現(xiàn)停辦的情況,也或多或少都有較為亮眼的新產(chǎn)品或技術(shù)推出。Facebook也終于在2016年發(fā)布的“十年版圖”中,將AI、VR等技術(shù)放在了戰(zhàn)略核心的位置上。

 

 

  就連那位此前一直反對成立人工智能實驗室的Mike Schroepfer也終于承認(rèn),“AI是Facebook未來三大重點發(fā)展領(lǐng)域之一,其余兩個是虛擬現(xiàn)實和讓更多的人連上網(wǎng)絡(luò)。”

 

  成果來之不易,堅持更是難上加難。雖然較之于谷歌、微軟這樣在底層技術(shù)方面素來領(lǐng)先的公司而言,F(xiàn)acebook目前還未能有突破性領(lǐng)先成果,但5年時間里,F(xiàn)AIR的多項成果及相關(guān)應(yīng)用也足以說明,F(xiàn)acebook正在試圖,或者說期待憑借AI再創(chuàng)其在互聯(lián)網(wǎng)時代的社交傳奇。

 

  就連LeCun都說,“在FAIR創(chuàng)辦之前,F(xiàn)acebook做的都是一些短期的工程項目,最長的項目周期也不過6個月?!庇纱丝梢云诖?,下一個5年,F(xiàn)AIR或許能給我們帶來更多的驚喜。

  【人氣商品】:

  機(jī)器林商城產(chǎn)品大推薦

  【品牌推薦】:

  機(jī)氣林電商爆款大曝光

  【最新資訊】:

   機(jī)氣林商城官網(wǎng)(網(wǎng)址打不開就+V:I99~46O3~9726機(jī)氣林)

  上海機(jī)氣林智能科技有限公司

  上海市青浦區(qū)華浦路 500 號

  電話:021-59801300