深度學習“瓶頸”已至,計算機視覺如何突破困局?
機氣林商城智能科技2019提供自動化零件,工控產(chǎn)品,工業(yè)機器人,以及機器人零部件、機械元件以及氣動元件等。機氣林商城,一站式機器人采購平臺
機氣林電商有話說:
導讀: 近期,計算機視覺奠基者之一,霍金的弟子,約翰霍普金斯大學教授Alan Yuille提出“深度學習在計算機視覺領域的瓶頸已至?!?/p>
近期,計算機視覺奠基者之一,霍金的弟子,約翰霍普金斯大學教授Alan Yuille提出“深度學習在計算機視覺領域的瓶頸已至。”
從人工智能的發(fā)展過程看,深度學習是繼專家系統(tǒng)之后人工智能應用的又一重要研究領域,也是人工智能和神經(jīng)計算的核心研究課題之一。Alan Yuille認為,現(xiàn)在做AI不提神經(jīng)網(wǎng)絡,成果都很難發(fā)表了,這不是一個好勢頭。如果人們只追求神經(jīng)網(wǎng)絡的潮流,拋棄所有老方法,也不去想如何應對深度網(wǎng)絡的局限性,那么這個領域可能很難有更好的發(fā)展。
深度學習確實是一個讓人向往的技術,這無可辯駁。其實,神經(jīng)網(wǎng)絡這個概念自上個世紀60年代就已經(jīng)出現(xiàn)了,只是因為最近在大數(shù)據(jù)、計算機性能上面出現(xiàn)的飛躍,使得它真正變得有用起來,由此也衍生出來一門叫做“深度學習”的專業(yè),當前國內(nèi)涉及計算機視覺領域中,越來越多的人工智能公司或者研究機構投身到“深度學習”的浪潮中了,國內(nèi)誕生了如曠視科技、商湯科技、極鏈科技Video++、依圖科技等優(yōu)秀的初創(chuàng)AI企業(yè)。旨在將復雜的神經(jīng)網(wǎng)絡架構應用在數(shù)據(jù)建模上,最終帶來前所未有的準確性。
現(xiàn)在的技術開發(fā)成果也確實讓人印象深刻。計算機現(xiàn)在可以辨識圖片和視頻里的東西都是什么,可以將語音轉化成為文字,其效率已經(jīng)超過了人力范疇。Google也將GoogleTranslate服務中添加了神經(jīng)網(wǎng)絡,現(xiàn)在的機器學習在翻譯水平上已經(jīng)逐步逼近人工翻譯?,F(xiàn)實中的一些應用也讓人大開眼界,就比如說計算機可以預測農(nóng)田作物產(chǎn)量,其準確性比美國農(nóng)業(yè)部還高。機器還能更加精準的診斷癌癥,其準確度也比從醫(yī)多年的老醫(yī)師還要高。
美國國防部高級研究計劃局的一名負責人John Lauchbury形容如今人工智能領域內(nèi)存在著三股浪潮:
第一股浪潮:知識庫,或是類似于IBM所開發(fā)的“深藍”和Waston專家系統(tǒng)。
第二股浪潮:數(shù)據(jù)學習,包括了機器學習和深度學習。
第三股浪潮:情境適應,其中涉及通過利用少量數(shù)據(jù),在現(xiàn)實生活中構建出一個可靠的,解釋型的模型。
從這三股浪潮中,可以發(fā)現(xiàn)目前深度學習算法的研究工作進展不錯。
但深度學習的成果是建立在極其苛刻的前提條件之上。
不管是“監(jiān)督學習”,亦或者是“強化學習”,它們都需要大量的數(shù)據(jù)進行支撐,而且在提前計劃上面表現(xiàn)的非常差,只能做某些最簡單直接的模式辨認工作。
相比之下,人就能夠從極少數(shù)的例子上學到有價值的信息,并且善于在時間跨度很長的計劃,在針對某個情境上有能力自己建造一個抽象模型,并利用這樣的模型來做站在最高處的歸納總結。
以自動駕駛汽車為例,如果你是采用的“監(jiān)督學習路徑”,那么你需要從汽車駕駛的情境中提取海量的數(shù)據(jù),而且還要以明確標示出來的“動作標簽”進行分類挑揀,比如“停止”“行駛”等。再接下來,你還需要訓練一個神經(jīng)網(wǎng)絡,使得它能夠從眼下的情景和所與之相對應的行動之間構建因果聯(lián)系。
如果你是采用的“強化學習路徑”,那么你應該給算法一個目標,讓它能夠獨立地判斷當下最優(yōu)解是什么,電腦在不同的情境之下,為了實現(xiàn)避免撞車的這個動作,它估計要宕機上幾千次。雖然現(xiàn)在已經(jīng)有了比較大的進展,一些神經(jīng)網(wǎng)絡可以從數(shù)據(jù)層面,在相當大的樣本數(shù)量上給出一個驚人的成果,但是它們?nèi)绻麊为毮贸鲆粋€出來,還是不可靠的,所犯的錯誤也是人一輩子都不可能犯的。
數(shù)據(jù)質(zhì)量的不穩(wěn)定性帶來的是不可靠、不準確,以及不公平。同樣,輸出的結果,還得取決于輸入的數(shù)據(jù)質(zhì)量如何。神經(jīng)網(wǎng)絡中如果輸入的數(shù)據(jù)是不準確的,不完整的,那么結果也會錯的離譜,有些時候會造成巨大的損失。不要小看這樣的風險,錯誤的輸出可能會造成極大的危害,以GAN為例,有一些不軌之徒可以以一種人類肉眼無法識別的方式篡改圖片,讓機器錯誤的辨識圖片。篡改的圖片和最初的圖片在我們看來可能是一致的,但是無人駕駛汽車中,汽車就會受到威脅。
深度學習依然存在瓶頸,但目前它要發(fā)揮的作用所需要的前置條件太過苛刻,輸入數(shù)據(jù)對其最終的結果有著決定性的影響。如果要真正達到理想中的人工智能,這些瓶頸還有待于人們的進一步突破
【人氣商品】:
【品牌推薦】:
【最新資訊】:
機氣林商城官網(wǎng)(網(wǎng)址打不開就+V:I99~46O3~9726機氣林)
上海機氣林智能科技有限公司
上海市青浦區(qū)華浦路 500 號
電話:021-59801300