【邁向云端 加速落地】英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)深度解讀:機(jī)器人4.0應(yīng)該怎么走?

【邁向云端 加速落地】英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)深度解讀:機(jī)器人4.0應(yīng)該怎么走?

 

2019年將是5G元年,也將是5G競(jìng)爭(zhēng)真正開(kāi)始的一年。那作為硬科技代表的機(jī)器人行業(yè)要怎么利用5G這個(gè)技術(shù)紅利加速服務(wù)機(jī)器人的落地?在2019中國(guó)機(jī)器人產(chǎn)業(yè)發(fā)展論壇主論壇上,英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)就此做了深度剖析,帶來(lái)“邁向云端融合的服務(wù)機(jī)器人4.0時(shí)代”的精彩演講。

 

宋繼強(qiáng)院長(zhǎng)從IT的背景切入到機(jī)器人領(lǐng)域,他認(rèn)為AI、5G通訊、計(jì)算的模式等都有對(duì)機(jī)器人領(lǐng)域潛在巨大的貢獻(xiàn)和可能性。(以下內(nèi)容由英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)現(xiàn)場(chǎng)速記整理)

 

 

什么是4.0時(shí)代?

 

首先,宋繼強(qiáng)院長(zhǎng)分析了什么是4.0。在2017年的時(shí)候,IDC國(guó)際數(shù)據(jù)集團(tuán)和英特爾一起做了一個(gè)關(guān)于機(jī)器人3.0時(shí)代的白皮書(shū),里面把機(jī)器人的發(fā)展分成了三個(gè)時(shí)代:第一個(gè)時(shí)代是電氣化時(shí)代,主要讓機(jī)器人做固定自動(dòng)化編程的事情。這個(gè)時(shí)候的機(jī)器人沒(méi)有什么感知能力。到了2.0時(shí)代有很多傳感器可以放進(jìn)來(lái),數(shù)字化是它的紅利,促進(jìn)了自動(dòng)化生產(chǎn)流程的發(fā)展。第三個(gè)階段就是2015年開(kāi)始,得益于2012年開(kāi)始的深度學(xué)習(xí)的大發(fā)展,可以讓識(shí)別技術(shù)更便宜可用。這個(gè)階段促進(jìn)了語(yǔ)音交互和視覺(jué)作為輸入,進(jìn)而利用這些技術(shù)讓智能服務(wù)機(jī)器人具備了對(duì)環(huán)境的感知能力和一定的由簡(jiǎn)單感知觸發(fā)的操作能力。

 

工業(yè)機(jī)器人從全球范圍來(lái)看一直處于持續(xù)上升的趨勢(shì),而服務(wù)機(jī)器人從2015年才開(kāi)始快速增長(zhǎng)。到2018年以后,它的增長(zhǎng)速度開(kāi)始變緩。我們看出,當(dāng)人工智能開(kāi)始便宜可用的時(shí)候,服務(wù)機(jī)器人開(kāi)始快速增長(zhǎng),同時(shí)也產(chǎn)生了一些市場(chǎng)效益。但是,基于深度學(xué)習(xí)的AI帶來(lái)的語(yǔ)音和視覺(jué)識(shí)別紅利已經(jīng)逐漸消耗得差不多了,后面要怎么辦?

 

我們預(yù)計(jì)2015年到2020年是3.0的時(shí)代,那2020年以后怎么辦?如果我們想進(jìn)入到下一個(gè)級(jí)別要解決什么樣的問(wèn)題?

我們先看看現(xiàn)在的3.0時(shí)代,我們解決了一些什么問(wèn)題?那就是讓機(jī)器人擁有了感知能力,機(jī)器人用視覺(jué)識(shí)別人臉、語(yǔ)音交互等。但認(rèn)知能力還比較薄弱,它沒(méi)有記憶,沒(méi)有對(duì)場(chǎng)景的理解,缺乏知識(shí)。AI本身的能力目前也是受限的,比如它受到攻擊怎么辦?數(shù)據(jù)的安全,還有物理安全怎么辦?這都是需要解決的問(wèn)題。所以對(duì)AI不能光利用它感知的一個(gè)層面,要用它的高級(jí)能力來(lái)提升服務(wù)機(jī)器人的個(gè)性化自然交互能力。

 

5G能促進(jìn)服務(wù)機(jī)器人真正規(guī)模化部署

 

如果套用互聯(lián)網(wǎng)的三級(jí)火箭發(fā)展模式,第一階段要有一個(gè)好的場(chǎng)景,可以吸引很多人來(lái)用,把用戶基礎(chǔ)擴(kuò)大;第二階段,做這件事情的能力一定要達(dá)到預(yù)期;

第三階段,規(guī)?;?,才能商業(yè)化,從而降低成本。

 

有人會(huì)說(shuō),現(xiàn)在的機(jī)器人很多已經(jīng)跟云連上,在利用通訊網(wǎng)絡(luò)遠(yuǎn)程管理、解決問(wèn)題。但此時(shí)解決問(wèn)題主要是局部感知,很多時(shí)候看不到周邊的情況,它的AI能力也是有限的,需要遠(yuǎn)程的人對(duì)它進(jìn)行支持,這個(gè)其實(shí)是不夠的。

 

因?yàn)槲覀兛吹浆F(xiàn)在機(jī)器人很多是做簡(jiǎn)單識(shí)別,或者說(shuō)受限語(yǔ)音的功能庫(kù)。如何讓它達(dá)到一個(gè)從感知到理解再到?jīng)Q策的閉環(huán)?這個(gè)機(jī)器人的大腦怎么樣讓它運(yùn)轉(zhuǎn)的更好?這個(gè)腦到底放在哪里?要放多大?它在設(shè)備和云之間怎么放?只有一個(gè)大腦在中國(guó)北京的數(shù)據(jù)中心?還是分布式大腦?這中間什么樣的關(guān)系?這中間都需要融合。以現(xiàn)有的模式還不能滿足要求。

 

拿一個(gè)關(guān)鍵場(chǎng)景養(yǎng)老來(lái)說(shuō),它要求機(jī)器人能夠自主移動(dòng)、觀測(cè)場(chǎng)景、了解人、對(duì)人有個(gè)性化的交互和服務(wù)、又是大規(guī)模的用戶基礎(chǔ)。養(yǎng)老問(wèn)題在未來(lái)30年一定會(huì)爆發(fā)出來(lái),這一定要靠科技,靠智能家居去組合機(jī)器人,組合其他技術(shù)去完成。

 

如果想讓機(jī)器人真的服務(wù)于大規(guī)模的場(chǎng)景,缺的就是4.0里面要解決的問(wèn)題,就是對(duì)前端和云端的一個(gè)很好的組合連接,并且讓它能夠規(guī)?;渴?。這個(gè)組合連接在于怎么把要完成任務(wù)的記憶場(chǎng)景的知識(shí)和常識(shí)很好的組合起來(lái),所以需要把云端的大腦分布在從云到端的各個(gè)地方,充分利用邊緣計(jì)算去提供更高性價(jià)比的服務(wù)。這些恰恰是5G帶來(lái)的紅利。

 

5G通訊在中國(guó)已經(jīng)開(kāi)始在實(shí)驗(yàn)做組網(wǎng)了。做服務(wù)機(jī)器人產(chǎn)業(yè)的要知道這件事情的發(fā)生,思考怎么更好的利用5G帶來(lái)的紅利,去加快系統(tǒng)能力的升級(jí),把云和端更好的組合起來(lái)。

 

所以服務(wù)機(jī)器人4.0可以這樣劃分:1.0是自動(dòng)化的時(shí)代、2.0是數(shù)字化、3.0智能協(xié)作、4.0自主的服務(wù)。在某些特定的情況下它需要遠(yuǎn)程做一些決策輔助,但是它90%,甚至95%的情況是可以自己做事情的。

 

服務(wù)機(jī)器人4.0時(shí)代關(guān)鍵技術(shù)

 

3.0時(shí)代,服務(wù)機(jī)器人就可以做到一些物體識(shí)別、人臉識(shí)別,但是4.0需要加上一個(gè)自適應(yīng),為什么要自適應(yīng)?比如用深度學(xué)習(xí)做物體識(shí)別、人臉識(shí)別的時(shí)候需要很多的數(shù)據(jù)來(lái)源。但是真正到家庭場(chǎng)景的物體識(shí)別,沒(méi)有那么多數(shù)據(jù),所以必須通過(guò)少量數(shù)據(jù)去建立識(shí)別能力,自己去找到不同的位置,不同的角度做訓(xùn)練,這是一個(gè)底層的基礎(chǔ)。

 

這些就是4.0要做的,首先對(duì)三維環(huán)境語(yǔ)義的理解,要知道它是什么,同時(shí)要把它往上升,把看到的這些信息變成知識(shí),這樣存儲(chǔ)就變得更加合理,而且可搜索,可查詢,可關(guān)聯(lián),也可推理。那么應(yīng)用層就可以根據(jù)這個(gè)知識(shí)和觀測(cè)到到現(xiàn)場(chǎng)場(chǎng)景做很多智能的提醒,去尋找一些物品,進(jìn)行行為檢測(cè)。比如老人要出門(mén),機(jī)器人的知識(shí)庫(kù)告訴他,今天預(yù)報(bào)要下雨,但是檢測(cè)到老人沒(méi)有帶傘,然后查詢傘的位置,機(jī)器人就可以把傘送到老人手里。這都是結(jié)合內(nèi)部知識(shí)和外部的一些情況做的決策。

 

知識(shí)圖譜在整個(gè)學(xué)術(shù)界和工業(yè)界越來(lái)越受到重視。獲得圖靈獎(jiǎng)的杰夫?辛頓教授在加入谷歌的時(shí)候就說(shuō)要建一個(gè)知識(shí)圖譜給全世界用,我相信這里肯定包含不了中國(guó),中國(guó)的知識(shí)圖譜不是老外可以建立起來(lái)的。阿里研究院發(fā)布2019年的十大技術(shù)趨勢(shì)里面也專(zhuān)門(mén)提到了知識(shí)圖譜的重要性。這是人工智能邁向下一個(gè)階段的必由之路,也是必做之事。

 

面向服務(wù)機(jī)器人4.0HERO系統(tǒng)平臺(tái)

 

全部人類(lèi)知識(shí)包括兩部分,穩(wěn)定的知識(shí)和動(dòng)態(tài)知識(shí)。

 

穩(wěn)定知識(shí)是什么?就是固定下來(lái),大家都知道的常識(shí)性知識(shí)。比如說(shuō)天要下雨了要帶雨傘,這是一個(gè)確定的知識(shí)。而某些領(lǐng)域知識(shí),比如在音樂(lè)、美術(shù)、飲食、餐飲方面的知識(shí)也是穩(wěn)定的。

 

動(dòng)態(tài)知識(shí)是指什么?比如賣(mài)一個(gè)機(jī)器人到家里,在沒(méi)進(jìn)去之前根本不知道家里的場(chǎng)景地圖,這些是要逐漸建立的。還有群體性知識(shí),老人、女性、男性,男性還得分小學(xué)生、中學(xué)生。機(jī)器人要來(lái)處理不同群體的知識(shí)。

 

不同的建立知識(shí)圖譜的方法都是可以在系統(tǒng)里使用的。個(gè)性化知識(shí)圖譜可以分布在從終端到云端,中間加一個(gè)邊緣。

 

 

英特爾中國(guó)研究院目前在做的面向服務(wù)機(jī)器人4.0HERO系統(tǒng)平臺(tái),最下面是一個(gè)計(jì)算平臺(tái),上面是軟件層,3.03.0的一層,包括一些運(yùn)動(dòng)導(dǎo)航、規(guī)劃、操作。4.0更多的是怎么去做自適應(yīng)的交互,做三維場(chǎng)景的語(yǔ)音理解和個(gè)性化的知識(shí)圖譜。

 

除此之外,安全也非常重要,當(dāng)我們?cè)谟脩舻募依锼鸭芏嗟男畔ⅲㄒ曈X(jué)數(shù)據(jù)、空間數(shù)據(jù)等,用戶不希望這些數(shù)據(jù)都上傳到云端大腦,其實(shí)也沒(méi)有必要。我們就可以在邊緣或者設(shè)備本身對(duì)這些數(shù)據(jù)做保障。

 

在機(jī)器人本體方面要保證某些重要的隱私或者物理安全相關(guān)的程序和代碼安全,網(wǎng)絡(luò)側(cè)、邊緣端就是對(duì)用戶的數(shù)據(jù)做好保護(hù),被授權(quán)的人才能看到,有些數(shù)據(jù)不會(huì)上傳到云端上面去,到云端需要通過(guò)一些安全存儲(chǔ)鑒別。

 

在這個(gè)HERO的平臺(tái)上可以把空間智能快速提升,比如說(shuō)做一個(gè)建立場(chǎng)景的三維圖,如果用開(kāi)源的軟件去做速度比較慢,現(xiàn)在加速了算法以后非常的流暢。

 

最后還是期望能夠共同的和產(chǎn)業(yè)里的各種伙伴一起把云端深度融合的事情做好,真正把機(jī)器人能夠推到規(guī)?;l(fā)展,真正進(jìn)入現(xiàn)實(shí)場(chǎng)景為大家服務(wù)。