應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

視覺(jué)語(yǔ)言導(dǎo)航:造就高智商機(jī)器人

2020-07-21 14:06 中國(guó)機(jī)器人網(wǎng)

導(dǎo)讀:世界科技飛速發(fā)展,視覺(jué)語(yǔ)言導(dǎo)航技術(shù)日臻成熟,高智商的機(jī)器人正向我們走來(lái)。

有專(zhuān)家這樣說(shuō),人類(lèi)開(kāi)發(fā)人工智能的未來(lái)目標(biāo),如同現(xiàn)在科幻電影所呈現(xiàn)的場(chǎng)景一樣,智能機(jī)器可以獨(dú)立“看、聽(tīng)、思、行”,具備像人類(lèi)一樣的語(yǔ)言理解系統(tǒng)、視覺(jué)感知系統(tǒng)、自我理解與行動(dòng)的能力,最終成為人類(lèi)的完美“替身”。

如今,世界科技飛速發(fā)展,視覺(jué)語(yǔ)言導(dǎo)航技術(shù)日臻成熟,高智商的機(jī)器人正向我們走來(lái)。

視覺(jué)語(yǔ)言導(dǎo)航,指的是讓智能體跟著自然語(yǔ)言指令進(jìn)行導(dǎo)航,同時(shí)理解指令與視角中可以看見(jiàn)的圖像信息,然后在環(huán)境中對(duì)自身所處狀態(tài)加以調(diào)整、修復(fù),做出對(duì)應(yīng)的動(dòng)作,最終到達(dá)目標(biāo)位置。比如,我們把機(jī)器人放置在一間臥室里,讓它去取放在另一間臥室里的足球。因?yàn)榉块g無(wú)法通視,機(jī)器人需要走出房間,經(jīng)過(guò)走廊、客廳等場(chǎng)所,并通過(guò)推算看到的每一處環(huán)境信息,來(lái)判定下一步行進(jìn)方向,最終定位找到足球。

由此可見(jiàn),視覺(jué)語(yǔ)言導(dǎo)航涉及計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理和自主學(xué)習(xí)三大核心技術(shù)。

先進(jìn)的科技成果往往備受軍事領(lǐng)域的青睞。世界許多國(guó)家已開(kāi)始致力于視覺(jué)語(yǔ)言導(dǎo)航在人工智能上的拓展運(yùn)用,打造智能戰(zhàn)爭(zhēng)機(jī)器,搶占打贏明天戰(zhàn)爭(zhēng)的前沿高地。

計(jì)算機(jī)視覺(jué),讓智能機(jī)器“看清”世界

計(jì)算機(jī)視覺(jué)是一個(gè)跨領(lǐng)域的交叉學(xué)科,包括計(jì)算機(jī)科學(xué)、數(shù)學(xué)、工程學(xué)、物理學(xué)、生物學(xué)和心理學(xué)等。

在人工智能里,計(jì)算機(jī)視覺(jué)可以類(lèi)比人類(lèi)的眼睛,是在感知層上最為重要的核心技術(shù)之一。它能讓智能機(jī)器人靈敏地辨識(shí)“眼”前的一切,并對(duì)捕捉到的圖像數(shù)據(jù)信息進(jìn)行分析識(shí)別、檢測(cè)、跟蹤等。嵌入計(jì)算機(jī)視覺(jué)技術(shù)的智能武器,可以通過(guò)視覺(jué)系統(tǒng),精準(zhǔn)辨識(shí)和區(qū)分目標(biāo)的主次、真?zhèn)?,大大提升作?zhàn)效率。

據(jù)悉,現(xiàn)在技術(shù)人員讀取由無(wú)人機(jī)傳回的戰(zhàn)場(chǎng)態(tài)勢(shì)數(shù)據(jù),每天的工作時(shí)間要超過(guò)10個(gè)小時(shí)。這與瞬息萬(wàn)變的未來(lái)戰(zhàn)場(chǎng)不相適應(yīng)。然而,當(dāng)計(jì)算機(jī)視覺(jué)技術(shù)應(yīng)用于戰(zhàn)場(chǎng)智能偵察裝備前端時(shí),可從海量信息中有效過(guò)濾無(wú)關(guān)信息,向作戰(zhàn)人員提供甄別處理后的視覺(jué)態(tài)勢(shì)圖,指揮決策效率隨之提升。

當(dāng)前,世界發(fā)達(dá)國(guó)家的部分裝備已經(jīng)開(kāi)始應(yīng)用該項(xiàng)技術(shù)。如美軍搭載計(jì)算機(jī)視覺(jué)技術(shù)的iRobot偵察機(jī)器人,就是其中之一。它可以警告作戰(zhàn)人員有伏擊或其他危險(xiǎn),經(jīng)過(guò)處理的態(tài)勢(shì)感知,能夠明確指出目標(biāo)坐標(biāo),或提示危險(xiǎn)等級(jí)。該偵察機(jī)器人還可準(zhǔn)確傳回有價(jià)值的態(tài)勢(shì)視頻與相關(guān)建議指令,縮短己方在戰(zhàn)場(chǎng)上的決策周期,從而把握行動(dòng)優(yōu)勢(shì)。

近年來(lái),俄軍也在大力開(kāi)發(fā)人工智能系統(tǒng)。其自主研制的陸戰(zhàn)機(jī)器人,可在遙控下完成巡邏、偵察、追蹤、阻截、攻擊等任務(wù);形似軍犬、快速奔跑的機(jī)器人,可供火線運(yùn)輸彈藥給養(yǎng);鏟車(chē)式機(jī)器人,可將戰(zhàn)場(chǎng)上的傷員用鏟斗送回后方等。俄軍部分導(dǎo)彈也已裝有人工智能設(shè)備,在導(dǎo)彈飛向預(yù)定目標(biāo)時(shí),若人工智能設(shè)備在途中甄別出價(jià)值更大的目標(biāo),導(dǎo)彈可自動(dòng)轉(zhuǎn)向進(jìn)行攻擊。在這些先進(jìn)的武器中,都能看到計(jì)算機(jī)視覺(jué)的影子。

在民用領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)已陸續(xù)應(yīng)用到安防、自動(dòng)駕駛、醫(yī)療、消費(fèi)等活動(dòng)中。這也是當(dāng)前人工智能細(xì)分領(lǐng)域中發(fā)展最快、應(yīng)用最廣、炙手可熱的技術(shù)之一。

隨著算法的更迭、硬件算力的升級(jí)、數(shù)據(jù)的大爆發(fā),以及5G帶來(lái)的高速網(wǎng)絡(luò),無(wú)論在民用領(lǐng)域還是軍用領(lǐng)域,計(jì)算機(jī)視覺(jué)技術(shù)的應(yīng)用將會(huì)有更大的空間。

自然語(yǔ)言處理,讓智能機(jī)器“聽(tīng)懂”指令

簡(jiǎn)單地說(shuō),自然語(yǔ)言處理就是用計(jì)算機(jī)來(lái)處理、理解以及運(yùn)用人類(lèi)語(yǔ)言(如中文、英文等),它屬于人工智能的一個(gè)分支,是計(jì)算機(jī)科學(xué)與語(yǔ)言學(xué)的交叉學(xué)科,又常被稱(chēng)為計(jì)算語(yǔ)言學(xué)。

自然語(yǔ)言處理的歷史發(fā)展大致經(jīng)歷了3個(gè)階段:20世紀(jì)40年代到20世紀(jì)50年代屬于萌芽期,英國(guó)科學(xué)家艾倫·麥席森·圖靈的計(jì)算機(jī)算法模型為現(xiàn)代計(jì)算機(jī)科學(xué)奠定了基礎(chǔ);20世紀(jì)60年代到20世紀(jì)80年代屬于發(fā)展期,機(jī)器翻譯技術(shù)日漸成熟,并被應(yīng)用于實(shí)際生活;20世紀(jì)90年代后屬于繁盛期,隨著計(jì)算機(jī)計(jì)算量、計(jì)算速度以及萬(wàn)維網(wǎng)的爆炸式發(fā)展,自然語(yǔ)言處理技術(shù)也隨之在更多方面得到長(zhǎng)足進(jìn)步。

眾所周知,語(yǔ)言是人類(lèi)區(qū)別于其他動(dòng)物的根本標(biāo)志之一,沒(méi)有語(yǔ)言,人類(lèi)的思維也就無(wú)從談起。所以,自然語(yǔ)言處理技術(shù)體現(xiàn)了人工智能的最高任務(wù)與境界。也就是說(shuō),只有當(dāng)智能機(jī)器具備了處理自然語(yǔ)言的能力,才算實(shí)現(xiàn)了真正的智能。這樣,人類(lèi)才能與機(jī)器人進(jìn)行無(wú)障礙語(yǔ)言溝通。

如今,自然語(yǔ)言處理在軍事上的應(yīng)用越來(lái)越多。比如,在指揮控制上,通過(guò)高辨識(shí)度的語(yǔ)音系統(tǒng),指揮員可以在作戰(zhàn)中直接用語(yǔ)音實(shí)時(shí)控制雷達(dá)、無(wú)線電、火力等作戰(zhàn)單元,省去繁瑣的指揮流程,集中精力專(zhuān)注于作戰(zhàn)謀劃;在通信保障上,語(yǔ)音增強(qiáng)技術(shù)能夠減弱噪聲對(duì)智能機(jī)器語(yǔ)音信號(hào)的干擾,減少聽(tīng)話人的疲勞和溝通失誤;在人機(jī)交互上,典型代表是人機(jī)口語(yǔ)對(duì)話系統(tǒng),人類(lèi)通過(guò)自然口語(yǔ)與復(fù)雜的智能機(jī)器系統(tǒng)進(jìn)行交互,包括語(yǔ)音識(shí)別、語(yǔ)言理解、語(yǔ)言生成、語(yǔ)音合成、對(duì)話管理和知識(shí)庫(kù)等。

提起“臺(tái)風(fēng)”戰(zhàn)斗機(jī),相信軍迷們都不會(huì)陌生。它是由英國(guó)、德國(guó)、西班牙、意大利聯(lián)合研發(fā)的,最大的技術(shù)亮點(diǎn)是搭載了直接語(yǔ)音輸入系統(tǒng),飛行員可以通過(guò)語(yǔ)音下達(dá)命令,控制戰(zhàn)機(jī)的傳感器、武器以及自衛(wèi)系統(tǒng)。

除此之外,自然語(yǔ)言處理在不少?lài)?guó)家的醫(yī)學(xué)、互聯(lián)網(wǎng)監(jiān)控、執(zhí)法部門(mén)的犯罪預(yù)防以及大數(shù)據(jù)反恐應(yīng)用等領(lǐng)域也很受歡迎,極大地提升了任務(wù)執(zhí)行效率。

自主學(xué)習(xí),讓智能機(jī)器“蛻變”成長(zhǎng)

嬰兒剛出生時(shí),只會(huì)用眼神、哭泣、歡笑與周?chē)娜私涣?。隨著一天天長(zhǎng)大,他們不斷擴(kuò)大接觸觀察范圍,學(xué)會(huì)了走路、說(shuō)話、做游戲等,慢慢建立起自己的思維體系。這就是人類(lèi)的一個(gè)自我學(xué)習(xí)成長(zhǎng)過(guò)程。人類(lèi)大腦擁有860億個(gè)神經(jīng)元、數(shù)萬(wàn)億個(gè)傳遞信息的結(jié)構(gòu)——神經(jīng)突觸。神經(jīng)突觸的重要特征是具有可塑性,即允許神經(jīng)元對(duì)記憶進(jìn)行編碼、學(xué)習(xí)和自我修復(fù)。

人工智能的自主學(xué)習(xí)技術(shù),就是讓機(jī)器人像擁有人類(lèi)大腦、甚至超越人類(lèi)大腦一樣,可以通過(guò)思考學(xué)習(xí)實(shí)現(xiàn)自我完善。在很多人眼里,自主學(xué)習(xí)能力是人工智能與人類(lèi)智能的天然鴻溝。當(dāng)前,伴隨該項(xiàng)技術(shù)的發(fā)展,這一鴻溝正在被逐漸填平。

2019年11月,在捷克布拉格召開(kāi)的第二屆計(jì)算機(jī)視覺(jué)與模式識(shí)別國(guó)際會(huì)議上,評(píng)分第一的論文主要貢獻(xiàn)就是為智能機(jī)器提供了自主學(xué)習(xí)反饋機(jī)制,讓其自主導(dǎo)航時(shí)能夠?qū)崟r(shí)詢問(wèn)自己的知識(shí)儲(chǔ)備。

“這條路對(duì)嗎?”“到目的地了嗎?”……擁有學(xué)習(xí)反饋機(jī)制的智能機(jī)器,根據(jù)預(yù)設(shè)環(huán)境信息與實(shí)際對(duì)比,在行動(dòng)過(guò)程中形成“是非”觀念,讓智能機(jī)器真正變成有思想的“機(jī)器人”。

究其根本,智能機(jī)器“是非觀”的形成,離不開(kāi)強(qiáng)化學(xué)習(xí),這種學(xué)習(xí)方式是當(dāng)今人工智能最熱門(mén)的研究領(lǐng)域之一。

說(shuō)到這里,我們不能不提無(wú)師自通的“圍棋高手”阿爾法元(AlphaGo Zero),它的一鳴驚人也正是利用了新的強(qiáng)化學(xué)習(xí)方式。從一個(gè)對(duì)圍棋“零”儲(chǔ)備的神經(jīng)網(wǎng)絡(luò)開(kāi)始,接著與強(qiáng)大的搜索算法相結(jié)合,神經(jīng)網(wǎng)絡(luò)在博弈中不斷被調(diào)整更新后,與搜索算法再次重新組合,循環(huán)往復(fù),系統(tǒng)性能經(jīng)過(guò)每一次迭代持續(xù)提高,使得神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)越來(lái)越精準(zhǔn),阿爾法元也擁有了“戰(zhàn)無(wú)不勝”的本領(lǐng)??梢哉f(shuō),它也讓人工智能離“像人類(lèi)一樣”更近了一步。

如果把自主學(xué)習(xí)技術(shù)應(yīng)用于軍事無(wú)人裝備上,并按照戰(zhàn)斗力水平劃分等級(jí),那么自主學(xué)習(xí)級(jí)和智能對(duì)抗級(jí)應(yīng)該屬于“王者”級(jí)別。自主學(xué)習(xí)級(jí),就是不再局限于人為提供的學(xué)習(xí)樣本,可以邊執(zhí)行任務(wù)邊組織學(xué)習(xí),并且遇強(qiáng)更強(qiáng),靈活應(yīng)對(duì)任務(wù)過(guò)程中出現(xiàn)的未知事件;智能對(duì)抗級(jí),是指無(wú)人裝備在具備自主學(xué)習(xí)智能水平的基礎(chǔ)上,形成自身的核心價(jià)值,能夠短時(shí)間內(nèi)適應(yīng)未知的任務(wù)環(huán)境,迅速理解周?chē)謩?shì)并做出判斷,完成作戰(zhàn)任務(wù)。

從近幾年的技術(shù)突破來(lái)看,智能機(jī)器感知環(huán)境、識(shí)別語(yǔ)言、自主學(xué)習(xí)的能力越來(lái)越強(qiáng)大。這些能力的提升,不僅使智能機(jī)器成為人類(lèi)分擔(dān)任務(wù)的得力幫手,也或?qū)⒆屗蔀槲磥?lái)戰(zhàn)場(chǎng)的主角。