應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

眼下世界范圍內(nèi)的人工智能技術(shù)究竟到了什么水平?

2020-07-22 09:33 電子工程世界

導(dǎo)讀:為何“神經(jīng)元網(wǎng)絡(luò)技術(shù)”現(xiàn)在又有了“深度學(xué)習(xí)”這個(gè)后繼者呢?

關(guān)于人工智能在當(dāng)今科技界的發(fā)展水平,學(xué)術(shù)界、產(chǎn)業(yè)界和媒體界可能會(huì)有不同的看法。我經(jīng)常聽(tīng)到的一個(gè)說(shuō)法是:現(xiàn)在基于大數(shù)據(jù)與深度學(xué)習(xí)的人工智能是一種完全新穎的技術(shù)形態(tài),它的出現(xiàn)能夠全面地改變未來(lái)人類的社會(huì)形態(tài),因?yàn)樗軌蜃灾鬟M(jìn)行“學(xué)習(xí)”,由此大量取代人類勞力。

我認(rèn)為這里有兩個(gè)誤解:第一,深度學(xué)習(xí)并不是新技術(shù);第二,深度學(xué)習(xí)技術(shù)所涉及的“學(xué)習(xí)”與人類的學(xué)習(xí)并不是一回事,因?yàn)樗荒苷嬲吧疃取钡乩斫馑鎸?duì)的信息。

  深度學(xué)習(xí)不是新技術(shù)

從技術(shù)史角度看,深度學(xué)習(xí)技術(shù)的前身,其實(shí)就是在20世紀(jì)80年代就已經(jīng)熱鬧過(guò)一陣子的“人工神經(jīng)元網(wǎng)絡(luò)”技術(shù)(也叫“連接主義”技術(shù))。

該技術(shù)的實(shí)質(zhì),是用數(shù)學(xué)建模的辦法建造出一個(gè)簡(jiǎn)易的人工神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu),而一個(gè)典型的此類結(jié)構(gòu)一般包括三層:輸入單元層、中間單元層與輸出單元層。輸入單元層從外界獲得信息之后,根據(jù)每個(gè)單元內(nèi)置的匯聚算法與激發(fā)函數(shù),“決定”是否要向中間單元層發(fā)送進(jìn)一步的數(shù)據(jù)信息,其過(guò)程正如人類神經(jīng)元在接收別的神經(jīng)元送來(lái)的電脈沖之后,能根據(jù)自身細(xì)胞核內(nèi)電勢(shì)位的變化來(lái)“決定”是否要向另外的神經(jīng)元遞送電脈沖。

需要注意的是,無(wú)論整個(gè)系統(tǒng)所執(zhí)行的整體任務(wù)是關(guān)于圖像識(shí)別還是自然語(yǔ)言處理,僅僅從系統(tǒng)中單個(gè)計(jì)算單元自身的運(yùn)作狀態(tài)出發(fā),觀察者是無(wú)從知道相關(guān)整體任務(wù)的性質(zhì)的。毋寧說(shuō),整個(gè)系統(tǒng)其實(shí)是以“化整為零”的方式,將宏觀層面上的識(shí)別任務(wù)分解為了系統(tǒng)組成構(gòu)件之間的微觀信息傳遞活動(dòng),并通過(guò)這些微觀信息傳遞活動(dòng)所體現(xiàn)出來(lái)的大趨勢(shì),來(lái)模擬人類心智在符號(hào)層面上所進(jìn)行的信息處理進(jìn)程。

工程師調(diào)整系統(tǒng)的微觀信息傳遞活動(dòng)之趨勢(shì)的基本方法如下:先是讓系統(tǒng)對(duì)輸入信息進(jìn)行隨機(jī)處理,然后將處理結(jié)果與理想處理結(jié)果進(jìn)行比對(duì)。若二者吻合度不佳,則系統(tǒng)觸發(fā)自帶的“反向傳播算法”來(lái)調(diào)整系統(tǒng)內(nèi)各個(gè)計(jì)算單元之間的聯(lián)系權(quán)重,使得系統(tǒng)給出的輸出與前一次輸出不同。兩個(gè)單元之間的聯(lián)系權(quán)重越大,二者之間就越可能發(fā)生“共激發(fā)”現(xiàn)象,反之亦然。然后,系統(tǒng)再次比對(duì)實(shí)際輸出與理想輸出,如果二者吻合度依然不佳,則系統(tǒng)再次啟動(dòng)反向傳播算法,直至實(shí)際輸出與理想輸出彼此吻合為止。

完成此番訓(xùn)練過(guò)程的系統(tǒng),除了能夠?qū)τ?xùn)練樣本進(jìn)行準(zhǔn)確的語(yǔ)義歸類之外,一般也能對(duì)那些與訓(xùn)練樣本比較接近的輸入信息進(jìn)行相對(duì)準(zhǔn)確的語(yǔ)義歸類。譬如,如果一個(gè)系統(tǒng)已被訓(xùn)練得能夠識(shí)別既有相片庫(kù)里的哪些相片是張三的臉,那么,即使是一張從未進(jìn)入相片庫(kù)的新的張三照片,也能夠被系統(tǒng)迅速識(shí)別為張三的臉。

如果讀者對(duì)于上述技術(shù)描述還似懂非懂,不妨通過(guò)下面這個(gè)比方來(lái)進(jìn)一步理解人工神經(jīng)元網(wǎng)絡(luò)技術(shù)的運(yùn)作機(jī)理。假設(shè)一個(gè)不懂漢語(yǔ)的外國(guó)人跑到少林寺學(xué)武術(shù),師生之間的教學(xué)活動(dòng)該如何開展?有兩種情況:第一種情況是,二者之間能夠進(jìn)行語(yǔ)言交流(外國(guó)人懂漢語(yǔ)或者少林寺師傅懂外語(yǔ)),這樣一來(lái),師傅就能夠直接通過(guò)“給出規(guī)則”的方式教授他的外國(guó)徒弟。這種教育方法,或可勉強(qiáng)類比基于規(guī)則的人工智能路數(shù)。

另一種情況是,師傅與徒弟語(yǔ)言完全不通,在這種情況下,學(xué)生又該如何學(xué)武呢?唯有靠如下辦法:徒弟先觀察師傅的動(dòng)作,然后跟著學(xué),師傅則通過(guò)簡(jiǎn)單的肢體交流來(lái)告訴徒弟,這個(gè)動(dòng)作學(xué)得對(duì)不對(duì)(譬如,如果對(duì),師傅就微笑;如果不對(duì),師傅則棒喝徒弟)。進(jìn)而,如果師傅肯定了徒弟的某個(gè)動(dòng)作,徒弟就會(huì)記住這個(gè)動(dòng)作,繼續(xù)往下學(xué);如果不對(duì),徒弟就只好去猜測(cè)自己哪里錯(cuò)了,并根據(jù)這種猜測(cè)給出一個(gè)新動(dòng)作,并繼續(xù)等待師傅的反饋,直到師傅最終滿意為止。很顯然,這樣的武術(shù)學(xué)習(xí)效率是非常低的,因?yàn)橥降茉诤伦约旱膭?dòng)作哪里出錯(cuò)時(shí)會(huì)浪費(fèi)大量的時(shí)間。但“胡猜”二字恰恰切中了人工神經(jīng)元網(wǎng)絡(luò)運(yùn)作的實(shí)質(zhì)。概而言之,這樣的人工智能系統(tǒng)其實(shí)并不知道自己得到的輸入信息到底意味著什么——換言之,此系統(tǒng)的設(shè)計(jì)者并不能與系統(tǒng)進(jìn)行符號(hào)層面上的交流,正如在前面的例子中師傅是無(wú)法與徒弟進(jìn)行言語(yǔ)交流一樣。而這種低效學(xué)習(xí)的“低效性”之所以在計(jì)算機(jī)那里能夠得到容忍,則緣于計(jì)算機(jī)相比于自然人而言的一個(gè)巨大優(yōu)勢(shì):計(jì)算機(jī)可以在很短的物理時(shí)間內(nèi)進(jìn)行海量次數(shù)的“胡猜”,并由此遴選出一個(gè)比較正確的解。一旦看清楚了里面的機(jī)理,我們就不難發(fā)現(xiàn):人工神經(jīng)元網(wǎng)絡(luò)的工作原理其實(shí)是非常笨拙的。

  “深度學(xué)習(xí)”應(yīng)該是“深層學(xué)習(xí)”

那么,為何“神經(jīng)元網(wǎng)絡(luò)技術(shù)”現(xiàn)在又有了“深度學(xué)習(xí)”這個(gè)后繼者呢?這個(gè)新名目又是啥意思呢?

不得不承認(rèn),“深度學(xué)習(xí)”是一個(gè)帶有迷惑性的名目,因?yàn)樗鼤?huì)誘使很多外行認(rèn)為人工智能系統(tǒng)已經(jīng)可以像人類那樣“深度地”理解自己的學(xué)習(xí)內(nèi)容了。但真實(shí)情況是:按照人類的“理解”標(biāo)準(zhǔn),這樣的系統(tǒng)對(duì)原始信息最膚淺的理解也無(wú)法達(dá)到。

為了避免此類誤解,筆者比較贊成將“深度學(xué)習(xí)”稱為“深層學(xué)習(xí)”。因?yàn)樵撛~的英文原文“deeplearning”技術(shù)的真正含義,就是將傳統(tǒng)的人工神經(jīng)元網(wǎng)絡(luò)進(jìn)行技術(shù)升級(jí),即增加其隱藏單元層的數(shù)量。這樣做的好處,是能夠增大整個(gè)系統(tǒng)的信息處理機(jī)制的細(xì)膩度,使得更多的對(duì)象特征能夠在更多的中間層中得到安頓。

比如,在人臉識(shí)別的深度學(xué)習(xí)系統(tǒng)中,更多的中間層次能夠更為細(xì)膩地處理初級(jí)像素、色塊邊緣、線條組合、五官輪廓等處在不同抽象層面上的特征。這樣的細(xì)膩化處理方式當(dāng)然能夠提高整個(gè)系統(tǒng)的識(shí)別能力。

但需要看到,由此類“深度”化要求所帶來(lái)的整個(gè)系統(tǒng)的數(shù)學(xué)復(fù)雜性與數(shù)據(jù)的多樣性,自然會(huì)對(duì)計(jì)算機(jī)硬件以及訓(xùn)練用的數(shù)據(jù)量提出很高的要求。這也就解釋了為何深度學(xué)習(xí)技術(shù)在21世紀(jì)后才逐漸流行,正是最近十幾年以來(lái)計(jì)算機(jī)領(lǐng)域內(nèi)突飛猛進(jìn)的硬件發(fā)展,以及互聯(lián)網(wǎng)普及所帶來(lái)的巨大數(shù)據(jù)量,才為深度學(xué)習(xí)技術(shù)的落地開花提供了基本保障。

但有兩個(gè)瓶頸阻礙了神經(jīng)元網(wǎng)絡(luò)-深度學(xué)習(xí)技術(shù)進(jìn)一步“智能化”:

第一,一旦系統(tǒng)經(jīng)過(guò)訓(xùn)練而變得收斂了,那么系統(tǒng)的學(xué)習(xí)能力就下降了,也就是說(shuō),系統(tǒng)無(wú)法根據(jù)新的輸入調(diào)整權(quán)重。這可不是我們的終極理想。我們的理想是:假定由于訓(xùn)練樣本庫(kù)自身的局限性,網(wǎng)絡(luò)過(guò)早地收斂了,那么面對(duì)新樣本時(shí),它依然能夠自主地修訂原來(lái)形成的輸入-輸出映射關(guān)系,并使得這種修訂能夠兼顧舊有的歷史和新出現(xiàn)的數(shù)據(jù)。但現(xiàn)有技術(shù)無(wú)法支持這個(gè)看似宏大的技術(shù)設(shè)想。設(shè)計(jì)者目前所能夠做的,就是把系統(tǒng)的歷史知識(shí)歸零,把新的樣本納入樣本庫(kù),然后從頭開始訓(xùn)練。在這里我們無(wú)疑又一次看到了讓人不寒而栗的“西西弗斯循環(huán)”。

第二,正如前面的例子所展現(xiàn)給我們的,在神經(jīng)元網(wǎng)絡(luò)-深度學(xué)習(xí)模式識(shí)別的過(guò)程中,設(shè)計(jì)者的很多心力都花費(fèi)在對(duì)于原始樣本的特征提取上。很顯然,同樣的原始樣本會(huì)在不同的設(shè)計(jì)者那里具有不同的特征提取模式,而這又會(huì)導(dǎo)致不同的神經(jīng)元網(wǎng)絡(luò)-深度學(xué)習(xí)建模方向。對(duì)人類編程員來(lái)說(shuō),這正是體現(xiàn)自己創(chuàng)造性的好機(jī)會(huì),但對(duì)于系統(tǒng)本身來(lái)說(shuō),這等于剝奪了它自身進(jìn)行創(chuàng)造性活動(dòng)的機(jī)會(huì)。試想:一個(gè)被如此設(shè)計(jì)出來(lái)的神經(jīng)元網(wǎng)絡(luò)-深度學(xué)習(xí)結(jié)構(gòu),能夠自己觀察原始樣本,找到合適的特征提取模式,并設(shè)計(jì)出自己的拓?fù)鋵W(xué)結(jié)構(gòu)嗎?看來(lái)很難,因?yàn)檫@似乎要求該結(jié)構(gòu)背后有一個(gè)元結(jié)構(gòu),能夠?qū)υ摻Y(jié)構(gòu)本身給出反思性的表征。關(guān)于這個(gè)元結(jié)構(gòu)應(yīng)當(dāng)如何被程序化,我們目前依然是一團(tuán)霧水——因?yàn)閷?shí)現(xiàn)這個(gè)元結(jié)構(gòu)功能的,正是我們?nèi)祟愖约?。讓人失望的是,盡管深度學(xué)習(xí)技術(shù)帶有這些基本缺陷,但目前的主流人工智能界已經(jīng)被“洗腦”,認(rèn)為深度學(xué)習(xí)技術(shù)就已經(jīng)等于人工智能的全部。一種基于小數(shù)據(jù),更加靈活、更為通用的人工智能技術(shù),顯然還需要人們投入更多的心力。從純學(xué)術(shù)角度看,我們離這個(gè)目標(biāo)還很遠(yuǎn)。