應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

最新 AI 技術(shù)無創(chuàng)解碼“大腦語言”,準(zhǔn)確率達(dá) 73%

2022-09-14 13:50 新浪科技

導(dǎo)讀:目前,人工智能技術(shù)使得非侵入式大腦解碼技術(shù)更進(jìn)一步!盡管該技術(shù)尚不能使無法語言交流人群像正常人那樣談笑風(fēng)生,但可使科學(xué)家精準(zhǔn)解碼他們的語音內(nèi)容。

北京時(shí)間 9 月 14 日上午消息,據(jù)報(bào)道,目前,人工智能技術(shù)使得非侵入式大腦解碼技術(shù)更進(jìn)一步!盡管該技術(shù)尚不能使無法語言交流人群像正常人那樣談笑風(fēng)生,但可使科學(xué)家精準(zhǔn)解碼他們的語音內(nèi)容。

▲人工智能技術(shù)可從參與者大腦活動(dòng)中解碼單詞和句子,其準(zhǔn)確性令人不可思議,準(zhǔn)確率可達(dá) 73%,這意味著人工智能朝向大腦活動(dòng)數(shù)據(jù)“無創(chuàng)解碼”大腦語言和意識(shí)邁進(jìn)一步!

這項(xiàng)人工智能技術(shù)可從參與者大腦活動(dòng)中解碼單詞和句子,其準(zhǔn)確性令人不可思議,但仍無法達(dá)到 100% 精準(zhǔn),人們僅需幾秒鐘的大腦活動(dòng)數(shù)據(jù),即能通過人工智能技術(shù)推測出人們聽到什么內(nèi)容,他們?cè)谝豁?xiàng)初步研究中發(fā)現(xiàn),參與者從選擇性測試中找到正確答案的概率平均達(dá)到 73%。

未參與該項(xiàng)研究的愛爾蘭都柏林三一學(xué)院計(jì)算機(jī)科學(xué)家喬瓦尼?迪?利伯托 (Giovanni Di Liberto) 稱,人工智能的表現(xiàn)已超出許多人認(rèn)為可能實(shí)現(xiàn)的水平。

8 月 25 日,有媒體報(bào)道稱,F(xiàn)acebook 母公司 Meta 研發(fā)一項(xiàng)最新人工智能技術(shù),最終有望應(yīng)用于全球數(shù)以萬計(jì)無法通過語音、打字或者手勢(shì)進(jìn)行交流的人群,其中包括:最低限度的意識(shí)狀態(tài)、閉鎖綜合癥或者“植物人狀態(tài)”患者,現(xiàn)在他們通常被稱為無反應(yīng)清醒綜合癥人群。

據(jù)悉,目前大多數(shù)幫助語言表達(dá)障礙人群的技術(shù)具有一定程度的身體侵入性,需要進(jìn)行高風(fēng)險(xiǎn)腦部手術(shù)植入電極,Meta 公司 AI 研究員、神經(jīng)科學(xué)家珍妮-雷米?金 (Jean-Remi King) 表示,最新研發(fā)的人工智能技術(shù)有望提供一種可行方案來幫助溝通障礙患者,而不是使用侵入性方法。

珍妮和同事研發(fā)了一種計(jì)算工具,可以檢測 53 種語言的 56000 小時(shí)語音錄音中的單詞和句子,該工具也被稱為語言模型,學(xué)習(xí)如何在細(xì)微等級(jí) (例如:字母或者音節(jié)) 和更廣泛等級(jí) (例如:單詞或者句子) 識(shí)別語言的具體特征。

該研究團(tuán)隊(duì)將帶有語言模型的人工智能系統(tǒng)應(yīng)用于 4 個(gè)機(jī)構(gòu)的數(shù)據(jù)庫,其中包括 169 名志愿者的大腦活動(dòng),在這些數(shù)據(jù)庫中,參與者傾聽不同的故事和句子,例如:作家歐內(nèi)斯特?海明威的《老人與?!泛蛣⒁姿?卡羅爾的《愛麗絲夢(mèng)游仙境》,期間工作人員使用腦磁波描記器 (MEG) 或者腦電圖儀對(duì)參與者的大腦進(jìn)行掃描,這些設(shè)備可以測量大腦信號(hào)的磁成分或者電成分。

之后在一種有助于解釋實(shí)際大腦間物理差異的計(jì)算方法幫助下,研究團(tuán)隊(duì)試著利用每位參與者 3 秒鐘的大腦活動(dòng)數(shù)據(jù)來解碼他們聽到的內(nèi)容,他們指示人工智能系統(tǒng)將故事錄音中的語音與人工智能計(jì)算出人們聽到的內(nèi)容相對(duì)應(yīng)的大腦活動(dòng)模式進(jìn)行匹配,然后依據(jù) 1000 多種可能性,預(yù)測參與者在短時(shí)間內(nèi)可能聽到的內(nèi)容。

研究人員發(fā)現(xiàn)使用腦磁波描記器進(jìn)行測試,參與者選擇的前 10 種可能性答案的準(zhǔn)確率達(dá)到 73%,然而通過腦電圖儀的測試結(jié)果,該準(zhǔn)確率下降至不足 30%,因此腦磁波描記器性能非常好。利伯托說:“但是我們預(yù)測該系統(tǒng)的實(shí)際應(yīng)用并不樂觀,它能有什么用途呢?腦磁波描記器是一部笨重且成本昂貴的機(jī)器,將該項(xiàng)技術(shù)應(yīng)用于診所需要技術(shù)創(chuàng)新改良,從而使該設(shè)備成本更低、更易于使用。

美國密歇根大學(xué)安娜堡分校語言學(xué)家喬納森?布倫南 (Jonathan Brennan) 說:“在這項(xiàng)最新研究中,理解‘解碼’的真正含義非常重要,這個(gè)詞經(jīng)常被用于描述直接從信息源破譯信息的過程,這里特指從大腦活動(dòng)中破譯語言,人工智能技術(shù)可以實(shí)現(xiàn)這一點(diǎn),因?yàn)樵撓到y(tǒng)能提供一個(gè)有限范圍的可能性答案,大幅提高的準(zhǔn)確率。對(duì)于語言來講,如果我們想將該人工智能系統(tǒng)擴(kuò)展至實(shí)際應(yīng)用,這是很難實(shí)現(xiàn)的,因?yàn)檎Z言應(yīng)用是無限的?!?/p>

更重要的是,人工智能能解碼被動(dòng)傾聽音頻的參與者信息,這與非語言患者沒有直接關(guān)聯(lián),為了使它成為一種具有意義的交流工具,科學(xué)家需要學(xué)習(xí)如何從大腦活動(dòng)中解密患者想表達(dá)的信息,例如:饑餓、不適表情或者簡單的“是”或者“不是”的表情。

事實(shí)上,這項(xiàng)人工智能技術(shù)是解碼語音感知,而不是語音生成,雖然語音生成是科學(xué)家的最終目標(biāo),但就目前而言,亟待進(jìn)一步完善提升相關(guān)的科學(xué)技術(shù)。