應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

語(yǔ)音識(shí)別走到了哪一步

2018-05-16 17:03 中國(guó)智能化網(wǎng)

導(dǎo)讀:在人工智能快速發(fā)展的今天,語(yǔ)音識(shí)別開始成為很多設(shè)備的標(biāo)配,語(yǔ)音識(shí)別開始被越來(lái)越多的人關(guān)注,國(guó)外微軟、谷歌、Facebook,國(guó)內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語(yǔ)音識(shí)別新策略新算法,今天小編就將為你做語(yǔ)音識(shí)別技術(shù)的簡(jiǎn)單介紹,并談?wù)勊陌l(fā)展歷程和未來(lái)可能的發(fā)展方向。

  在人工智能快速發(fā)展的今天,語(yǔ)音識(shí)別開始成為很多設(shè)備的標(biāo)配,語(yǔ)音識(shí)別開始被越來(lái)越多的人關(guān)注,國(guó)外微軟、谷歌、Facebook,國(guó)內(nèi)的科大訊飛、思必馳等廠商都在研發(fā)語(yǔ)音識(shí)別新策略新算法,今天小編就將為你做語(yǔ)音識(shí)別技術(shù)的簡(jiǎn)單介紹,并談?wù)勊陌l(fā)展歷程和未來(lái)可能的發(fā)展方向。

  語(yǔ)音識(shí)別技術(shù)

  在電影《鋼鐵俠》中,智能助理賈維斯的出色表現(xiàn)讓大家充滿了對(duì)智能語(yǔ)音助手的期待。語(yǔ)音識(shí)別技術(shù)就是為了讓機(jī)器人聽明白你在說(shuō)什么,它就好比“機(jī)器的聽覺系統(tǒng)”,該技術(shù)讓機(jī)器通過(guò)識(shí)別和理解,把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令。

  聽覺系統(tǒng)

  語(yǔ)音識(shí)別系統(tǒng)本質(zhì)上是一種模式識(shí)別系統(tǒng),包括特征提取、模式匹配、參考模式庫(kù)等三個(gè)基本單元,它的基本結(jié)構(gòu)如下圖所示:

  模式識(shí)別系統(tǒng)

  語(yǔ)音識(shí)別系統(tǒng)構(gòu)建過(guò)程整體上包括兩大部分:訓(xùn)練和識(shí)別。訓(xùn)練通常是離線完成的,海量未知語(yǔ)音經(jīng)過(guò)話筒變換成電信號(hào)后加在識(shí)別系統(tǒng)的輸入端,首先經(jīng)過(guò)預(yù)處理,再根據(jù)人的語(yǔ)音特點(diǎn)建立語(yǔ)音模型,對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行分析,并抽取所需的特征,在此基礎(chǔ)上建立語(yǔ)音識(shí)別所需的模板;而識(shí)別過(guò)程通常是在線完成的,對(duì)用戶實(shí)時(shí)的語(yǔ)音進(jìn)行自動(dòng)識(shí)別。識(shí)別過(guò)程通常又可以分為“前端”和“后端”兩大模塊:“前端”模塊主要的作用是進(jìn)行端點(diǎn)檢測(cè)(去除多余的靜音和非說(shuō)話聲)、降噪、特征提取等;“后端”模塊的作用是利用訓(xùn)練好的“聲學(xué)模型”和“語(yǔ)言模型”對(duì)用戶說(shuō)話的特征向量進(jìn)行統(tǒng)計(jì)模式識(shí)別(又稱“解碼”),得到其包含的文字信息。

  事實(shí)上,語(yǔ)音識(shí)別60多年的發(fā)展過(guò)程可以分成多個(gè)階段。早期的20多年,即從20世紀(jì)50年代到70年代,是科學(xué)家們走彎路的階段,全世界的科學(xué)家認(rèn)為必須先讓計(jì)算機(jī)理解自然語(yǔ)言,也就是用電腦模擬人腦,這20多年的研究成果近乎為零。

  直到1970年后,統(tǒng)計(jì)語(yǔ)言學(xué)的出現(xiàn)才使語(yǔ)音識(shí)別重獲新生,并取得了今天的非凡成就。推動(dòng)這個(gè)技術(shù)路線轉(zhuǎn)變的關(guān)鍵人物是德里克?賈里尼克。采用統(tǒng)計(jì)的方法,IBM將當(dāng)時(shí)的語(yǔ)音識(shí)別率提升到了90%,同時(shí)語(yǔ)音識(shí)別的規(guī)模從幾百單詞上升到幾萬(wàn)單詞,這樣語(yǔ)音識(shí)別就有了從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用的可能。