應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

助力網(wǎng)絡(luò)內(nèi)容安全,人工智能走上舞臺(tái)

2018-08-22 15:12 科技日?qǐng)?bào)

導(dǎo)讀:每天通過(guò)互聯(lián)網(wǎng)上傳的視頻、圖片、文字?jǐn)?shù)據(jù),用“海量”形容毫不為過(guò)——超過(guò)15億條,而且還在呈數(shù)量級(jí)增長(zhǎng)。

  每天通過(guò)互聯(lián)網(wǎng)上傳的視頻、圖片、文字?jǐn)?shù)據(jù),用“海量”形容毫不為過(guò)——超過(guò)15億條,而且還在呈數(shù)量級(jí)增長(zhǎng)。

  將其中涉及恐怖、暴力、色情等違法違規(guī)內(nèi)容過(guò)濾出來(lái),使其不污染、威脅網(wǎng)絡(luò)空間,以前靠的是人工審核,現(xiàn)在人工智能(AI)開(kāi)始走上舞臺(tái)。

  21日,由中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)和阿里巴巴等共同舉辦的“2018網(wǎng)絡(luò)安全生態(tài)峰會(huì)”在北京開(kāi)幕。AI在助力網(wǎng)絡(luò)內(nèi)容安全上扮演的重要角色成為此次峰會(huì)的熱點(diǎn)議題之一。

  AI是必然選擇

  可以說(shuō),面對(duì)海量互聯(lián)網(wǎng)數(shù)據(jù),用人工智能進(jìn)行互聯(lián)網(wǎng)數(shù)據(jù)的治理,是一個(gè)不得不做出的選擇。

  “相比AI技術(shù),現(xiàn)有的人工審核方式無(wú)論是成本還是效率都處于顯著劣勢(shì)?!敝袊?guó)互聯(lián)網(wǎng)協(xié)會(huì)在此次峰會(huì)上發(fā)布的《AI技術(shù)賦能網(wǎng)絡(luò)內(nèi)容安全保障研究報(bào)告》(以下簡(jiǎn)稱(chēng)《報(bào)告》)稱(chēng)。

  根據(jù)《報(bào)告》,人工智能已經(jīng)在網(wǎng)絡(luò)文本內(nèi)容檢測(cè)、文本分類(lèi)技術(shù)、視頻和圖片內(nèi)容識(shí)別、語(yǔ)音內(nèi)容檢測(cè)等方面發(fā)揮重要作用。

  例如,阿里巴巴開(kāi)發(fā)的云盾內(nèi)容安全系統(tǒng)可以基于深度學(xué)習(xí)技術(shù),提供文字、圖片、視頻等多媒體的內(nèi)容風(fēng)險(xiǎn)智能識(shí)別服務(wù),有效減少涉及恐怖、暴力、色情等違法違規(guī)信息。

  國(guó)家互聯(lián)網(wǎng)應(yīng)急中心高級(jí)工程師徐杰介紹,傳統(tǒng)的網(wǎng)絡(luò)安全治理方法涉及人工建模和提取特征,也就是描述某個(gè)事物,并構(gòu)成特征向量。越是復(fù)雜的事物,特征向量的復(fù)雜程度就越呈指數(shù)增長(zhǎng)。

  “AI技術(shù),特別是近期比較火的深度學(xué)習(xí)技術(shù),為我們處理這些問(wèn)題提供了新的可能。”徐杰說(shuō),因?yàn)樯疃葘W(xué)習(xí)技術(shù)不再需要人工去描述事物的特征,而是直接把相關(guān)事物的圖片或視頻交給機(jī)器去學(xué)習(xí),由機(jī)器自己建立模型。

  阿里巴巴集團(tuán)資深算法專(zhuān)家薛暉認(rèn)為,除了以上優(yōu)勢(shì),AI技術(shù)也增加了網(wǎng)絡(luò)內(nèi)容治理的可靠性。因?yàn)?,人工審核的?jīng)驗(yàn)因人而異,而且這種經(jīng)驗(yàn)較難傳承,但是AI技術(shù)無(wú)論是模型還是數(shù)據(jù)都更容易被繼承。

  還需要更加靠譜

  盡管AI在保障網(wǎng)絡(luò)內(nèi)容安全方面已顯出種種優(yōu)勢(shì),但作為一種新興的科技手段,難免還有諸多不足。

  “AI本身還有一些問(wèn)題,比如說(shuō)AI很大程度上基于模型和算法,而模型和算法本身具有脆弱性?!币苿?dòng)安全聯(lián)盟秘書(shū)長(zhǎng)楊正軍說(shuō),如果其模型和算法遭受攻擊,就會(huì)失效。另外,AI是基于海量數(shù)據(jù)進(jìn)行訓(xùn)練,假如數(shù)據(jù)遭到污染,或被攻擊者獲取,后果也不堪設(shè)想。

  來(lái)自科大訊飛的技術(shù)專(zhuān)家李劍鋒則認(rèn)為,AI在網(wǎng)絡(luò)內(nèi)容治理方面存在的最大挑戰(zhàn),是現(xiàn)在AI的能力還有待提升。

  李劍鋒舉例說(shuō),有用戶(hù)發(fā)微博表達(dá)心情,內(nèi)容是“黑夜總會(huì)過(guò)去,白天總會(huì)到來(lái)”。這句話(huà)反復(fù)發(fā)不出來(lái),該用戶(hù)百思不得其解。后來(lái)有朋友提醒他,是因?yàn)槠渲谐霈F(xiàn)了“夜總會(huì)”。

  “現(xiàn)在我們用AI技術(shù),哪怕是一個(gè)非常簡(jiǎn)單的技術(shù)也很難做到100%正確?!崩顒︿h解釋說(shuō),因?yàn)楝F(xiàn)在的機(jī)器學(xué)習(xí)屬于統(tǒng)計(jì)學(xué)機(jī)器學(xué)習(xí),包括深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)在內(nèi)都是基于概率論,理論上不能保證100%正確。