欧美乱伦视频啊啊,人妻一区2区3区,日韩V亚洲Ⅴ欧美V精品综合

中國信通院公布 AI 代碼大模型評估，阿里云、華為、商湯等首批通過

2024-06-12 08:51 IT之家

導(dǎo)讀：中國信息通信研究院公布了可信 AI 代碼大模型評估的首輪評估名單，阿里云通義靈碼、華為云盤古、智譜 codegeex 等國產(chǎn) AI 大模型均入選并首批通過。

　　6 月 11 日消息，中國信息通信研究院公布了可信 AI 代碼大模型評估的首輪評估名單，阿里云通義靈碼、華為云盤古、智譜 codegeex 等國產(chǎn) AI 大模型均入選并首批通過。

　　此次大模型評估以《智能化軟件工程技術(shù)和應(yīng)用要求第 1 部分：代碼大模型》標(biāo)準(zhǔn)為依據(jù)，圍繞通用能力、專用場景能力、應(yīng)用成熟度，為模型能力提升和企業(yè)選型提供規(guī)范性參考。

　　IT之家注：《智能化軟件工程技術(shù)和應(yīng)用要求第 1 部分：代碼大模型》（標(biāo)準(zhǔn)編號 AIIA / PG 0110-2023）標(biāo)準(zhǔn)于 2024 年 1 月 25 日正式發(fā)布，該標(biāo)準(zhǔn)由中國信通院與中國工商銀行聯(lián)合牽頭發(fā)起，涵蓋通用能力、專用場景能力和應(yīng)用成熟度三大部分，包括 100 多個能力要求。

　　此次驗證，依據(jù)標(biāo)準(zhǔn)開展，評價指標(biāo)覆蓋 6 大通用能力場景、7 大專用能力場景、3 大服務(wù)成熟度，多維度驗證研發(fā)大模型在研發(fā)場景能力和人效優(yōu)化效果方面的場景豐富度，重點考察研發(fā)大模型在代碼理解、代碼生成和補(bǔ)全、研發(fā)問答、單元測試用例生成等方面的能力支持度，全方位評估研發(fā)大模型在數(shù)據(jù)合規(guī)性、模型成熟度、服務(wù)成熟度方面的應(yīng)用成熟度。

　　目前，華為云盤古大模型、智譜 CodeGeeX 代碼大模型、阿里云 AI 編程助手通義靈碼、中國電信星辰政務(wù)大模型等首批通過評估，并在全部 100 多個能力評估中表現(xiàn)優(yōu)秀，獲得 4 + 評級。

　　以阿里云通義靈碼為例，信通院評測結(jié)果顯示：

　　在通用能力方面，通義靈碼在代碼轉(zhuǎn)換、代碼檢查及修復(fù)、代碼優(yōu)化等方面表現(xiàn)突出；

　　在專用場景方面，通義靈碼提供網(wǎng)站開發(fā)、數(shù)據(jù)庫開發(fā)、大數(shù)據(jù)開發(fā)、嵌入式開發(fā)等多個場景支持能力；

　　在應(yīng)用成熟度方面，通義靈碼具備較完善的數(shù)據(jù)合規(guī)及數(shù)據(jù)分類分級機(jī)制，且模型穩(wěn)定性及可維護(hù)性表現(xiàn)優(yōu)異，在模型推理性能、模型服務(wù)風(fēng)險可控性等方面均表現(xiàn)優(yōu)秀。

　　公開資料顯示，AI 代碼大模型首輪評估于今年 3 月啟動，主要面向適用于金融、科技、互聯(lián)網(wǎng)、電信、軟件等各行業(yè)，生產(chǎn)、使用或計劃使用代碼大模型的企業(yè)，評估結(jié)果旨在為模型廠商提供代碼大模型能力的評價和指導(dǎo)標(biāo)準(zhǔn)，以及為模型應(yīng)用方提供有效衡量其能力水平的標(biāo)準(zhǔn)依據(jù)。

中國信通院公布 AI 代碼大模型評估，阿里云、華為、商湯等首批通過

相關(guān)閱讀

中國信通院公布 AI 代碼大模型評估，阿里云、華為、商湯等首批通過