應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

消息稱 Meta 無視自家律師警告,使用盜版書籍訓(xùn)練 AI 模型

2023-12-13 17:19 IT之家
關(guān)鍵詞:Meta

導(dǎo)讀:?12 月 13 日,據(jù)路透社報道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓(xùn)練其 AI 模型存在法律風(fēng)險的情況下,仍然一意孤行。

12 月 13 日,據(jù)路透社報道,根據(jù)一起版權(quán)侵權(quán)訴訟的新文件顯示,Meta Platforms 在明知使用數(shù)千本盜版書籍訓(xùn)練其 AI 模型存在法律風(fēng)險的情況下,仍然一意孤行。

image.png


據(jù)IT之家了解,該訴訟由喜劇演員 Sarah Silverman、普利策獎得主 Michael Chabon 等著名作家于今年夏天聯(lián)合發(fā)起,他們指控 Meta 未經(jīng)許可使用其作品訓(xùn)練人工智能語言模型 Llama。本周一起,該案與另一起類似訴訟合并審理。

上個月,加州一位法官駁回了 Silverman 的部分訴訟,但表示將允許作者修改訴訟內(nèi)容。新訴狀中包含了 Meta 一名研究員在 Discord 聊天服務(wù)器上討論獲取數(shù)據(jù)集的聊天記錄,這可能是 Meta 知曉使用書籍可能存在版權(quán)風(fēng)險的重要證據(jù)。聊天記錄中的對話顯示,他們曾討論過使用盜版書籍訓(xùn)練 AI 模型的法律風(fēng)險。其中,一位 Meta 研究員 Tim Dettmers 提到,Meta 的法律部門律師曾表示,如果使用這些書籍訓(xùn)練 AI 模型,可能會存在法律問題。律師稱,這些數(shù)據(jù)無法使用,如果使用了的話,模型也無法發(fā)布。

今年,多家科技公司都面臨著內(nèi)容創(chuàng)作者的類似指控,他們指責(zé)這些公司在構(gòu)建生成式 AI 模型時侵犯了作品版權(quán)。

如果這些訴訟成功,可能會給生成式 AI 的發(fā)展帶來不利影響,因為這可能會增加構(gòu)建 AI 模型的成本,迫使 AI 公司向藝術(shù)家、作者和其他內(nèi)容創(chuàng)作者支付使用其作品的費用。

與此同時,歐盟關(guān)于人工智能的新臨時規(guī)則可能會迫使公司披露其用于訓(xùn)練模型的數(shù)據(jù),這可能會使他們面臨更大的法律風(fēng)險。

Meta 于今年 2 月發(fā)布了其第一版 Llama 大型語言模型,并公布了用于訓(xùn)練的數(shù)據(jù)集列表,其中包括“ThePile”數(shù)據(jù)集的“Books3”部分。根據(jù)訴訟文件,該數(shù)據(jù)集的創(chuàng)建者曾表示,其中包含 196,640 本書籍。該公司沒有披露其最新版模型 Llama 2 的訓(xùn)練數(shù)據(jù),該模型于今年夏天面向商業(yè)用戶開放。