數(shù)據(jù)“中毒”會(huì)讓AI“自己學(xué)壞”
- 科技日報(bào)
- 2025-08-19 17:11:39
澳大利亞《對話》雜志日前報(bào)道稱,這是數(shù)據(jù)“中毒”的一個(gè)非常典型的例子。AI系統(tǒng)在學(xué)習(xí)過程中,如果輸入了錯(cuò)誤或誤導(dǎo)性數(shù)據(jù),可能會(huì)逐漸形成錯(cuò)誤認(rèn)知,作出偏離預(yù)期的判斷。與傳統(tǒng)的黑客入侵不同,數(shù)據(jù)“中毒”不會(huì)直接破壞系統(tǒng),而是讓AI“自己學(xué)壞”。隨著AI在交通、醫(yī)療、媒體等領(lǐng)域的普及,這一問題正引起越來越多的關(guān)注。
AI系統(tǒng)在學(xué)習(xí)過程中,如果輸入了錯(cuò)誤或誤導(dǎo)性數(shù)據(jù),可能會(huì)逐漸形成錯(cuò)誤認(rèn)知,做出偏離預(yù)期的判斷。圖片來源:英國《新科學(xué)家》網(wǎng)站
AI“中毒”的現(xiàn)實(shí)風(fēng)險(xiǎn)
在火車站的例子中,假設(shè)一個(gè)技術(shù)嫻熟的攻擊者既想擾亂公共交通,又想收集情報(bào),他連續(xù)30天用紅色激光欺騙攝像頭。如果未被發(fā)現(xiàn),這類攻擊會(huì)逐漸腐蝕系統(tǒng),為后門植入、數(shù)據(jù)竊取甚至間諜行為埋下隱患。雖然物理基礎(chǔ)設(shè)施中的數(shù)據(jù)投毒較為罕見,但線上系統(tǒng),尤其是依賴社交媒體和網(wǎng)頁內(nèi)容訓(xùn)練的大語言模型中,它已是重大隱患。
一個(gè)著名的數(shù)據(jù)“投毒”案例發(fā)生在2016年,微軟推出的聊天機(jī)器人Tay上線數(shù)小時(shí)后,就被惡意用戶灌輸不當(dāng)言論,迅速模仿并發(fā)布到X(當(dāng)時(shí)的Twitter)平臺上,不到24小時(shí)就被迫下線并道歉。
據(jù)英國《新科學(xué)家》雜志報(bào)道,2024年,互聯(lián)網(wǎng)出現(xiàn)了一個(gè)標(biāo)志性事件,即AI爬蟲的流量首次超過人類用戶,其中OpenAI的ChatGPT-User占據(jù)了全球6%的網(wǎng)頁訪問量,它本質(zhì)上是ChatGPT的“上網(wǎng)代理”,在用戶需要實(shí)時(shí)信息時(shí)替他們訪問網(wǎng)站。而Anthropic的ClaudeBot更是長期大規(guī)模抓取網(wǎng)頁內(nèi)容,占到13%的流量。
互聯(lián)網(wǎng)上的大量內(nèi)容正被AI模型不斷采集、吸收,用于持續(xù)訓(xùn)練。一旦有人故意投放有毒數(shù)據(jù),比如篡改的版權(quán)材料、偽造的新聞信息,這些大規(guī)模采集的爬蟲就可能把它們帶進(jìn)模型,造成版權(quán)侵權(quán)、虛假信息擴(kuò)散,甚至在關(guān)鍵領(lǐng)域引發(fā)安全風(fēng)險(xiǎn)。
版權(quán)之爭中的“投毒”反擊
隨著AI爬蟲的大規(guī)模抓取,許多創(chuàng)作者擔(dān)心作品被未經(jīng)許可使用。為了保護(hù)版權(quán),創(chuàng)作者采取了法律和技術(shù)手段。如《紐約時(shí)報(bào)》起訴OpenAI,稱其新聞報(bào)道被模型學(xué)習(xí)再利用,侵犯了版權(quán)。
面對曠日持久的版權(quán)拉鋸戰(zhàn),一些創(chuàng)作者轉(zhuǎn)向技術(shù)“自衛(wèi)”。美國芝加哥大學(xué)團(tuán)隊(duì)研發(fā)了兩款工具。名為Glaze的工具可在藝術(shù)作品中加入微小的像素級干擾,讓AI模型誤以為一幅水彩畫是油畫。另一款工具Nightshade更為激進(jìn),它能在看似正常的貓的圖片中植入隱蔽特征,從而讓模型學(xué)到“貓=狗”這樣的錯(cuò)誤對應(yīng)。通過這種方式,藝術(shù)家們讓自己的作品在訓(xùn)練數(shù)據(jù)中成為“毒藥”,保護(hù)了原創(chuàng)風(fēng)格不被復(fù)制。
這種反擊方式一度在創(chuàng)作者群體中風(fēng)靡。Nightshade發(fā)布不到一年,下載量便超過一千萬次。與此同時(shí),基礎(chǔ)設(shè)施公司Cloudflare也推出了“AI迷宮”,通過制造海量無意義的虛假網(wǎng)頁,將AI爬蟲困在假數(shù)據(jù)的循環(huán)中,消耗其算力和時(shí)間。可以說,數(shù)據(jù)投毒在某些領(lǐng)域已經(jīng)從一種反擊手段,演變?yōu)榘鏅?quán)與利益之爭中的防御武器。
去中心化成為AI的防護(hù)盾
這種局面讓人警覺。創(chuàng)作者的數(shù)據(jù)“投毒”是為了保護(hù)原創(chuàng),但一旦同樣的技術(shù)被用于大規(guī)模制造虛假信息,其后果可能比版權(quán)爭議嚴(yán)重得多。
面對這種隱蔽的威脅,研究者正在探索新的防御手段。在美國佛羅里達(dá)國際大學(xué)的Solid實(shí)驗(yàn)室,研究人員正著力用去中心化技術(shù)來防御數(shù)據(jù)投毒攻擊。其中一種方法叫聯(lián)邦學(xué)習(xí)。與傳統(tǒng)的集中式訓(xùn)練不同,聯(lián)邦學(xué)習(xí)允許模型在分布式設(shè)備或機(jī)構(gòu)本地學(xué)習(xí),只匯總參數(shù)而非原始數(shù)據(jù)。這種方式降低了單點(diǎn)中毒的風(fēng)險(xiǎn),因?yàn)槟骋粋€(gè)設(shè)備的“壞數(shù)據(jù)”不會(huì)立刻污染整個(gè)模型。
然而,如果在數(shù)據(jù)匯總環(huán)節(jié)遭遇攻擊,損害依然可能發(fā)生。為此,另一種工具——區(qū)塊鏈正被引入AI防御體系。區(qū)塊鏈的時(shí)間戳和不可篡改特性,使得模型更新過程可被追溯。一旦發(fā)現(xiàn)異常數(shù)據(jù),可追根溯源,定位投毒源頭。同時(shí),多個(gè)區(qū)塊鏈網(wǎng)絡(luò)還能互相“通報(bào)”,當(dāng)一個(gè)系統(tǒng)識別出可疑模式時(shí),可立刻警示其他系統(tǒng)。
任何依賴現(xiàn)實(shí)世界數(shù)據(jù)的AI系統(tǒng)都可能被操縱。利用聯(lián)邦學(xué)習(xí)和區(qū)塊鏈等防御工具,研究人員和開發(fā)者正在打造更具韌性、可追溯的AI系統(tǒng),在遭遇欺騙時(shí)能發(fā)出警報(bào),提醒系統(tǒng)管理員及時(shí)介入,降低潛在風(fēng)險(xiǎn)。
關(guān)鍵詞:
金卡智能:中標(biāo)8250.7萬元智慧燃?xì)馍壐脑旃こ添?xiàng)目
- 每日短訊:工信部發(fā)布“標(biāo)志性產(chǎn)品”,這三種來自湖北
- 中國北方地區(qū)首次承修全球最大噸位集裝箱船
- (活力中國調(diào)研行)福建文旅消費(fèi)成新亮點(diǎn) 2025年上半年接待旅游總?cè)藬?shù)3.29億人次
- 在南??匆娚帧覈虾u礁生態(tài)環(huán)保建設(shè)取得顯著成效
- 2025年中國內(nèi)地電影暑期檔總票房破100億元
- 自然資源部對山西內(nèi)蒙古陜西啟動(dòng)地質(zhì)災(zāi)害防御Ⅳ級響應(yīng)
- “冰絲帶”上的機(jī)器人盛會(huì):未來已來,你準(zhǔn)備好了嗎?
- 重走抗戰(zhàn)路,一定要去一趟安徽云嶺新四軍軍部舊址!
- 理響中國|多有貢獻(xiàn),這是白求恩的最后心聲
- 數(shù)據(jù)“中毒”會(huì)讓AI“自己學(xué)壞”2025-08-19
- 新規(guī)守護(hù)“小電驢”安全上路2025-08-19
- 金卡智能:中標(biāo)8250.7萬元智慧燃?xì)馍壐脑?/a>2025-08-19
- 北京經(jīng)開區(qū)出臺具身智能機(jī)器人新政2025-08-19
- 凡人微光|“醫(yī)”路向前2025-08-19
- 小米16系列小屏版曝光:6300mAh電池、潛望2025-08-19
- 快遞業(yè)規(guī)模效應(yīng)持續(xù)放大2025-08-19
- 平安人壽杭州石橋營銷服務(wù)部因代理人管理問2025-08-19
- 萬物云2025上半年業(yè)績:核心凈利潤啟動(dòng)反彈2025-08-19
- 央企加力布局人工智能賽道2025-08-19
- “清華火神隊(duì)”為何能斬獲機(jī)器人足球賽世界2025-08-19
- 每日視訊:方正科技(600601)龍虎榜數(shù)據(jù)(08-19)2025-08-19
- 中國空間站艙外航天服B累計(jì)保障20次出艙任2025-08-19
- 研究人員利用腦機(jī)接口嘗試解碼內(nèi)心獨(dú)白2025-08-19
- 記者手記:在“冰絲帶”見證機(jī)器人“超越自2025-08-19
- 中建六局&中建絲路協(xié)同聯(lián)動(dòng)高端人才雙選會(huì)(2025-08-19
- 瞭望 | AI幻覺頻現(xiàn) 風(fēng)險(xiǎn)挑戰(zhàn)幾何2025-08-19
- 江山如畫|不屈2025-08-19
- 生意社:8月19日華南地區(qū)PMMA市場持穩(wěn)運(yùn)行2025-08-19
- 上半年全國廣播電視服務(wù)業(yè)總收入6884.14億2025-08-19
- 信用卡業(yè)務(wù)轉(zhuǎn)向精耕細(xì)作 多家銀行關(guān)停旗下2025-08-19
- 焦點(diǎn)!當(dāng)00后決定擺攤賣菜:一位汕頭“三農(nóng)2025-08-19
- 觀焦點(diǎn):老百姓控股股東提前終止減持計(jì)劃 2025-08-19
- 聯(lián)明股份控股股東聯(lián)明集團(tuán)擬減持 業(yè)績近22025-08-19
- 廣東漂流哪個(gè)好?黃騰峽漂流以實(shí)力領(lǐng)跑成首2025-08-19
- 每日短訊:工信部發(fā)布“標(biāo)志性產(chǎn)品”,這三2025-08-19
- 千帆競發(fā)“味”領(lǐng)鮮——味事達(dá)攜手陽江開漁2025-08-19
- 生意社:8月19日山東匯豐石化集團(tuán)油品報(bào)價(jià)2025-08-19
- 張江集團(tuán)、通研院等成立創(chuàng)業(yè)孵化器管理公司2025-08-19
- 佛山:推進(jìn)23宗水經(jīng)濟(jì)項(xiàng)目2025-08-19