盡管生成式人工智能(AI)正在改變?nèi)騼?nèi)容生產(chǎn)的格局,但諸多嚴(yán)峻挑戰(zhàn)也隨之而來:如何準(zhǔn)確識別由 AI 生成的內(nèi)容并防止其被濫用,尤其是在文本生成領(lǐng)域,已成為困擾越來越多人的一大難題。
今天,Google DeepMind 團(tuán)隊(duì)發(fā)表了一項(xiàng)重磅研究——
他們開發(fā)了一種名為 SynthID-Text 的新型水印工具。該工具采用“錦標(biāo)賽抽樣”(tournament sampling)算法,在不損害文本質(zhì)量的前提下,通過嵌入隱形水印,使大語言模型(LLM)生成的每段文本都帶有獨(dú)特標(biāo)識,極大提高了文本追蹤和檢測的精度。
研究發(fā)現(xiàn),通過在多個(gè)公開可用的模型上評估,SynthID-Text 顯示出比現(xiàn)有方法更高的檢測率。通過對近 2000 萬條 LLM 的實(shí)時(shí)聊天互動數(shù)據(jù)進(jìn)行分析,非扭曲模式的水印并未降低文本質(zhì)量。
相關(guān)研究論文以 “Scalable watermarking for identifying large language model outputs” 為題,以封面文章的形式已發(fā)表在權(quán)威科學(xué)期刊 Nature 上。
這一工具的推出,標(biāo)志著 AI 文本透明性和責(zé)任性的重大進(jìn)展,為當(dāng)前 AI 生成內(nèi)容的溯源和透明性提供了新的解決方案,也回應(yīng)了當(dāng)前社會對 AI 內(nèi)容可信度的擔(dān)憂。
“揭穿” AI 文本的“隱形指紋”
隨著 LLM 技術(shù)的發(fā)展,像 GPT 系列模型等 AI 工具生成的文本內(nèi)容流暢度和語言多樣性已經(jīng)接近甚至超越人類編寫的文本。然而,這也帶來了關(guān)于內(nèi)容可信性和來源問題的挑戰(zhàn),尤其是在教育、媒體等領(lǐng)域,無法辨別生成文本的來源可能會導(dǎo)致誤導(dǎo)性信息的傳播。
在文本生成的過程中,LLM 將文本分解為 token(最小的語言單位),然后逐步預(yù)測下一個(gè) token 的出現(xiàn)概率,然后通過大量語料數(shù)據(jù)的訓(xùn)練,學(xué)習(xí)語言的上下文結(jié)構(gòu),從而實(shí)現(xiàn)語言生成。每次預(yù)測新的 token,LLM 都基于此前生成的 token 和上下文,逐步構(gòu)建句子直到完成整段文本。
傳統(tǒng)的水印技術(shù)往往需要在生成文本中做出一些可察覺的修改,如基于機(jī)器學(xué)習(xí)的分類器和檢索式系統(tǒng),可以在一定程度上檢測 AI 生成的內(nèi)容,但其在大規(guī)模應(yīng)用時(shí)表現(xiàn)欠佳,且誤報(bào)率較高。同時(shí),現(xiàn)有的方法往往存在隱私問題,難以在不影響文本質(zhì)量的情況下進(jìn)行大規(guī)模應(yīng)用。
圖|LLM 文本生成和生成水印概述
SynthID-Text的創(chuàng)新在于引入隨機(jī)種子生成器和多層次的水印函數(shù),在每次生成 token 時(shí),隨機(jī)種子會傳遞給多個(gè)水印函數(shù),通過錦標(biāo)賽的方式選出符合水印要求的最高分詞嵌入文本。這種方法確保了生成的文本具備水印特征,同時(shí)不會顯著影響文本流暢性和多樣性。
在 LLM 生成文本時(shí),SynthID-Text 的嵌入技術(shù)分為三個(gè)關(guān)鍵步驟:
隨機(jī)種子生成:輸入上下文后,隨機(jī)種子生成器生成一個(gè)種子,該種子將作為后續(xù)水印嵌入過程的輸入。
錦標(biāo)賽抽樣:隨機(jī)種子作為輸入傳遞給多層次的水印函數(shù)(如 g_1, g_2, g_3),每個(gè)函數(shù)生成候選 token。然后,系統(tǒng)通過多輪錦標(biāo)賽比較不同水印函數(shù)得出的分?jǐn)?shù),選出得分最高的詞嵌入到文本中。
水印嵌入:每次生成新的 token 時(shí),錦標(biāo)賽過程會選擇符合水印條件的詞,而不會顯著偏離原有的 LLM 語言模型分布。
圖|SynthID-Text的基于錦標(biāo)賽的水印
在生成式 AI 應(yīng)用中,文本質(zhì)量和多樣性至關(guān)重要。傳統(tǒng)的水印技術(shù)可能在嵌入水印的過程中犧牲文本的流暢性,導(dǎo)致生成文本出現(xiàn)語法錯(cuò)誤或重復(fù)內(nèi)容。
SynthID-Text 通過非扭曲水?。╪on-distortionary watermarking)技術(shù)優(yōu)化了這一問題,這種水印嵌入方法兼顧了生成文本的質(zhì)量和透明性,確保在不改變生成文本自然性的前提下實(shí)現(xiàn)水印標(biāo)記。
研究表明,單詞級別的水印嵌入不會改變 LLM 原有的文本生成分布,從而保持了文本的流暢性和多樣性。
實(shí)驗(yàn)驗(yàn)證:文本質(zhì)量與水印檢測的平衡
研究團(tuán)隊(duì)對 2000 萬條由 LLM 生成的文本進(jìn)行了大規(guī)模實(shí)驗(yàn),測試了 SynthID-Text 的實(shí)際效果。
研究發(fā)現(xiàn),在非失真模式下(即不改變文本結(jié)構(gòu)和語法的情況下),SynthID-Text 幾乎不會對生成文本的質(zhì)量造成任何影響,而且用戶對嵌入水印的文本與未嵌入水印的文本的滿意度差異僅為 0.01%。這表明,SynthID-Text 能夠在不犧牲用戶體驗(yàn)的前提下,實(shí)現(xiàn)高效的文本水印嵌入。
此外,論文分析了 “單 token 非失真性” 的概念,即在特定配置下,水印算法在生成每個(gè) token 時(shí)不會影響 LLM 的原始分布。這保證了文本質(zhì)量的最大程度保留,使水印嵌入對用戶體驗(yàn)幾乎沒有負(fù)面影響。
圖|SynthID-Text 的檢測性能
研究還分析了 SynthID-Text 的水印檢測性能主要受文本長度和 LLM 生成文本的熵值(entropy)影響。熵值指的是文本生成過程中語言的多樣性,即模型生成新 token 時(shí)的選項(xiàng)數(shù)目。結(jié)果顯示,熵值越高的文本,水印的嵌入和檢測效果越好;而熵值較低的環(huán)境下,水印的嵌入與檢測難度則增加。
研究指出,這主要是由于模型生成的文本選項(xiàng)較少,錦標(biāo)賽抽樣算法無法選擇最優(yōu)的水印詞。
為了提高水印在低熵環(huán)境下的嵌入與檢測性能,研究團(tuán)隊(duì)提出通過增加錦標(biāo)賽層數(shù)的方法來增強(qiáng)水印檢測的可靠性,不過研究也警告,過多的錦標(biāo)賽層數(shù)可能導(dǎo)致熵值耗盡,從而削弱水印的嵌入效果。
因此,在實(shí)際應(yīng)用中,研究建議將錦標(biāo)賽的層數(shù)控制在 30 層以內(nèi),以確保檢測精度與文本生成的平衡。
不足與展望
盡管 SynthID-Text 在隱形水印嵌入方面表現(xiàn)出了顯著的優(yōu)勢,但其在某些應(yīng)用場景下仍存在局限性。主要挑戰(zhàn)包括:
加速文本生成中的應(yīng)用問題:目前,SynthID-Text 尚未對諸如推測性抽樣(predictive sampling)等加速文本生成技術(shù)進(jìn)行優(yōu)化,這意味著在某些應(yīng)用場景中,水印嵌入的效率可能受到影響。
文本編輯與規(guī)避問題:雖然 SynthID-Text 提升了水印的檢測率,但研究團(tuán)隊(duì)也指出,這種水印仍可能被通過重寫或編輯來規(guī)避。因此,在實(shí)際應(yīng)用中仍需要結(jié)合其他檢測技術(shù)以提高魯棒性。
多語言模型的兼容性:當(dāng)前研究的主要焦點(diǎn)是針對英語的文本生成,而對于不同語言的 LLM,水印嵌入與檢測的效果可能存在差異,尤其是在未經(jīng)訓(xùn)練的語言上。
對此,研究團(tuán)隊(duì)表示,他們計(jì)劃未來將水印算法與其他文本生成加速技術(shù)(如推測抽樣)相結(jié)合,進(jìn)一步提升水印嵌入與檢測的效率與精度。同時(shí),針對不同熵值下水印表現(xiàn)的深入研究,也將有助于擴(kuò)展其在更多實(shí)際應(yīng)用場景中的一致性表現(xiàn)。
不止是文字
除了文字,SynthID 還可以為音頻、圖像和視頻添加水印,幫助用戶確定內(nèi)容或部分內(nèi)容是否由谷歌的 AI 工具生成。
據(jù) Google DeepMind 官方博客介紹,在人工智能生成音樂方面,SynthID 將音頻波轉(zhuǎn)換為光譜圖,二維可視化地展示聲音中頻率范圍隨時(shí)間的演變。在計(jì)算出光譜圖后,數(shù)字水印被添加到其中,在轉(zhuǎn)換回波形時(shí),利用音頻屬性確保水印人耳聽不到,不影響聆聽體驗(yàn)。
在人工智能生成圖像和視頻方面,SynthID 將人眼無法察覺的數(shù)字水印直接添加到圖像像素或視頻的每一幀中。經(jīng)過精心設(shè)計(jì),不影響圖像或視頻質(zhì)量,即使經(jīng)過裁剪、添加濾鏡、更改顏色、更改幀速率以及各種有損壓縮方案保存等修改,水印依然保持可檢測性。
Google DeepMind 表示,通過開源代碼,更多的人將可以使用該工具加水印,并確定文本輸出是否來自他們自己的 LLM,從而構(gòu)建可信的 AI。
隨著生成式 AI 技術(shù)的普及,信息透明性和追蹤性變得至關(guān)重要。虛假信息的傳播不僅威脅著社會穩(wěn)定,也對企業(yè)聲譽(yù)和個(gè)人權(quán)益帶來了挑戰(zhàn)。SynthID 的推出,不僅為生成式 AI 文本的溯源和透明化提供了技術(shù)解決方案,也為應(yīng)對虛假信息的擴(kuò)散提供了新思路。
據(jù) Gartner 預(yù)測,到 2028 年,超過 50%的企業(yè)將開始采用專為應(yīng)對虛假信息設(shè)計(jì)的產(chǎn)品和技術(shù),而目前這一比例還不到 5%。在未來,像 SynthID 這樣的工具或?qū)楦餍袠I(yè)提供強(qiáng)有力的保障,幫助社會在信息泛濫的風(fēng)暴中保持信任和透明。
作者:田小婷
編輯:學(xué)術(shù)君