• 我的订阅
  • 科技

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

类别:科技 发布时间:2023-02-09 14:19:00 来源:浅语科技

AI生成文本,又遇新对手!

凭借识别AI生成文本中的“水印”,一种新算法能够准确判断文本到底是谁写的。

无需访问模型参数、API,结果置信度高达 99.999999999994%。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

方法一经发布就引来大量网友围观。这回拿ChatGPT“作弊”,怕不是要更难了?

要知道,最近一段时间,ChatGPT先是成为美国高中生的写作业利器,后面帮专业媒体写稿子,引发巨大恐慌。如Nature、纽约教育部等,都针对ChatGPT发布禁令。

马里兰大学学者们提出的这一新方法,为解决这些麻烦提出了个新思路。

不少网友都觉得,这个方法提出的正是时候,而且效果看着也不错。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

有学者还和美国高中生喊话,你们要做好准备了!

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

作者表示,方法代码将在2月15日免费开源。计算文本由AI生成的概率

所谓模型水印,人类无法看到,但是计算机可以。

这是一种现在被常用于大规模语言模型(LLM)中的方法,能让AI生成的文本带有“特殊标记”。即把信号嵌入到生成的文本中,让算法能从一小段token中检测出来。

最近,OpenAI方面也表示,考虑在ChatGPT中添加水印,以降低模型被滥用带来的负面影响。

这篇最新论文的作者,就想验证下这个想法到底靠不靠谱。他们通过给LLM中嵌入水印,然后再进行检测。其中水印的嵌入不会影响文本生成质量。

具体来说,大规模语言模型每次生成一个token,每个token将从包含大约5万个词汇的词汇表中进行选择。

在新token生成之前,该方法会从基于最近已生成的token为随机数生成器(RNG)提供“种子”,以此来压一个水印。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

然后使用RNG,能将词汇表分为黑名单和白名单,并要求LLM接下来只能从白名单中选择词汇。

如果整段文本中,白名单中的词汇越多,就意味着越有可能是AI生成的。

黑白名单的区分,基于一个原则:

人类使用词汇的随机性更强。

举例来说,如果在“美丽的”后面生成词汇,水印算法会将“花”列入白名单,将“兰花”列入黑名单。

论文作者认为,AI更可能使用“花”这个词汇,而不是“兰花”。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

然后,就能通过计算整段文本中白名单token出现的情况,来检测水印。

如果一共有生成了N个token,所有的token都使用了白名单词汇,那么这段文字只有 2的N次方分之一概率是人类写的。

即便这段文字只有25个词组成,那么水印算法也能判断出它到底是不是AI生成的。

但作者也表示,水印有时候也不一定完全靠谱。

比如模型输出了“SpongeBobSquare”,下一个单词一定会是“Pants”吧?但是Pants会被标记到黑名单里,即认为是只有人才会写的词。

(注:SpongeBobSquarePants是《海绵宝宝》动画片的英文,可理解为一个专有名词)

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

这种情况会严重影响算法的准确性,因此作者将其定义为低熵token,因为模型几乎不会有更好的选择。

对应来看,也会有高熵token,比如“海绵宝宝感觉____”这个句式里,能填入的词汇太多了。

对于这一情况,作者选择针对高熵token制定更强的规则,同时保留低熵token,确保水印质量更好。

与此同时,他们还添加了波束搜索(Beamsearch),允许LLM能够排布一整个token序列,以避免黑名单词汇。

这么做,他们能确保LLM使用白名单词汇的概率在大约 80% 左右,而且不影响文本生成质量。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

举例来看,对于下面这段文字,水印算法认为它有99.999999999994%的可能是由AI生成的。

因为在这段文字中,包含36个token。如果是人类写的,那么文本中应该包含9±2.6个白名单词汇(白名单词汇的概率约为25%)。

但这段文字中,包含了 28个白名单词汇。

计算来看,这段文字由人类写出的概率,仅有 0.0000000000006% (6乘以10的-15次方)。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

如下标注的是文本中的黑名单token。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

需要注意的是,如果想要水印正常发挥作用,并不受到攻击,就必须对文本进行一些标准化处理,并且需要检测某些类型的对抗性提示。

这一方法是对外公开的,将在 2月15日开源代码。

加一个随机秘钥,也能变成保密模式并且托管到API上,这能保证水印不会被篡改。

论文中使用的模型是Meta开源的 OPT-1.3B 模型。

由于不用访问底层模型,所以该检测方法的速度很快,成本也不会很高。

而且可以使用标准语言模型生成带水印的文本,不用再重新训练。网友:似乎很容易绕过?

巴特,不少网友觉得,这个方法的具体实践效果可能远不及理想,质疑之声迭起。

有人提出:

如果我在AI生成的文字基础上,修改几个词,还能被查出来吗?那在替换成近义词后,检测准确率会下降多少?

毕竟大家往往不会一字不改、直接用AI生成的内容。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

对此,论文通讯作者、马里兰大学副教授TomGoldstein回答称:

对于一段自带水印的文字,至少得修改40%-75%的token,才可能成功去除水印。

(如果用其他程序修改内容话),为发生同义词攻击,导致生成内容的质量很低。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

简而言之,想要通过换近义词来消除水印,得大篇幅修改,而且若不是人亲自手动修改的话,效果会很拉胯。

还有人提出:

对于专门设计过的低熵token序列,应该能检测出水印。但是,长度和检测率之间(存在一些矛盾),它们的优先级应该如何权衡?

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

对此,Tom教授表示:

根据设定,使用波束搜索时,绝大多数(通常是90%)的token在白名单上,即使是低熵token,也会被列入白名单。

所以,至少得修改一半以上的token,才能删除水印,而这需要一个超级强大的LLM模型才行,一般人很难接触到。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

不过,研究者们也在论文中承认,这种方法确实存在一些局限性。

比如,检测水印的z统计量,只取决于白名单大小参数γ和生成白名单的哈希函数,和其他不少重要的参数并没有什么相关性。

这就让他人可以在下游水印检测器上做手脚,可以改变水印采样算法,重新部署水印,最终让原本生成的水印失效。

就连OpenAICEOSamAltman也表示:

创造完美检测AI抄袭的工具,从根本上来说是不可能的。

(尽管他说OpenAI打算启用水印大法)

但话说回来,人们为了限制AI生成文字的负面影响,还是煞费苦心——

之前就有人搞出了一个检测ChatGPT的网站,名曰GPTZero,只需要把相应的内容粘进去,几秒内就能分析出结果。

再也不能用chatgpt写作业了,新算法给ai生成文本加水印

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-12 00:45:22

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
...了Nature期刊的封面,研究人员开发了一种名为SynthID-Text的水印方案,已经在自家的Gemini上投入使用
2024-11-09 13:34:00
AI一本正经地胡说八道 有种办法可以识破它
...队在《自然》(Nature)上发表的封面文章提供了一种文本水印方案,可以提高 AI 生成文本的检测精度。AI 生成内容检测的必要性在文本、图像和音乐中,AI 生成的文本是最难
2024-12-23 17:03:00
NeurIPS 2024|水印与高效推理如何两全其美?最新理论:这做不到
近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时
2024-11-22 09:49:00
OpenAI自研反AI神器,憋了两年啥也不是?
...OpenAI为何对这个功能如此纠结?更重要的是,这个所谓的水印真的能百分百破解GPT生成的文本吗?给GPT打“码”想象一下
2024-08-11 19:03:00
OpenAI开发ChatGPT「反作弊神器」,99.9%超高命中率!但没发布
【新智元导读】OpenAI又左右互搏上了,给AI生成的文本打水印,高达99.9%准确率抓「AI枪手」作弊代写。去各大高校图书馆转一圈,会发现头上一副耳机、手边一杯咖啡,电脑上一个
2024-08-06 09:28:00
...训练对应的鉴伪大模型,从而提高鉴伪效率。注入“数字水印”,进行主动防御随着AI技术发展,AI生成的视频已经越来越“精美”乃至“完美”,不要说人眼无法识别,可能连普通的鉴伪大模
2024-12-24 11:23:00
...类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与A
2024-08-16 10:04:00
谷歌发布音乐AI工具MusicFX:一句话就能生成一首音乐
...”的创作工具结合了谷歌此前发布的MusicLM模型和DeepMind的水印技术SynthID,以便在事后识别出它们是否由AI制作而成
2023-12-14 17:26:00
谷歌DeepMind推出SynthID工具,能在AI生成的图像中嵌入隐形水印
...SynthID 的工具,可以在 AI 生成的图像中嵌入人眼不可见的水印,但可以用专门的人工智能检测工具检测出来,以便于区分真实和虚假的内容。该工具已经在谷歌云平台上向部分客户
2023-08-30 10:15:00
更多关于科技的资讯:
定义AI数字化增长服务新模式 数织沅码亮相多地春晚舞台
2026年春节,AI驱动企业全球数字化增长的专业服务平台——数织沅码登陆江苏卫视、浙江卫视等多地春晚舞台,完成首次公开亮相
2026-02-23 11:47:00
中国科技品牌绿联推进充电宝品质升级,让充电更安心
对用户而言,充电宝早已不是偶尔应急的配件,而是通勤、差旅、校园与户外场景中的常备装备。行业也普遍认为,当快充普及、多设备协同成为日常
2026-02-23 13:11:00
引言:腥风血雨已至,智能体元年全面爆发2026年的春天,人工智能领域正经历一场前所未有的变革。当全球科技巨头仍在为生成式AI的迭代速度激烈竞逐时
2026-02-23 13:12:00
以武会春,宇树春晚机器人马年秀出“赛博真功夫”
新春启序,万象更新。在中央广播电视总台2026年春晚舞台上,宇树科技作为春晚机器人合作伙伴第三次登台亮相,携G1与H2人形机器人献上全球首次全自主人形机器人集群武术表演(带集群快速跑位)
2026-02-23 11:47:00
大年初六,位于余杭区“中国飞谷”的重隼智能科技(浙江)有限公司马力全开,以开局即冲刺的姿态,奋力跑出新年发展第一棒。“作为一家深耕无人机具身智能集成创新的科技型企业
2026-02-23 07:58:00
2月20日上午9时,太原武宿综合保税区A座环球优选品牌店的大门准时开启,300余款新春礼盒整齐排列,品类丰富,琳琅满目
2026-02-23 07:29:00
“十五五”开局看河北|淡季不淡,冀东普天产销两旺
新年首月销售额近8000万元,同比增长14.3%淡季不淡,冀东普天产销两旺1月26日,冀东普天线缆有限公司工人正在优化生产设备
2026-02-23 07:37:00
河北日报讯(记者孙也达)2月14日,秦皇岛晟成自动化设备有限公司生产的全球首台套出口型电磁加热多层层压机完成拆解,运往美国
2026-02-23 07:48:00
双轮驱动,智启未来:刘晓春与AI智能体×机器人“姊妹组合战略”的全球布局
2026,智能时代的分水岭2026年的春天,马年春晚的舞台上,一场科技盛宴惊艳了全球观众——30多台国产机器人协同起舞
2026-02-22 12:05:00
新春走基层丨厦企加快数字化转型步伐 提前返岗忙生产赶订单
明翰电气的工人春节期间坚守岗位。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)放置材料、调试机台……正月初五,厦门明翰电气股份有限公司(以下简称“明翰电气”)已忙碌起来
2026-02-22 08:50:00
新春走基层 | 森一量子为赶订单全员在线 生产线满负荷运转
昨日记者走进森一量子,这一企业春节期间全员加班加点。厦门网讯(厦门日报记者 李晓平)长晶、 切割、减薄、抛光、镀膜……当大多数人还沉浸在春节的喜庆中
2026-02-22 08:50:00
我带着一款AI眼镜回家过年
记者带回家的AI眼镜二伯买的宇树机器狗Go2今年的春晚有一个格外醒目的变化——“AI含量”明显提升。年夜饭桌上,亲戚们都在聊各自手机里的各种“AI”App
2026-02-22 07:49:00
中国科大实现碳化硅改性双空位色心的电荷态调控
大皖新闻讯 2月21日,大皖新闻记者从中国科学技术大学获悉,该校郭光灿院士团队在碳化硅改性双空位色心电荷态调控的研究中取得了新进展
2026-02-21 16:48:00
戛纳世界人工智能大会探讨“音乐人工智能”
中国青年报客户端讯(中青报·中青网记者 蒋肖斌)2026戛纳世界人工智能大会(WAICF 2026),近日在法国戛纳举办
2026-02-21 12:10:00
杭州一家高科技创业公司员工 每人领一个陪伴机器人回家过年
春节去各地见见世面长长“脑子”这个春节,大多数打工人都卸下KPI返乡团聚。杭州一家名为镭萌科技的创业公司,却有一群特殊的“员工”在忙着长“脑子”
2026-02-21 08:11:00