• 我的订阅
  • 科技

AI一本正经地胡说八道 有种办法可以识破它

类别:科技 发布时间:2024-12-23 17:03:00 来源:浅语科技

近年来,生成式人工智能在文本、图像、音乐等领域大放异彩。然而,随着生成式人工智能变得越来越强大,人们越来越难以鉴别AI生成的内容。

近日,Google DeepMind 研究团队在《自然》(Nature)上发表的封面文章提供了一种文本水印方案,可以提高 AI 生成文本的检测精度。

AI一本正经地胡说八道 有种办法可以识破它

AI 生成内容检测的必要性

在文本、图像和音乐中,AI 生成的文本是最难以检测的。因为现有的图像和音乐生成技术尚未像文本生成技术一样发达,AI 生成的图像和音乐往往有某些非自然的视觉或听觉特征。AI 生成的内容在整体上效果较好,但具体到细节就显得不够自然。在图像和音乐中,也可以人工添加人类难以发现的水印,在后期检测中通过水印筛选出AI生成的作品。

然而在文本中难以直接添加人类不可见的水印,这是因为文本与图像和音乐不同,每一个文字都是完全可见的。同时,可用于训练 AI 的文本数据也远多于图像和音乐。在庞大的、基于人类写作的语料库的训练之下,AI 已经非常擅长模拟人类的表达方式和语言习惯,甚至能够调整文本的风格和语气,这使得 AI 生成的文本难以直接检测。

尽管 AI 生成的文本与人类创作的文本难以分辨,但 AI 生成的内容可能带有事实性的错误,并不能保证可靠性。无法辨别来源的内容可能会导致虚假信息的传播,也带来了学术作弊、版权争议等种种问题。

比如,在“杭州取消机动车依尾号限行”假新闻事件中,网友用 AI 技术生成的“假新闻”行文严谨、语气措辞得当,也基本符合官方通报的格式,导致了错误信息大规模传播。美国科技新闻网站 CNET 在三个月之内上线了 70 多篇用 AI 技术生成的新闻报道,却被发现其中存在大量基础性错误,包括计算错误、金融概念误解等,不得不暂时叫停AI项目重新审核。

为了避免 AI 技术的滥用,我们需要一种方法辨别文本是否由 AI 生成。

主流检测方法:事前与事后检测

检测 AI 生成的文本是一个分类问题,我们的主要目标是区分一个文本片段是由 AI 生成的还是由人类创作的。通常一个文本检测器对于一个给定的文本片段会给出一个评分,当这个评分超过阈值时,这个片段被认为是 AI 生成的,反之则是人类创作的。

AI一本正经地胡说八道 有种办法可以识破它

文本检测框架(图片来源:根据参考文献 [1] 翻译)

现有的主流检测方法可以分为两大类:事前检测和事后检测。事前检测可以进一步分为基于水印的检测和基于检索的检测。事后检测可以分为基于零样本学习的检测和基于训练的检测。

AI一本正经地胡说八道 有种办法可以识破它

主流检测方法分类(图片来源:根据参考文献 [1] 翻译)

1、事前检测

基于水印的检测是指在 AI 生成的文本中隐藏某些信息以便后续检测。但由于文本的离散性,在文本中添加水印比在图像和音乐中添加水印困难很多。常用的方法是让 AI 生成的文本使用特定的语言风格或者偏向性地使用某些特定的词汇,但这样可能会降低 AI 生成文本的质量。

基于检索的方法是指 AI 服务的提供者将用户通过 AI 生成的文本保存在数据库中。当需要检测目标文本是否由 AI 生成时,将目标文本与数据库中的文本进行匹配,如果相似度较高,则很可能是 AI 生成的。但这种方法需要保存用户数据,可能带来隐私泄露的问题。

2、事后检测

基于零样本学习的检测是指不需要进行任何的训练,仅根据 AI 生成文本的特点来检测一段文本是否是 AI 生成的。通常 AI 生成的文本倾向于使用常见的词汇,句子的长度和结构也更加统一。而人类创作的文本则显得更加随心所欲,每一句的水平也参差不齐。

与人类相比,AI 在记忆细节上能力较强而在逻辑推理上能力较弱。利用这些特点可以在一定程度上区分 AI 生成的文本和人类创作的文本。基于训练的检测是指使用人类创作的文本和 AI 生成的文本构建一个数据集,用这个数据集训练一个分类器来识别 AI 生成的文本。

但这需要收集足够的数据用于训练,并且随着 AI 能力的进步,这样的区分也变得越来越困难。可以看到,事后检测比事前检测要困难许多。为了高精度地筛选出 AI 生成的文本,在事前 AI 生成文本时就添加水印是一个很好的解决方案。

Google DeepMind 的突破:SynthID-Text 水印技术

Google DeepMind 研究团队提出了一种新的水印生成方案,称为 SynthID-Text。它基于之前的水印生成组件,但使用了一种新的“锦标赛采样”方法。SynthID-Text 可以非扭曲(保留文本质量)或者扭曲(以牺牲文本质量为代价提升水印的可检测性)地添加水印。

在扭曲和非扭曲设置下,与现有的最佳方法相比,SynthID-Text 都提升了水印的检出率。

AI一本正经地胡说八道 有种办法可以识破它

水印生成框架(图片来源:根据参考文献 [2] 翻译)

上图中展示了大语言模型生成文本的原理以及之前水印生成的框架。大语言模型的文本生成是基于上下文的,它会根据输入的文本序列计算下一个词汇的分布,然后从这个分布中抽样出下一个词汇。

一个生成式的水印方案通常包含三个部分:一个随机数生成器、一个采样算法以及一个评分函数。水印生成的过程是:首先使用随机数生成器根据前面的文本以及水印键生成一个随机数,然后采样算法利用这个随机数从词汇的分布中抽样出下一个词汇。

给出一段文本以及一个水印键,评分函数提供一个分数来量化当前文本中含有水印的可能性,当分数超过一个阈值时就认为这段文本中含有水印。

AI一本正经地胡说八道 有种办法可以识破它

锦标赛采样(图片来源:根据参考文献 [2] 翻译)

SynthID-Text 提出了一种新的“锦标赛采样”方法,上图是锦标赛采样方法的一个例子。当向模型输入“...我最喜欢的热带水果是”时,模型计算出下一个词汇的分布,其中“芒果”的概率是 0.5,“荔枝”的概率是 0.3,“木瓜”的概率是 0.15,“榴莲”的概率是 0.05。在不加水印的正常生成中,模型会按这个概率直接采样出下一个词汇。

在锦标赛采样中,模型先根据随机数种子生成三个随机的水印函数,然后再从词汇的分布中采样出八个词汇,将这八个词汇两两组合后进行竞赛,在每一轮竞赛中,由一个水印函数决定每一对组合中的胜出者。经过三轮竞赛后,最终的胜出者就是模型的输出结果:“芒果”。

在锦标赛采样中,词汇是根据水印函数的偏好采样得出的。因此添加水印的文本会在水印函数上有更高的评分。在检测时只需要评估每个词汇在对应的水印函数下的评分,再将评分加和就可以得到这段文本包含水印的可能性。

水印的添加是通过改变采样方法实现的,它会改变模型输出下一个词汇的分布,这看起来不可避免地会影响生成文本的质量。

然而,由于采样方法中使用了随机数种子,尽管在某一随机数种子下词汇的分布会被改变,但在对所有随机数种子进行平均后可以得到和原始分布相同的结果。

SynthID-Text 可以在适当的配置下避免影响词汇的分布从而保证文本的质量,也可以以损失一部分质量为代价提高水印的检出概率。

SynthID-Text 方法在 Google DeepMind 推出的 Gemini 人工智能模型上经过了两千万次用户测试。测试结果表明 SynthID-Text 在添加水印的同时并不会降低文本的质量。同时,SynthID-Text 不会产生太多的时间和计算开销,可以被大规模地应用于生产实践之中。

结语

事后检测文本是否由 AI 生成是非常困难的。随着 AI 能力的增强,事后检测会变得越来越困难,检测和反检测将会是无止境的技术竞赛。水印方法提供了一种可能的解决方案,但这需要大语言模型的提供者在生成时就预先加入水印。如果用户使用的模型没有主动加入水印,就难以在事后进行检测。

此外,用户还可以使用开源模型,或者对添加了水印的文本进行二次编辑来逃脱检测。这些问题都有待进一步解决。

未来,随着生成式人工智能的普及,如何检测 AI 生成的内容会变得越来越重要。SynthID-Text 证明了水印技术在文本生成中大规模应用的可能性,但水印技术面临的困难也说明检测并不只是一个技术问题。

解决这个问题还需要各方共同努力,形成相关的行业标准以及法律法规,从而推动AI走在为人类服务的正轨之上。

责任编辑:随心

文章内容举报

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-12-23 21:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?
...可能是无关痛痒的观点,但不少也出现了「一本正经胡说八道」。与此同时,AI 生成内容也在一步一步扩大自己的「领土」,从互联网延伸真实世界。海外技术社区 Hacker News
2023-06-29 16:19:00
谷歌DeepMind研究再登Nature封面,隐形水印让AI无所遁形
...辨别哪些内容是AI生成的。养大了这些擅长一本正经胡说八道的AI,人类面临的麻烦也随之而来。(LLM:人与AI之间怎么连最基本的信任都没有了
2024-11-09 13:34:00
“一本正经胡说八道”:AI幻觉到底有多可怕?
...幻觉乱象,层出不穷AI大模型固然“聪明”,但在“胡说八道”方面也毫不逊色。虚构引用、杜撰人物、逻辑混乱,在与AI的互动中屡见不鲜。例如,它会引用一篇根本不存在的“2023年哈
2025-04-01 19:54:00
AI幻觉:它真的会一本正经胡说八道!
...能降低AI幻觉?AI看起来很方便,但 AI 一本正经的“胡说八道”有时候真的让人非常头疼,给的信息经常需要反复核实,有时反而不如直接上网搜索来得实在。那么,如何应对AI幻觉呢
2025-02-19 18:57:00
再也不能用chatgpt写作业了,新算法给ai生成文本加水印
AI生成文本,又遇新对手!凭借识别AI生成文本中的“水印”,一种新算法能够准确判断文本到底是谁写的。无需访问模型参数、API
2023-02-09 14:19:00
“80后死亡率高”疑似是AI造谣,AI已经开始胡说八道了
...2%。”AI无中生有的能力让人心颤。在AI业界,这类“胡说八道”的本领被称为“幻觉(hallucination)”
2025-03-11 05:56:00
...向平台投诉,但感觉难以解决问题。AI生成的视频真的没办法识别、治理吗?申城好网民专家、中国图象图形学学会(CSIG)文档图像分析与识别专委会常务委员、上海市图像图形学学会(S
2024-12-24 11:23:00
AI 胡说八道怎么办?牛津大学开发了一种“测谎”方法
胡说八道不可怕,一本正经的胡说八道才可怕,你因为一本正经而信了ta的胡说八道,更可怕……这就是当下我们(捏着鼻子)使用 AI 时需要面对的现状。如何避免 AI 生成虚假的事实内容
2024-07-01 11:40:00
OpenAI自研反AI神器,憋了两年啥也不是?
...OpenAI为何对这个功能如此纠结?更重要的是,这个所谓的水印真的能百分百破解GPT生成的文本吗?给GPT打“码”想象一下
2024-08-11 19:03:00
更多关于科技的资讯:
主流商用办公笔记本怎么选? 锐龙7 8745H高性价比产品推荐
在数字化时代的今天,工作效率的提升已经成为企业在激烈市场环境中获取竞争优势的根本。作为打破时空壁垒的生产力加速器,商用办公笔记本已从传统的生产力工具跃升为企业数字化转型的核心引擎
2025-10-14 16:16:00
“周末去哪儿耍呢?”“找个厂子耍。”据媒体报道,如今,工厂游似乎成了很多年轻人的休假选择。小红书上也出现了很多假期如何工厂游的攻略
2025-10-14 12:00:00
今心与人格频率学:以东方智慧开启全民人格成长新时代
人格频率学苑创始人今心,以十余年九型人格研究为基础,敏锐发现传统人格分类模型的局限——无法精准界定群体特质,且难以解释同型号个体的差异化生命状态
2025-10-14 08:57:00
中新经纬10月13日电 题:2025诺贝尔经济学奖选择背后的时代深意作者 程实 工银国际首席经济学家10月13日,2025年诺贝尔经济学奖得主揭晓
2025-10-14 09:01:00
从国家专利到首个“酶解宠粮”标准,纯福建立行业新门槛
近年来,国内宠物食品行业正逐步告别低质低价竞争,转向以科研实力和产品力为核心的高质量发展阶段。这一转变标志着养宠观念的升级
2025-10-14 09:27:00
珍爱网:让信息安全成为爱情最坚实的底色
“我填写的信息会不会被泄露?”“万一遇到骗子怎么办?”随着网络交友和线上社交的普及,用户在享受便捷的同时,对信息安全的担忧也日益增加
2025-10-14 09:27:00
田轩:2025诺贝尔经济学奖,告诉了中国什么?中新经纬10月13日电 题:2025诺贝尔经济学奖,告诉了中国什么?作者 田轩 清华大学国家金融研究院院长
2025-10-14 09:37:00
苹果宣布向清华大学提供新一笔捐赠
10月14日,苹果官网发布公告宣布向清华大学启动一项新的捐赠计划,进一步深化公司对推动中国环境教育发展与培养下一代气候行动领袖的长期承诺
2025-10-14 10:56:00
安全生产是企业的“定盘星”,科技创新是安全的“护航舰”,职工健康是发展的“压舱石”。在生产线粉尘防治这一安全生产难题面前
2025-10-14 07:06:00
南京北站率先应用“智能模板无人工厂”算法是“图纸”,数据为“建材”南报网讯(记者何钢通讯员宁建轩)“机器人工友”精准协作
2025-10-14 07:33:00
乘“数”而上,构筑竞争新优势——河北以数字经济赋能高质量发展(二)3组数据,见证河北数字产业发展的澎湃动能——综合算力指数连续2年排名全国第一
2025-10-14 08:01:00
厦门网讯(厦门日报记者 沈彦彦)近日,厦门市商务局、厦门市财政局联合印发《厦门市促进直播电商产业园(基地)高质量发展扶持办法》(以下简称《扶持办法》)
2025-10-13 08:47:00
牢记嘱托 感恩奋进—— 安徽往前赶 | “风神之眼” 开启智慧送风时代 美博助推安庆宜秀“智造” 出海
大皖新闻讯 “人在哪,风就到哪!”10月10日,“牢记嘱托 感恩奋进 —— 安徽往前赶” 集中采访团走进安庆市宜秀区美博集团安庆智能化制造基地
2025-10-13 09:51:00
近日,在中国人民银行雄安新区分行指导下,中国银行河北雄安分行推动数字人民币硬钱包在雄安新区容东片区南文营社区食堂正式启用
2025-10-13 10:13:00
广州:“以税赋能”提振消费 黄金假期“好旺好彩”
羊城焕彩,共贺金秋。今年国庆假期与中秋佳节“快乐叠加”,又恰逢十五运会举办的冲刺阶段,广州旅游、餐饮、零售等消费场景迎来多轮热潮
2025-10-13 10:21:00