• 我的订阅
  • 科技

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?

类别:科技 发布时间:2023-06-29 16:19:00 来源:雷科技

2 月初,随着 ChatGPT 和微软 Bing AI 接连引爆互联网,ChatGPT 概念股应声而起,其中知乎因为大量问答被广泛地用于生成式 AI 的训练,股价一度暴涨 31%,之后百度文心一言发布时又涨了一大波。

但到了 4 月,一位网友就在知名程序员社区 V2ex 发帖感慨:「ChatGPT 会是知乎最大的敌人。」

不仅是他,很多人都发现知乎已经充斥了大量 AI 生成的回答,有些可能是无关痛痒的观点,但不少也出现了「一本正经胡说八道」。与此同时,AI 生成内容也在一步一步扩大自己的「领土」,从互联网延伸真实世界。

海外技术社区 Hacker News 上有人指出,一家网红营销机构网站上的一篇博文出现了「抱歉,作为一种 AI 语言模型,我无法预测未来的事件或趋势」的提醒,类似的话语还出现在卡塔尔的购物中心目录和芬兰的一家电子产品商店的网站等地方。

更多 AI 生成的虚假内容,或许还没有被发现。

没人想要一个虚假的世界

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?

图/AI生成

很多人可能还记得,今年 3 月网上流传出一系列「特朗普被捕」的照片,虽然后续大量报道都指出其为 AI 生成的虚假照片,但照片刚开始被热传时,国内外社交平台上都有不少人信以为真。而后来出现的「甘肃火车事故」「八角大楼被袭」假新闻,也一次又一次挑起了人们的神经。

过去半年我们已经知道,ChatGPT 等生成式 AI 会不顾真假,生成海量似是而非的内容。而由 AI 生成的虚假内容又会被其他 AI 拿来学习后,再生成更加以假乱真的内容。甚至,AI 还可以根据用户的个人喜好一对一地生成虚假信息。因为 AI 可以扩大和再生产假新闻,未来可能造成更加严重的舆论造假。

更大的问题是,如果未来互联网甚至是真实世界都充斥着各种 AI 生成的虚假内容,一切都会崩溃。而从文字到图片再到声音,今天 AI 生成的内容与真人创作的内容之间变得越来越难以分辨,就像大部分人已经无法分辨 AI 孙燕姿、AI Drake 与真人声音。

同时 AI 的进化速度也太快了。几个月前我们可能还在说 AI 绘画「不会画手」,但等到 Midjourney V5 新版本推出之后,AI 不仅在「画手」上越发娴熟,各种细节也变得更逼真。在针对 AI 歌手的回应中,孙燕姿也看到了这一点:

「你可能会反对,说我还是能分辨出区别的,它没有情绪,没有音调和呼吸的变化。很抱歉,我怀疑这只是一个非常短期内的回应。」

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?

图/孙燕姿

所以问题已经不在于我们能不能分辨 AI 生成的内容,而是我们应该如何辨认出 AI 生成的内容。

用「魔法」打败「魔法」?

人工识别首先就不现实,先不说人工分辨 AI 生成内容的准确性,我们还需要投入海量的人力。

去年年底 ChatGPT 发布之后,很多人就用它来生成论文,并取得了很好的成绩,同时也吸引了更多的学生效仿。随后,巴黎政治学院在内的一些全球知名学府纷纷出台了 ChatGPT 禁令。但据在线课程供应商 Study.com 此前发起的一项调查显示,1000 名 18 岁以上的学生中,超过 89%的学生都在使用 ChatGPT 来完成家庭作业。

但这个问题总要解决,而最好的办法,可能还是用「魔法」打败「魔法」?

众所周知,一个社区的核心是用户与用户之间的交流,而 AI 生成的虚假内容一旦泛滥很容易摧毁这种交流,这也是所有在线社区极力避免的。但方法呢?除了依靠个人去辨别,很多时候我们又必须依赖 AI,比如前文提到 V2ex,其站长@Livid 为了分辨 AI 生成的灌水内容,就会直接反过来询问 AI「是否由 AI 生成」,以此作为是否封禁用户的依据。

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?

图/V2ex

问题是这种方法还是存在太多的不确定性。

就在 ChatGPT 刚推出的几天后,OpenAI 宣布联合哈佛大学等高校和机构一起打造了 AI 检测器——GPT-2 Output Detector(GPT-2 输出检测器)。顾名思义,GPT-2 Output Detector 是基于 GPT-2 模型微调输出的工具,对基于 GPT-3.5 的 ChatGPT 实际效果并不好。

于是今年 2 月 1 日,OpenAI 转头又推出「AI 生成内容识别器」,目的是识别文本由 AI 生成还是人类撰写,本质上是一个辨别真实内容和 AI 生成内容的分类器。不过,OpenAI 在博客中指出,该识别器对 AI 生成内容的检测成功率仅为 26%:

可能还不如网友瞎猜。

国内也出现了类似的 AIGC-X。这是一款由人民网下属传播内容认知国家重点实验室、中国科学技术大学、合肥综合性国家科学中心人工智能研究院联合推出的 AI 生成内容检测工具,支持对 AI 生成内容和人工生成内容的分辨。尽管有报道称 AIGC-X 对中文文本检测的准确率超过 90%,但实测并不如意。

AIGC大肆污染互联网,防范垃圾内容要“用魔法打败魔法”?

即便有这么多错误,图/AIGC-X,Bing

可以说到目前为止,所有试图用 AI 打败 AI 的尝试都没有成功,本身这条路径也存在不少争议,有人就将其形容为新时代的「自相矛盾」——用最强的矛打最强的盾。

相比之下,「水印」成了越来越广泛的选择。5 月谷歌 I/O 大会上,谷歌率先宣布公司的每一张 AI 生成图片都会内嵌水印,水印无法肉眼识别,但可通过谷歌搜索引擎等软件读取并以标签显示出来,用以提醒用户该图片由 AI 生成。不久后,Shutterstock、Midjourney 等 AI 应用也宣布将支持这种新的标记方法。

但 AI 生成文字还在等待一个切实可行的方案。在 AI 生成内容识别器失败之后,OpenAI 也在考虑在生成的文本中加入数字水印,以降低模型被滥用带来的负面影响。OpenAI 对齐团队(主要负责系统安全性)负责人 Jan Leike 表示,OpenAI 已经探索在文本中加入水印。

不过,OpenAI CEO Sam Altman 在接受采访也提醒到,不存在一个完美的 AI 生成文字识别工具,原因是人们总会弄清楚他们要修改多少文字,还会出现修改输出文本的其他工具。

写在最后

之前在某个论坛上看到一个帖子,一位网友通过搜索引擎跳到知乎的一则回答,看到了一半才意识到这则回答大概是由 AI 生成,瞬间有种被喂 x 的感觉。

关键是如果主动使用 ChatGPT 之类的生成式 AI,我们可能对它的真实性、胡说八道都会有一定的预期,但显然我们无法阻止其他人使用并发布 AI 生成的虚假内容。打个比方,如果对历史并不熟悉的人,在知乎上看到一则言之凿凿讨论亚瑟王的回答,会不会误认为亚瑟王是真实存在的人物,甚至是一位女骑士(型月作品中的设定)。

但坦白讲,除了很明显的 AI 生成风格,我们很难在熟知领域之外分辨内容是否由 AI 生成,唯一能做的,可能就是更加审视我们所看到的内容。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-06-29 17:45:38

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...。 多起AI造谣事件背后,造谣者的动机主要是为了获取互联网内容平台给予创作者的点击量、阅读量奖励等。此类生意并不新鲜,只不过,过去这些人炮制稿件,至少还需要认识几个字,需要
2024-07-13 16:27:00
...闻内容”,变成了借新闻机构的名义散发假消息。当下的互联网世界里,已经充斥着人工生产的垃圾信息污染。仅在中文互联网上,人们就能搜索到空洞无物、废话连篇的文章以及试图用虚假的知识
2024-01-28 02:06:00
中文互联网正在被AI污染
...虚假新闻,它们曲折、离奇,足够耸人听闻。AI制造充斥互联网,连漂亮小姐姐都可以一键生成。在AI的加持下,无意义的内容呈指数级增长,假新闻、标题党获得大量曝光。AI不但没有解放
2023-05-19 14:07:00
“炼金术”的互联网翻红记
“炼金术”的互联网翻红记 2021年6月8日,英国康沃尔。英国艺术家乔·拉许(Joe Rush)利用电子废弃物设计了一座模仿拉什莫尔山风格的领导人雕塑
2023-01-10 21:01:00
中国垃圾处理:利用互联网,开启新天地
...人工负担,为垃圾分类的普及与推广提供了有力支持。 互联网在垃圾分类领域的应用,极大地提升了分类的准确性和参与度。通过开发垃圾分类APP、小程序等工具,居民可以便捷地查询各类
2024-08-06 14:31:00
在中文互联网搜个攻略:比登天还难
...生活类的信息,没有技术含量, AI 完全能驾驭,靠提取互联网上的已有信息,很容易糊弄过去。但,游戏里遇到的问题,一般都特具体,特细节。比如冷门物品的掉落机制,某一剧情的另一选
2025-01-04 07:45:00
AI生成内容的隐患:当AI只学习AI 网络将充斥无意义的内容
...前,大多数 AI 语言模型(如 ChatGPT 和 OpenAI)都是基于从互联网上获取的大量数据进行训练的,而这些数据大部分是由人类生成的
2023-06-20 13:21:00
中国垃圾处理:利用互联网,开启新天地
...发和推广需要政府、企业和科研机构的共同努力和投入。互联网技术的引入为垃圾处理带来了新的生机。智能分类系统的出现,大大提高了垃圾分类的准确率,减轻了人们的工作负担。居民只需通过
2024-11-29 14:37:00
花一万元植入DeepSeek,一场没有终点的流量游戏
...:网络SEO(搜索引擎优化),这门针对搜索结果做优化的互联网“上古生意”,正以一种新形态复兴—— GEO(Generative Engine Optimization
2025-09-05 14:56:00
更多关于科技的资讯:
12月26日,位于杭州云栖小镇的国家机器人检测与评定中心(总部)浙江检测中心(以下简称“浙江检测中心”)正式启用。机器人从样机走向量产
2025-12-27 08:10:00
喜报|米糠云顺利通过双ISO体系认证,安全与品质再上新台阶
近日,深圳市米糠云科技有限公司顺利通过ISO27001信息安全管理体系认证与ISO9001质量管理体系认证。这标志着公司在信息安全管理和质量管理方面达到了国际标准
2025-12-27 14:34:00
退货仓分拣 “堵点” 怎么破?快宝共配给出答案
近年来,电商与直播电商的迅猛发展,不仅催生出庞大的正向物流需求,更让逆向物流成为快递行业名副其实的“蓝海”。消费者退换货需求呈爆炸式增长
2025-12-27 14:36:00
京东跨年盛典开启 送好礼官方直降五折起 还能抽祝福“大排面”
岁末迎新,跨年不只是一种仪式,更是一场表达与传递的情感盛宴。京东今年再度打造“年度宠粉”跨年盛典,不仅有众多官方直降5折起的尖货好物
2025-12-27 14:36:00
专为X3D处理器打造,技嘉X870E X3D系列主板全面上线
2025年最热门的CPU毫无疑问当属AMD锐龙X3D系列,而技嘉作为AMD核心合作伙伴之一,专为AMD X3D系列处理器量身定制了X870E X3D系列主板
2025-12-27 14:37:00
58同城2025中国好雇主盛典在深举行,勾勒数智时代雇主价值新坐标
12月26日,58同城2025“中国好雇主”盛典在深圳举办。作为国内极具影响力的雇主品牌盛会,本届盛典以“数智驱动,百业共生”为核心主题
2025-12-27 14:38:00
从“终于有了”到“真的好用”:“山大v卡通”鸿蒙版如何回应期待,定义智慧校园新体验
鲁网12月27日讯“终于有NFC校园卡了,自己的学校必须给个好评!”“NFC终于上了!” 在华为应用商店的评论区,山东大学师生们的真实留言
2025-12-27 17:30:00
想在短视频的蓝海遨游?别错过这部“实战指南”
都说“万物皆可短视频”,哪些内容让你眼前一亮?电筒拍大片、夜空光魔法、特效变装秀、用烘焙复刻文物、把大好河山“穿”在身上……在这个创意无限的世界里
2025-12-27 19:55:00
“新”中有数|福建首张文旅研学领域数据产权登记证书落地福州
福州新闻网12月27日讯(记者 颜澜萍)近日,福州冶城集团所属企业福建百宝图科技有限公司通过福建省大数据集团旗下福建省数据产权登记平台
2025-12-27 21:00:00
12月26日,杭州市市场监督管理局召开专题新闻通气会,对外公布了2025年不锈钢真空杯与儿童旅游鞋两类产品的质量比对结果
2025-12-27 07:39:00
昨天下午,2025“梦溪杯”宋韵文化创新大赛颁奖典礼在杭州凤凰里文创园举行。自10月15日启动至11月20日截稿,大赛共收到来自英国
2025-12-27 07:39:00
杭州市西湖区后陡门58号,原本只是城市边缘一个普通的小村子,仅仅三年,这里已经蜕变成“种地星”人的共同家园。这个开园仅两个多月的农文旅融合空间
2025-12-27 07:39:00
装有红酒的纸箱从1米多的高度多次抛下,又被送入抗压测试机内,接受300公斤的压力测试,再经斜面冲击台俯冲撞向铁板,红酒依然完好无损……经过这一系列流程
2025-12-27 07:39:00
近日,智联招聘发布的《2025雇佣关系趋势报告》显示,78.2%的职场人每周至少使用一次AI工具开展工作。该《报告》基于大量调研问卷生成
2025-12-27 07:39:00
北京2026人形机器人半马全面升级
原标题:北京2026人形机器人半马全面升级明年4月19日开启“人机共跑” 赛事报名通道正式开启2025年4月19日,北京亦庄半程马拉松暨人形机器人半程马拉松在北京亦庄鸣枪开跑
2025-12-26 15:22:00