• 我的订阅
  • 科技

chatgpt「克星」来了

类别:科技 发布时间:2023-01-10 12:37:00 来源:浅语科技

你说ChatGPT,它写的东西逼真到傻傻分不清?

没关系!

现在,它的“克星”来了——

一位华人小哥专门搞了这么一个网站,专门鉴别文字到底是出自于AI还是人类。

你只需要把相应的内容粘进去,几秒内就能分析出结果。

比如这段:

它:“妥妥的人类~”

至于这段:

它:“就知道是AI。”

如此神器一出,可谓迅速俘获大家的芳心。

chatgpt「克星」来了

这不,直接把服务器都给挤崩喽(好在还有个备用的)。

chatgpt「克星」来了

这下,那些用ChatGPT写作业的“熊孩子”也要惨啦?是人还是ChatGPT?GPTZero:看我的

这个网站名叫 GPTZero。

它主要靠“perplexity”,即文本的“困惑度”作为指标来判断所给内容到底是谁写的。

NLP领域的朋友们都知道,这个指标就是用来评价一个语言模型的好坏的。

在这里,每当你喂给GPTZero一段测试内容,它就会分别计算出:1、文字总困惑度

这个值越高,就越可能出自人类之手。

chatgpt「克星」来了

2、所有句子的平均困惑度

句子越长,这个值通常就越低。

chatgpt「克星」来了

3、每个句子的困惑度

通过条形图的方式呈现,鼠标悬浮到各个方块就可以查看相应的句子是什么(这里就两块,因为我此时输入的测试内容就俩句子)。

chatgpt「克星」来了

之所以要绘制这样的条形图,作者也作出了解释:

根据最新的一些研究:人类书写的一些句子可能具有较低的困惑度(前面说过,人类的困惑度是比较高的),但随着继续写,困惑度势必会出现峰值。

相反,用机器生成的文本,其困惑度是均匀分布的,并且总是很低。

除此之外,GPTZero还会挑出困惑度最高的那个句子(也就是最像人写的):

chatgpt「克星」来了

规则就是这些,接下来实际测一测。测试1:成功

首先来一段最新的英文新闻(目前还不支持测中文):

chatgpt「克星」来了

将它粘贴进测试框(需注意每句至少5个单词,建议每段能有10个句子,结果会更准一些)。

很快,GPTZero计算出这段文字的总文字困惑度为27,句子平均困惑度为171.2,每条句子的困惑度图长这样:

chatgpt「克星」来了

以及困惑度最高的句子的值为476。

看这个结果,估计你也猜出了GPTZero的答案:

是人类写的。

chatgpt「克星」来了

答对了。测试2:失败

来一段ChatGPT的。

chatgpt「克星」来了

将内容粘贴进测试框,得出这段文字的总文字困惑度为31,句子平均困惑度为76.67,每条句子的困惑度图长这样:

chatgpt「克星」来了

以及困惑度最高的句子的值为99。

看起来,每项困惑度值都和上面那段差距都挺大的,应该能猜出来是AI写的吧。

不过遗憾的是,GPTZero无法给出答案,还希望我们再多加一点文字试试。

chatgpt「克星」来了

显然,这段话字数够多,但句子不够多,无法让GPTZero一眼识破ChatGPT的“伪装”。测试3:成功

那我们再来一段ChatGPT的试试。

chatgpt「克星」来了

这回内容够长,句子也够多。

果然没问题了,GPTZero直接答对:

chatgpt「克星」来了

好像确实摸出来一点门道:

那就是字多的同时,句子数量也一定要多,至少5句,好让GPTZero通过直方图的分布加码识别,最后的准确率就可以提高一些。

另外还需要提的是,我们发现在挑战失败的情况中,除了上面这种识别不出来的时候,也有直接识别错误的——

比如把AI写的判断成人写的:

chatgpt「克星」来了

chatgpt「克星」来了

把人写的新闻判断成AI的:

chatgpt「克星」来了

chatgpt「克星」来了

这种情况按照上面所说的窍门,再多加点内容可能就能将结果扳回来。

(注意是可能哈,就上面这段新闻,我们把所有内容都粘进去了,它也说不行,还说要再多来点。)普林斯顿华人小哥出品

创建该网站的,是一个22岁的华人小哥EdwardTian,来自加拿大多伦多。

目前是美国普林斯顿CS专业大四学生,辅修认知科学和新闻学,对软件工程、机器学习等有浓厚的兴趣。

chatgpt「克星」来了

他现在微软实习,曾在BBC、贝灵猫等公司撰写过科技稿件,还曾加入到地图工具Representable的创始团队。

学习期间,他曾来到清华大学参加为期四周的城市研究研讨会。

据他表示,这个应用程序是新年假期在咖啡店完成的。

之所以想要开发这款应用程序,简而言之就是因为有太多ChatGPT炒作,人类应该知道有哪些是AI写的文章。

目前仍处于准系统阶段,预计在接下来几周内改进模型和分析。

除此之外,他还透露,正在测试由学生撰写的新闻文章数据集,并希望最终能发表论文。更多ChatGPT杀手

事实上,也不只有这位小哥看ChatGPT不顺眼了。还有其他人类组织也相应开发了AI文本检测器,AKA ChatGPT杀手。

大体思路也都差不多,那就是“用魔法打败魔法”,用AI写的东西来训练新AI。

前阵子,OpenAI自己联合哈佛等高校机构联合打造了一款检测器:GPT-2OutputDetector。

chatgpt「克星」来了

作者们先是发布了一个“GPT-2生成内容”和WebText(专门从国外贴吧Reddit上扒下来的)数据集,让AI理解“AI语言”和“人话”之间的差异。

随后,用这个数据集对RoBERTa模型进行微调,就得到了这个AI检测器。其中人话一律被识别为True,AI生成的内容则一律被识别为Fake。

(RoBERTa是BERT的改进版。原始的BERT使用了13GB大小的数据集,但RoBERTa使用了包含6300万条英文新闻的160GB数据集。)

另一位早年代表选手,也因为这次新进展再次被提及。

chatgpt「克星」来了

它就是MIT-IBM沃森AI实验室的以及哈佛NLP实验室开发的 GLTR模型。

chatgpt「克星」来了

它主要通过对文本进行统计分析和可视化,而用来检测的是最初用来生成文本的相同or类似模型。目前主要支持GPT-2和BERT两个模型。

由于输出是模型知道的所有单词排名,根据排名对文本每个单词进行颜色编码,前10名是绿色,前100名是黄色,前1000名是红色,紫色则是不太可能出现的词。

如果一段文本黄绿色过多,那么这段文字主要是由AI生成的。

此番GPTZero再度亮相,不少网友惊叹:Incrediblework!

chatgpt「克星」来了

但也有人表示,文本检测器根本就是一场失败的军备竞赛,他们的实际效果并不好。也阻挡不了ChatGPT的发展。

chatgpt「克星」来了

与此同时,还有网友探讨起关于「文章是否需要明确指示由AI还是人类编写」的必要性。

有位词曲创作者认为,这是有必要的,就像在看杂志时会标注“广告”,这应该是一个简单的要求。

chatgpt「克星」来了

但有网友立即表示反对,为什么要设置障碍?这就跟使用PS然后加上Adobe水印,对产品没有任何益处。

chatgpt「克星」来了

对于这个问题,你怎么看呢?

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-01-10 13:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

人工智能写作检测工具不靠谱 美国宪法竟被认为是机器人写的
...文本中“突发”的现象。本质上,突发性评估整个文本中句子长度和结构的可变性。人类作家经常表现出动态的写作风格,导致文本具有可变的句子长度和结构,而人工智能生成的文本往往更加一致
2023-07-17 16:06:00
揭秘iPhone里的Transformer:基于GPT-2架构 | MIT校友出品
...文章模型有时也会预测即将出现的多个单词,但这仅限于句子语义十分明显的情况,比较类似于Gmail里的自动完成功能。△图源
2023-09-18 18:05:00
...英语的记忆,让他的课堂更精彩。有一次,为了帮助理解句子结构,饶立钧甚至用了电视剧《甄嬛传》里小主和丫鬟的例子打比方,一下就吸引了大家的注意力。在生活中,饶立钧也很关心学生,学
2023-12-18 15:29:00
Sora“超级涌现力”将把AI引向何方
...中,对若干个单词进行有意义组合,从而连缀成一个会意句子;在保持合理的空间布局下,对众多图像小块进行有意义组合,拼合为一幅精彩图像;在保持一致的连续时空内,对一系列时空子块进行
2024-02-24 05:43:00
苹果AI翻车?写作工具难应付脏话,对敏感话题“罢工”
...调用Apple Intelligence,但如果尝试改写包含脏话的段落或者句子,就会看到一条系统警告,告知用户:“Writing Tools 不是为处理这种类型的内容而设计的
2024-08-07 09:29:00
新的一年,教你 2 步用空闲时间写篇小小说
...用一个小学语文课就教过的办法: 扩写。从几个单独的句子开始没有大纲无所谓,只要能把故事的起承转合写清楚就 OK。我们就从几个最简单的句子开始。这里我来举个例子。在前一步,我选
2023-01-28 13:00:00
本来想用AI来打败AI:结果惨烈翻车
...就证明内容越有可能是人类创作的。而突发性,指的就是句子结构的变化程度。毕竟人类跟AI不同,在写东西的时候句式可能一会儿长一会儿短,追求的就是一个变化多端,AI则更倾向于使用统
2023-07-05 05:23:00
互联网企业如何在线编写产品说明书?
...,避免使用过于专业化或复杂的术语。使用简单的语言和句子,使用户能够轻松理解产品的功能以及如何使用它。结构清晰:产品说明书应该有清晰的结构和章节,以便用户能够快速找到所需的信息
2023-08-24 11:36:00
首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务
...据前加上相应的模态标记。文本数据:[TEXT]这是一个文本句子音频数据:[SPEECH][Hu262][Hu208][Hu499][Hu105]交错语音和文本(Interle
2024-11-23 09:43:00
更多关于科技的资讯:
鲁网1月19日讯近日,国家水利部正式发布《节水先进成熟适用技术设备名录(2025年)》。在此次国家级节水技术评选中,泰安市科技创新成果“双星闪耀”——东平力创科技有限公司与泰安市智慧能源科技有限公司的领先技术成功入选
2026-01-19 11:06:00
“智改数转”激活新动能 固安制造业向“新”力十足
河北新闻网讯(万倩、臧子祺、韩佳臻)近日,在固安县萨牌智能驱动技术(河北)有限公司的测试车间里,一台智能叉车正静默而精准地执行着指令
2026-01-19 11:06:00
光储直柔一体机亮相武汉工商学院
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)1月16日,一台可实现电力能源“自产、自储、自用、自调”的光储直柔一体机在武汉工商学院正式亮相
2026-01-19 12:01:00
江南时报讯 近日,苏州横扇中新智地产业园区1138KWp分布式光伏项目顺利并网发电。从方案落地到设备投运,吴江横扇供电所以“靠前对接
2026-01-19 13:05:00
重庆钢铁成功取得CRCC认证,正式进入铁路耐候钢市场
近日,重庆钢铁铁标耐候钢产品顺利通过中铁检验认证中心(CRCC)权威认证,标志着公司在该产品质量管理体系与实物质量上全面契合铁路行业严苛标准
2026-01-19 14:00:00
携手商家共拓增长新空间助力线下消费,抖音生活服务城市生态大会济南站启幕
鲁网1月19日讯1月16日,“域见美好生活·这一站济南”2026抖音生活服务城市生态大会暨北部大区年度盛典在济南召开。大会由山东省文化和旅游厅
2026-01-19 11:40:00
京东联合五大服饰品牌发布2025超级面料消费观察
你是否曾设想,一件衣物也能如“智能空调”般自动调节温度?你是否曾设想,穿过的羽绒服无需刻意清洗?你是否曾设想,冬日的保暖衣物能够自主发热
2026-01-19 11:07:00
潍坊国补正式落地,三联家电41周年店庆点燃消费热情
鲁网1月19日讯1月17日上午,潍坊市奎文区2026年家电以旧换新暨海尔年货节、三联家电41周年店庆启动仪式在三联家电东风店户外广场隆重举行
2026-01-19 11:03:00
沧州7130家企业设立首席质量官
1月13日,在沧州四星玻璃股份有限公司生产车间内,首席质量官宋小龙(左)查看自动化制瓶生产线运行情况。河北日报记者 王雅楠摄河北日报讯(记者王雅楠)沧州市大力推行企业首席质量官制度
2026-01-19 08:10:00
1月12日,在位于张家口冰雪运动装备产业园的河北米锐特气模制造有限公司厂房内,30米长的不锈钢操作台上,工人正精准划线
2026-01-19 08:14:00
中新经纬1月18日电 18日,“人民日报评论”微信号发布评论文章《人民日报评西贝关店事件:网络舆论环境不能成为企业发展的短板》
2026-01-19 08:22:00
近期,富德生命人寿枣强支公司推出一系列针对性服务举措,通过优化传统服务方式与提升智能服务便利性双管齐下,切实提升老年客户群体的金融服务体验
2026-01-19 09:33:00
近期,国家有关部门在全国范围内持续推进“AI魔改”视频专项治理行动,相关话题引发广泛关注。随着整治深入,社会讨论正从对乱象本身的集中批评
2026-01-19 10:00:00
凤凰花实验室成立 厦门发力“人工智能赋能千行百业”
凤凰花实验室启动活动现场。(集美区 供图)厦门网讯(厦门日报记者 应洁)1月17日9时许,诚毅国际商务中心直达顶楼的电梯比工作日还要繁忙
2026-01-19 08:22:00
一块小小的豆腐能蕴含多少科技力量?昨天,在杭州豆制食品有限公司2026年商业大会暨新品发布会上,“鸿光浪花”品牌发布了首款富硒豆腐
2026-01-19 07:15:00