• 我的订阅
  • 科技

斯坦福团队推出DetectGPT或为检测验证产业链带来新机遇

类别:科技 发布时间:2023-01-31 09:46:00 来源:每日看点快看

本文转自:人民邮电报近日,斯坦福大学研究团队提出了一种名为DetectGPT的新方法,旨在成为首批打击高等教育中LLM生成文本的工具之一。相关研究论文已发表在预印本网站arXiv上。据悉,该方法或对检测验证产业带来积极影响。

此前,GPT- 3、PaLM和ChatGPT等大型语言模型(LLM)已经被证明能够针对各种各样的用户查询做出非常流畅的响应,可以生成“令人信服”的有关科学、数学、历史和当前事件以及社会趋势等复杂问题的回答。

尽管这些回答经常充满错误,但这些生成文本的清晰、自然仍然使得LLM在某些情况下被用来替代人力,特别是在学生论文写作和新闻撰写方面。

例如,学生可能使用LLM来完成书面作业,使得教师无法准确地评估学生的学习情况,而且,由LLM撰写且公开发布在新闻网站上的内容,往往存在大量的事实性错误,由于缺少足够的人工审查,也会对新闻读者产生误导。

不幸的是,在对LLM生成的文本和人类编写的文本进行分类时,人类的表现只比随机情况略好(Gehrmann et al., 2019)。因此,使用自动检测方法来识别人类难以识别的信号,成为当前业内的一个重要研究方向,这种方法可能会让教师和新闻读者更相信他们看到的内容来自人类。

在此次工作中,研究团队基于“LLM生成的文本通常徘徊(hoveraround)在模型的对数概率函数的负曲率区域的特定区域周围”这一发现,提出了一种用于判别LLM生成文本的新指标,这一方法既不需要训练单独的分类器,也不需要收集真实或生成的段落的数据集。

据论文描述,DetectGPT可以将20B参数GPT-NeoX生成的假新闻文章的检测从0.81 AUROC提高到0.95 AUROC。研究团队表示,这一方法在检测机器生成的文本方面优于其他零样本方法,或在未来的机器生成文本检查方面非常有前途。另外,他们也将尝试将这一方法用于LLM生成的音频、视频和图像的检测工作中。

然而,这一方法也存在一定的局限性。例如,如果现有的掩模填充模型不能很好地表示有意义的改写空间,则某些域的性能可能会降低,从而降低曲率估计的质量;DetectGPT相比其他检测方法需要更大的计算量等。

未来,随着LLM的不断改进,它们将成为越来越有吸引力的工具,可以在各种环境(比如教育、新闻和艺术)中取代人类作者。尽管在所有这些环境中都存在语言模型技术的合法使用,但教师、读者和消费者可能需要工具来验证具有高度教育、社会或艺术意义的某些内容是否来自人类,特别是在真实性(而不仅仅是流畅性)至关重要的情况下。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-01-31 10:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

斯坦福团队承认抄袭中国大模型!核心证据来自2300多年前
#斯坦福抄袭中国大模型##斯坦福团队道歉#,今天下午,两个词条分别冲上微博热搜第2和第5位,引发热议。斯坦福团队承认抄袭中国大模型冲上热搜简单说,就是国外一个AI团队主导的开源大
2024-06-05 11:04:00
斯坦福AI团队抄袭国产大模型?连识别“清华简”都抄了!清华系团队发文回应
...”的回旋镖,这次扎到了美国科研团队身上。最近几天,斯坦福大学AI团队陷入抄袭风波,被质疑“套壳”清华系大模型开源成果,引起舆论哗然。起因是这个团队在5月29日发布了一个多模态
2024-06-04 14:35:00
全球首例机器人刮胡子,斯坦福校友1年拿下3轮数亿融资!红杉领投圈内热门
...经验。公开资料显示,穹彻智能成立于2023年11月,由两位斯坦福校友王世全和卢策吾联合创办,致力于研发具身智能系统及其相关工具与平台。联合创始人王世全,于浙江大学机械电子系及
2024-12-06 09:55:00
...导师张明道,他是江苏锂电池研究领域的领军人物,入选斯坦福“全球前2%顶尖科学家”榜单。新能源汽车在未来几年或将迎来第一波“退役高峰”,林阳看到这背后千亿级的市场前景,与南京信
2023-12-03 00:31:00
斯坦福、港大、英伟达用全息术+先进纳米光子实现普通尺寸AR眼镜
(映维网资讯)斯坦福大学、英伟达和香港大学的研究人员日前介绍了一种有望改变可穿戴技术发展方向的AR系统。由新兴空间计算领域的专家开发的原型AR头显将全息成像引入普通眼镜,并以紧凑
2024-05-13 10:47:00
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
【新智元导读】斯坦福大学推出的IKEA Video Manuals数据集,通过4D对齐组装视频和说明书,为AI理解和执行复杂空间任务提供了新的挑战和研究基准,让机器人或AR眼镜指
2024-12-04 09:53:00
用光束在脑中“绘制 ”电极,让纳米金颗粒标靶特定神经元……这个蛋白使这些成为可能
...前被誉为“门萨女神”“哈佛全奖学者”。如今,她加入斯坦福大学化学工程教授鲍哲南的实验室,并师从生物工程及精神病学和行为科学教授卡尔·迪赛罗斯(Karl Deisseroth)
2023-12-01 10:49:00
中国天才少女硅谷创立AI公司,半年估值超10亿
...为“天才少女”。郭文景与另一位联合创始人孟晨琳同为斯坦福AI Lab的华人女博士,今年4月,二人一起从斯坦福退学创业。郭文景的父亲,是A股上市公司信雅达实控人郭华强。Pika
2023-12-07 20:02:00
空间智能新进展:教机器人组装家具,实现操作步骤与真实视频对齐
斯坦福吴佳俊团队,给机器人设计了一套组装宜家家具的视频教程!具体来说,团队提出了用于机器人的大型多模态数据集IKEA Video Manuals
2024-11-27 09:57:00
更多关于科技的资讯:
5500万杯奶茶 1138万杯咖啡 3000吨鸡蛋……千问3.5为全球AI提供“杭州方案”杭州日报讯 刚刚过去的马年春节
2026-02-26 06:35:00
80家企业携岗“抢人”每日商报讯 春启新程,引才先行。昨天,正值春节后的第二个工作日,由杭州市人才管理服务中心(杭州市人事考试院)主办的杭州市开春首场人才招聘会在汇金国际大厦举办
2026-02-26 07:06:00
■李侃摘要:传统金融理论通常基于理性人假设,将市场价格视为对信息的有效反映。然而,大量行为金融研究表明,金融市场中广泛存在情绪驱动
2026-02-26 04:51:00
江南时报讯 近日,金湖农商银行与金湖县自然资源和规划局深化合作,通过展业平台成功办理淮安地区不动产在线抵押业务。金湖农商银行龙港支行作为首家试点单位
2026-02-25 22:30:00
全球设计视野:胡予彤女士的国际影响力
在这个品牌必须跨越国界与受众自如对话的时代,胡予彤女士(Ms. Hu)已不仅是一名设计师,更是一股备受瞩目的创意力量,其作品的辨识度已从纽约延伸至广阔的国际舞台
2026-02-25 20:01:00
在算力需求爆发式增长的数字时代,硅光通信技术正成为数据中心互联的关键基石。作为测试测量领域的资深专家,Kevin Pan凭借其前瞻性的产业布局和卓越领导力
2026-02-25 17:40:00
中国消费者报福州讯(记者张文章)2月24日,记者从福建省药监局获悉,近日,工业和信息化部、国家药监局联合发布了《关于公布生物医用材料创新任务揭榜挂帅(第二批)入围揭榜单位的通知》
2026-02-25 18:00:00
数字经济时代,企业如何抢占数据资产价值先机
数字经济浪潮下,数据资产化已从政策导向转向价值兑现的关键阶段,成为企业抢占未来的核心竞争力。但面对国家政策红利与市场巨大机遇
2026-02-25 18:14:00
据浙江文旅,2026年春节假期,浙江省累计接待全域游客4604.3万人次,同比增长24.7%。全域旅游综合收入679.5亿元
2026-02-25 19:28:00
在中国医药市场的细分赛道中,抗ED药物领域正经历一场静默而深刻的变革。市场规模突破90亿元,年增长率保持在近20%的高位
2026-02-25 17:05:00
浙江长兴:服务暖人心 提质促共赢
长兴县烟草专卖局秉持“服务暖人心、提质促共赢”理念,以零售户服务需求为核心,通过“定制化服务+纠纷化解赋能”双轮驱动,聚焦卷烟经营全链条服务痛点难点
2026-02-25 17:06:00
过去几年,中国消费市场正在经历一轮明显变化。一方面,流量成本持续上升,单纯依赖推广带动销量越来越难;另一方面,大量新品牌快速出现
2026-02-25 16:30:00
【新春走基层】春节长假与多种促消费政策叠加 汇川区消费市场活力十足
多彩贵州网讯今年春节,长达九天假期与政府消费券的不期而遇,为汇川区消费市场注入了强劲动力。连日来,笔者走访遵义国贸春天百货购物中心
2026-02-25 16:53:00
视频制作:陈希河北新闻网讯(记者 王嵩)方程豹钛7作为一款兼具颜值与性能的方盒子,其智能辅助驾驶系统以及云辇C+路面预瞄技术表现如何呢?本期视频,我们将 通过一场28公里的实测一
2026-02-25 15:43:00