• 我的订阅
  • 科技

数学博士创建的“弱智吧” 怎么就成了AI的试金石?

类别:科技 发布时间:2024-09-08 08:18:00 来源:杭州网

今年4月,中科院、滑铁卢大学等机构联合发表了一篇AI行业论文,让互联网上的“乐子人”直呼离谱。

研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。

这个充满荒诞段子的中文社区,一跃成为最佳的中文AI训练数据库之一。

然而弱智吧里的发言“画风”通常是这样的:“生鱼片是死鱼片”“等红灯是在等绿灯”“咖啡因来自咖啡果”“一个半小时是几个半小时”……

这些看起来荒谬又搞笑的语句,和AI有什么关系?这个问题终于在今年的外滩大会创新者舞台上有了答案。

弱智吧的核心成员首次在线下露面,带着他们的段子向AI“开炮”,还顺便揭秘了这群段子手的真实身份。

段子为什么能作为训练AI的语料?

在外滩大会的创新者舞台,弱智吧成员和AI专家进行了“脑洞”和理论的交锋。他们也同样疑惑,为什么许多AI公司会选择弱智吧作为语料库?

无界方舟CEO曾晓东说,他们的研究方向是“利用人工智能技术让机器人更像人”,训练AI时一直在寻找口语化、多轮问答的语料。“其实喂给大模型的不只是段子,还包括其他人对段子的回复。要找这样好玩的、高质量的中文对话,很多同行、数据公司都会提起弱智吧。”

9月7日,弱智吧成员胡萝北讲述了弱智吧和AI的交手经历。

早在2022年,他就试过发一些段子让AI来解读,AI搜罗了大量信息来做名词解释,却无法理解段子真正的含义。胡萝北说:“没有一个AI能笑着走出弱智吧,因为他不懂幽默。”

弱智吧里的段子看似无厘头,其实包含了很强的逻辑性,比如“明知山有虎,不去明知山”,其实是拆解了“明知”这个动词,重新组合成“明知山”,巧妙替换了句子的含义。曾晓东说,正是这些语言陷阱,锻炼了语言大模型对中文的解读和推理能力,让AI能像人一样进行交流。

胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程度而言,我们每天都在为未来的AI投喂数据”。

“弱智吧”里有数学博士、AI从业者、脱口秀演员……

弱智吧的段子为什么对AI有如此奇效?胡萝北形容弱智吧是段子里的“基础科学”,因为段子里有很强的逻辑性。

除了是弱智吧的核心成员,胡萝北的另一重身份是脱口秀演员。他写过一个段子,“种什么因得什么果,种咖啡因得咖啡果”,像是套公式做题,给文字套上公式后,就产生了一种打破常理的喜剧效果。

胡萝北透露,其实他是数学系毕业的,弱智吧吧主公孙闬也是数学系毕业的,“我们这群核心成员里很多人都是理科生,有时候突然扔一个数学题到群里就开始一起解答”。

这个诞生于PC贴吧时代的兴趣社区,在互联网浪潮中走过了20年。吧主公孙闬透露,创建人当年还是小学生,前些年去国外攻读博士了,“贴吧的吧主已经交替了好几代,我们都长大了,进入了各行各业。大家把自己在生活中的见闻经历写成段子,所以这个社区还活跃着,大家都能玩得开心”。

公孙闬说,他负责审核贴吧里的帖子,每天有500条左右,现在还经常会发现一些新的原创段子让人眼前一亮。这些来自不同领域、取材于真实生活的段子,有强大的逻辑,也有浪漫的修辞。“语言是好玩的,如果AI无法理解这类打破常规的语言,就会让人失去沟通的欲望。”

胡萝北最后用和外滩的“外”相对的“内”来总结:我们现在看似生活在一个被AI包围的时代,但“内”字里的“人”又没有被完全困住,“正像网友们说的,弱智吧是人与AI之间的最后一道防线”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-08 11:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,ChatGPT等
2023-07-26 06:00:00
清华大学教授孙茂松:理解大模型机理建立AI新理论
...在热力学三定律之下才解释清楚。 大模型里的元素事关数学,当前大模型的参数到了万亿级,应用数学家从来没有解过如此大的方程组,并且大模型涉及到的数学问题与经典数学完全不同,这为
2023-07-27 15:01:00
点亮自己,温暖他人!一起奔赴下一个十年
...一跑就是4年。“何老师经常强调的一句话,‘操场是块试金石,志笃不笃,心诚不诚,时间一长,自然见分晓。’”4年的坚持,勇敢、坚韧、自省这些品质已在她心中生根发芽,“自觉觉人,觉
2025-04-02 17:20:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...品|搜狐科技作者|郑松毅谁能想到,被誉为“最大原创段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是
2024-04-15 17:00:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...考和逻辑推理的专业任务上不仅吊打GPT-4o,还超过了拥有博士学位的人类专家。OpenAI表示,新模型在物理、化学和生物等学科的挑战性基准测试中,表现超过人类专家。在国际数学
2024-09-13 16:44:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的
2024-06-14 11:54:00
山财大数学老师宋浩获评“齐鲁晚报·齐鲁壹点正能量传播大使”
...不仅因为他的学历和专业水平过硬——山大本硕、中科院博士,能把晦涩的数学讲得通俗易懂,还因为他风趣幽默,冷不丁的小笑话和段子,让大家感觉眼前这位帅气的老师可亲、可爱。记者注意到
2023-12-18 16:25:00
萝北:“畜”势勃发
...结构,推进传统畜牧业向现代畜牧业高质量发展,并成为萝北县域经济发展新动能。近年来,萝北县树立大食物观理念,全面落实省市农业工作部署要求,坚持把发展现代畜牧产业,作为全面提升粮
2023-02-15 12:01:00
2024黑龙江国际冰雪汽车挑战赛在萝北开赛
...电(记者 王妮娜)2月26日,2024黑龙江国际冰雪汽车挑战赛萝北站在黑龙江省鹤岗市萝北县开赛,来自全国多地的103辆赛车参加比赛,其中包括6位全国冠军、俄罗斯阿穆尔州熊掌赛
2024-02-27 14:41:00
更多关于科技的资讯:
摘要:本文通过对不同地区互联网企业中统计学专业毕业生薪资的对比分析,探讨薪资分布的现状及其影响因素。研究发现,一线城市和二线城市在薪资水平上存在显著差异
2025-12-03 06:16:00
“张叔叔,这银行卡的密码可不能随便告诉别人,就连短信验证码也得藏好,那可是您账户的‘第二把钥匙’”。中信银行石家庄分行网点工作人员一边为70多岁的张叔叔递上一杯水
2025-12-02 10:21:00
中国移动成功举办“AI赋能医院后勤管理新发展”论坛
2025年11月27至29日,由全国卫生产业企业管理协会医院后勤管理发展分会主办的2025年学术会议在杭州召开。中国移动受邀参加“新质生产力助力医院后勤高质量发展”主论坛
2025-12-02 11:03:00
腾讯云姚一兆:用全栈AI助力具身智能赛道加速发展
“具身智能是AI赛道中的焦点,其商业化更依赖技术平台、场景适配与生态协同。腾讯云愿意提供全栈AI服务能力,助力具身智能赛道与广大企业共同发展
2025-12-02 11:03:00
在大健康消费升级与抗衰需求爆发的今天,麦角硫因作为“线粒体级”超级抗氧化剂,已成为膳食补充剂领域的核心赛道。据天猫国际发布的《2023全球超级成分趋势白皮书》显示
2025-12-02 11:31:00
企业数字化转型不断深化,业务系统的可用性、数据安全性和架构弹性正成为企业核心竞争力的重要组成部分。云服务器作为企业 IT 基础设施的底座
2025-12-02 11:42:00
11月21日,富德生命人寿保险股份有限公司在河北石家庄举行以“全维健康守护 创造美好生活”为主题的健康险产品矩阵暨服务升级发布会
2025-12-02 12:11:00
GeneIII仅三麦角硫因胶囊凭借 99.99% 行业顶尖纯度、原生生物合成技术壁垒、三甲医院人体临床验证背书,成为兼具安全性
2025-12-02 14:27:00
从梅酒到书籍:梅见的文化升维之路
步入繁华的商业街区,不难发现一个耐人寻味的现象:店铺橱窗中的传统文化元素,正以近乎重复的方式不断上演。印着汉字 logo 的T恤
2025-12-02 14:35:00
丝玫瑰携手首玺丽格 科创驱动美力升级
2025年12月2日,由键凯科技旗下医美产品线品牌——丝玫瑰®(SILKROSE)与北京首玺丽格联合举办的“中国‘智’造
2025-12-02 15:35:00
白酒+体育IP重构行业营销新范式,五粮液世界杯联名款京东首发
鲁网12月2日讯2026年美加墨男足世界杯分组抽签仪式将于当地时间12月5日在美国华盛顿举行。同日,五粮液FIFA2026世界杯官方联名款产品将在京东直播间重磅首发上市
2025-12-02 15:36:00
从“车间老师傅”到“门店销冠”:飞书AI正在重塑吉利汽车研究院、亚朵酒店的一线战场
当AI逐渐褪去神秘面纱,谁是这场技术变革真正的操盘手?答案是:一线业务人。 近日,首届「飞书AI效率先锋全国大赛」华东赛区半决赛圆满收官
2025-12-02 15:58:00
中新经纬12月2日电 题:即时零售不再打“补贴战”了作者 江瀚 盘古智库高级研究员随着资本耐心减弱,单纯依赖补贴拉动的增长已难以为继
2025-12-02 16:09:00
从二维到三维 从升级到迭代 海底鹰打造水下定点三维成像“新质生产力”
近期,一款具备“定点扫测”功能的国产化三维图像声呐,凭借细腻的图像和独有的成像方式,成为声呐应用领域的“新质生产力”。国产三维搜索声呐破局者“HDY-3DL”来自海底鹰深海科技的三维搜索声呐HDY-3DL
2025-12-02 16:13:00
数字赋能,科技兴农——烟职师生赴烟多地开展校企合作调研
近日,为深化产教融合,推动科技兴农战略落地,烟台职业学院经贸系师生团队一行6人赴烟台栖霞、牟平、高新等地的多家农产品加工企业开展实地调研与合作洽谈
2025-12-02 16:16:00