• 我的订阅
  • 科技

数学博士创建的“弱智吧” 怎么就成了AI的试金石?

类别:科技 发布时间:2024-09-08 08:18:00 来源:杭州网

今年4月,中科院、滑铁卢大学等机构联合发表了一篇AI行业论文,让互联网上的“乐子人”直呼离谱。

研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。

这个充满荒诞段子的中文社区,一跃成为最佳的中文AI训练数据库之一。

然而弱智吧里的发言“画风”通常是这样的:“生鱼片是死鱼片”“等红灯是在等绿灯”“咖啡因来自咖啡果”“一个半小时是几个半小时”……

这些看起来荒谬又搞笑的语句,和AI有什么关系?这个问题终于在今年的外滩大会创新者舞台上有了答案。

弱智吧的核心成员首次在线下露面,带着他们的段子向AI“开炮”,还顺便揭秘了这群段子手的真实身份。

段子为什么能作为训练AI的语料?

在外滩大会的创新者舞台,弱智吧成员和AI专家进行了“脑洞”和理论的交锋。他们也同样疑惑,为什么许多AI公司会选择弱智吧作为语料库?

无界方舟CEO曾晓东说,他们的研究方向是“利用人工智能技术让机器人更像人”,训练AI时一直在寻找口语化、多轮问答的语料。“其实喂给大模型的不只是段子,还包括其他人对段子的回复。要找这样好玩的、高质量的中文对话,很多同行、数据公司都会提起弱智吧。”

9月7日,弱智吧成员胡萝北讲述了弱智吧和AI的交手经历。

早在2022年,他就试过发一些段子让AI来解读,AI搜罗了大量信息来做名词解释,却无法理解段子真正的含义。胡萝北说:“没有一个AI能笑着走出弱智吧,因为他不懂幽默。”

弱智吧里的段子看似无厘头,其实包含了很强的逻辑性,比如“明知山有虎,不去明知山”,其实是拆解了“明知”这个动词,重新组合成“明知山”,巧妙替换了句子的含义。曾晓东说,正是这些语言陷阱,锻炼了语言大模型对中文的解读和推理能力,让AI能像人一样进行交流。

胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程度而言,我们每天都在为未来的AI投喂数据”。

“弱智吧”里有数学博士、AI从业者、脱口秀演员……

弱智吧的段子为什么对AI有如此奇效?胡萝北形容弱智吧是段子里的“基础科学”,因为段子里有很强的逻辑性。

除了是弱智吧的核心成员,胡萝北的另一重身份是脱口秀演员。他写过一个段子,“种什么因得什么果,种咖啡因得咖啡果”,像是套公式做题,给文字套上公式后,就产生了一种打破常理的喜剧效果。

胡萝北透露,其实他是数学系毕业的,弱智吧吧主公孙闬也是数学系毕业的,“我们这群核心成员里很多人都是理科生,有时候突然扔一个数学题到群里就开始一起解答”。

这个诞生于PC贴吧时代的兴趣社区,在互联网浪潮中走过了20年。吧主公孙闬透露,创建人当年还是小学生,前些年去国外攻读博士了,“贴吧的吧主已经交替了好几代,我们都长大了,进入了各行各业。大家把自己在生活中的见闻经历写成段子,所以这个社区还活跃着,大家都能玩得开心”。

公孙闬说,他负责审核贴吧里的帖子,每天有500条左右,现在还经常会发现一些新的原创段子让人眼前一亮。这些来自不同领域、取材于真实生活的段子,有强大的逻辑,也有浪漫的修辞。“语言是好玩的,如果AI无法理解这类打破常规的语言,就会让人失去沟通的欲望。”

胡萝北最后用和外滩的“外”相对的“内”来总结:我们现在看似生活在一个被AI包围的时代,但“内”字里的“人”又没有被完全困住,“正像网友们说的,弱智吧是人与AI之间的最后一道防线”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-08 11:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,ChatGPT等
2023-07-26 06:00:00
清华大学教授孙茂松:理解大模型机理建立AI新理论
...在热力学三定律之下才解释清楚。 大模型里的元素事关数学,当前大模型的参数到了万亿级,应用数学家从来没有解过如此大的方程组,并且大模型涉及到的数学问题与经典数学完全不同,这为
2023-07-27 15:01:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...品|搜狐科技作者|郑松毅谁能想到,被誉为“最大原创段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是
2024-04-15 17:00:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...考和逻辑推理的专业任务上不仅吊打GPT-4o,还超过了拥有博士学位的人类专家。OpenAI表示,新模型在物理、化学和生物等学科的挑战性基准测试中,表现超过人类专家。在国际数学
2024-09-13 16:44:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的
2024-06-14 11:54:00
山财大数学老师宋浩获评“齐鲁晚报·齐鲁壹点正能量传播大使”
...不仅因为他的学历和专业水平过硬——山大本硕、中科院博士,能把晦涩的数学讲得通俗易懂,还因为他风趣幽默,冷不丁的小笑话和段子,让大家感觉眼前这位帅气的老师可亲、可爱。记者注意到
2023-12-18 16:25:00
...结构,推进传统畜牧业向现代畜牧业高质量发展,并成为萝北县域经济发展新动能。近年来,萝北县树立大食物观理念,全面落实省市农业工作部署要求,坚持把发展现代畜牧产业,作为全面提升粮
2023-02-15 12:01:00
萝北:“畜”势勃发
...结构,推进传统畜牧业向现代畜牧业高质量发展,并成为萝北县域经济发展新动能。近年来,萝北县树立大食物观理念,全面落实省市农业工作部署要求,坚持把发展现代畜牧产业,作为全面提升粮
2023-02-15 12:01:00
五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半
...高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。
2023-06-08 21:00:00
更多关于科技的资讯:
兰研荣登2024年度泉州创新企业十强
3月20日,由泉州市委宣传部、市委金融办、市发改委、市工信局、市住建局、市商务局、市退役军人事务局、市数据管理局、市工商联
2025-04-02 14:01:00
SU7事故遇难者家属回应雷军:鲜活生命已离世 车企应对事故有足够的敬畏之心
快科技4月2日消息,昨晚雷军在其个人微博发文对小米SU7近日事故回应,而这也被冲上了热搜。他表示,我代表小米,表示最深切的哀悼
2025-04-02 14:10:00
3月20日,金融科技公司小赢科技发布了其截至2024年12月31日的第四季度及年度未经审计的财务业绩。财务数据显示:截至2024年12月31日的在贷余额为523
2025-04-02 14:26:00
汤臣倍健:跨越性价比,用户爱上“质价比”
鲁网4月2日讯过去几年,流量红利降临,众多低质低价的白牌迎风而起。然而如今流量红利退潮,消费者更加清醒,“性价比”策略也逐渐陷入困境
2025-04-02 14:30:00
传小米汽车内测“安全分Beta”:可评估驾驶行为 降低事故风险
快科技4月2日消息,近日,有媒体报道,小米汽车App正在内测“安全分Beta”系统。该系统将为车主提供全方位的安全评估与优化建议
2025-04-02 14:40:00
李斌回应沈斐接手乐道:首要任务是做好销售基本功
快科技4月2日消息,今日,乐道汽车总裁艾铁成宣布离职,不再担任乐道汽车总裁和蔚来高级副总裁。蔚来还对乐道汽车进行新的人事任命
2025-04-02 14:40:00
宁德时代中国石化达成合作协议:要建10000座换电站
快科技4月2日消息,宁德时代官宣,近日,其与中国石化在北京签署合作框架协议。根据协议,双方将全面深化长期战略合作关系,共同建设覆盖全国的换电生态网络
2025-04-02 14:40:00
Etsy开店的优劣势分析
Etsy作为一个专注于手工艺品、古董以及独特商品的电子商务平台,为创作者和小型企业提供了一个展示和销售产品的机会。开设Etsy店铺可以带来许多好处
2025-04-02 14:42:00
CMEF医疗器械展必看!富丽康液态镜头如何破解手术光学难题?
2025年中国国际医疗器械展览会(CMEF)即将于4月8日-11日在上海国家会展中心震撼启幕!作为全球医疗行业的顶级盛会
2025-04-02 14:45:00
海信空调易省电Pro空调预售:AI省电41%!告别“电费刺客”
3月31日,海信空调正式发布易省电E370Pro,以APF值5.5、AI省电41%的创新突破将空调节能标准提升至全新维度
2025-04-02 14:46:00
近日,作为2025中关村论坛年会的重要组成部分,中关村国际技术交易大会“全球高校科技成果转化促进大会”在北京工业大学举行
2025-04-02 14:54:00
泸州老窖携手《三体》推出联名白酒 开启科幻与传统文化跨界新纪元
2025年3月31日,北京,当千年酒香邂逅宇宙星辰,一场跨越时空的文化碰撞在北京首钢园香格里拉酒店璀璨上演。泸州老窖与科幻巨作《三体》联袂打造的“泸州老窖|三体”与“国窖1573|三体”全球发布会盛大启幕
2025-04-02 15:05:00
智元机器人与顶尖具身智能公司Pi合作:加速具身智能技术落地
快科技4月2日消息,据报道,智元机器人宣布与国际顶尖具身智能公司Physical Intelligence(Pi)建立深度合作伙伴关系
2025-04-02 15:10:00
君乐宝加速科研成果转化,为全球消费者提供科学健康方案
在健康食品产业蓬勃发展的今天,科研创新无疑是推动行业进步的关键力量。以“科学营养”为核心理念的君乐宝乳业集团,始终站在科研创新的前沿
2025-04-02 15:14:00
携手广州领矿,开启多元商业机遇
在广州天河区的商业浪潮中,广州领矿化工产品有限公司宛如一颗闪耀的明星,自2013年扬帆起航以来,不断拓展业务版图,凭借多元产品与优质服务
2025-04-02 15:31:00