• 我的订阅
  • 科技

数学博士创建的“弱智吧” 怎么就成了AI的试金石?

类别:科技 发布时间:2024-09-08 08:18:00 来源:杭州网

今年4月,中科院、滑铁卢大学等机构联合发表了一篇AI行业论文,让互联网上的“乐子人”直呼离谱。

研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。

这个充满荒诞段子的中文社区,一跃成为最佳的中文AI训练数据库之一。

然而弱智吧里的发言“画风”通常是这样的:“生鱼片是死鱼片”“等红灯是在等绿灯”“咖啡因来自咖啡果”“一个半小时是几个半小时”……

这些看起来荒谬又搞笑的语句,和AI有什么关系?这个问题终于在今年的外滩大会创新者舞台上有了答案。

弱智吧的核心成员首次在线下露面,带着他们的段子向AI“开炮”,还顺便揭秘了这群段子手的真实身份。

段子为什么能作为训练AI的语料?

在外滩大会的创新者舞台,弱智吧成员和AI专家进行了“脑洞”和理论的交锋。他们也同样疑惑,为什么许多AI公司会选择弱智吧作为语料库?

无界方舟CEO曾晓东说,他们的研究方向是“利用人工智能技术让机器人更像人”,训练AI时一直在寻找口语化、多轮问答的语料。“其实喂给大模型的不只是段子,还包括其他人对段子的回复。要找这样好玩的、高质量的中文对话,很多同行、数据公司都会提起弱智吧。”

9月7日,弱智吧成员胡萝北讲述了弱智吧和AI的交手经历。

早在2022年,他就试过发一些段子让AI来解读,AI搜罗了大量信息来做名词解释,却无法理解段子真正的含义。胡萝北说:“没有一个AI能笑着走出弱智吧,因为他不懂幽默。”

弱智吧里的段子看似无厘头,其实包含了很强的逻辑性,比如“明知山有虎,不去明知山”,其实是拆解了“明知”这个动词,重新组合成“明知山”,巧妙替换了句子的含义。曾晓东说,正是这些语言陷阱,锻炼了语言大模型对中文的解读和推理能力,让AI能像人一样进行交流。

胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程度而言,我们每天都在为未来的AI投喂数据”。

“弱智吧”里有数学博士、AI从业者、脱口秀演员……

弱智吧的段子为什么对AI有如此奇效?胡萝北形容弱智吧是段子里的“基础科学”,因为段子里有很强的逻辑性。

除了是弱智吧的核心成员,胡萝北的另一重身份是脱口秀演员。他写过一个段子,“种什么因得什么果,种咖啡因得咖啡果”,像是套公式做题,给文字套上公式后,就产生了一种打破常理的喜剧效果。

胡萝北透露,其实他是数学系毕业的,弱智吧吧主公孙闬也是数学系毕业的,“我们这群核心成员里很多人都是理科生,有时候突然扔一个数学题到群里就开始一起解答”。

这个诞生于PC贴吧时代的兴趣社区,在互联网浪潮中走过了20年。吧主公孙闬透露,创建人当年还是小学生,前些年去国外攻读博士了,“贴吧的吧主已经交替了好几代,我们都长大了,进入了各行各业。大家把自己在生活中的见闻经历写成段子,所以这个社区还活跃着,大家都能玩得开心”。

公孙闬说,他负责审核贴吧里的帖子,每天有500条左右,现在还经常会发现一些新的原创段子让人眼前一亮。这些来自不同领域、取材于真实生活的段子,有强大的逻辑,也有浪漫的修辞。“语言是好玩的,如果AI无法理解这类打破常规的语言,就会让人失去沟通的欲望。”

胡萝北最后用和外滩的“外”相对的“内”来总结:我们现在看似生活在一个被AI包围的时代,但“内”字里的“人”又没有被完全困住,“正像网友们说的,弱智吧是人与AI之间的最后一道防线”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-08 11:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,ChatGPT等
2023-07-26 06:00:00
清华大学教授孙茂松:理解大模型机理建立AI新理论
...在热力学三定律之下才解释清楚。 大模型里的元素事关数学,当前大模型的参数到了万亿级,应用数学家从来没有解过如此大的方程组,并且大模型涉及到的数学问题与经典数学完全不同,这为
2023-07-27 15:01:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...品|搜狐科技作者|郑松毅谁能想到,被誉为“最大原创段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是
2024-04-15 17:00:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...考和逻辑推理的专业任务上不仅吊打GPT-4o,还超过了拥有博士学位的人类专家。OpenAI表示,新模型在物理、化学和生物等学科的挑战性基准测试中,表现超过人类专家。在国际数学
2024-09-13 16:44:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的
2024-06-14 11:54:00
山财大数学老师宋浩获评“齐鲁晚报·齐鲁壹点正能量传播大使”
...不仅因为他的学历和专业水平过硬——山大本硕、中科院博士,能把晦涩的数学讲得通俗易懂,还因为他风趣幽默,冷不丁的小笑话和段子,让大家感觉眼前这位帅气的老师可亲、可爱。记者注意到
2023-12-18 16:25:00
五大模型解高考数学:阿里通义千问、360智脑10题全错得0分;讯飞星火答对一半
...高考季,高考试题是大众关注的焦点,也成为了AI能力的试金石。AI大模型数学功底到底如何?比人类“聪明”吗?搜狐科技使用五款AI大模型对2023高考上海数学试卷进行了同题测试。
2023-06-08 21:00:00
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...么。”与现实产生真正的互通,才是现有大模型真正的“试金石”。如苏莱曼建议的,“人工智能需要研究和设计产品、谈判合同、开展营销活动等等。简而言之,它需要在最少的监督下,将一系列
2023-12-20 00:10:00
萝北:“畜”势勃发
...结构,推进传统畜牧业向现代畜牧业高质量发展,并成为萝北县域经济发展新动能。近年来,萝北县树立大食物观理念,全面落实省市农业工作部署要求,坚持把发展现代畜牧产业,作为全面提升粮
2023-02-15 12:01:00
更多关于科技的资讯: