• 我的订阅
  • 科技

数学博士创建的“弱智吧” 怎么就成了AI的试金石?

类别:科技 发布时间:2024-09-08 08:18:00 来源:杭州网

今年4月,中科院、滑铁卢大学等机构联合发表了一篇AI行业论文,让互联网上的“乐子人”直呼离谱。

研究显示,百度贴吧“弱智吧”数据集训练出的AI大模型,跑分超过百科、知乎、豆瓣、小红书等平台,在问答、头脑风暴、分类、生成、总结等8项测试中取得了最高分。

这个充满荒诞段子的中文社区,一跃成为最佳的中文AI训练数据库之一。

然而弱智吧里的发言“画风”通常是这样的:“生鱼片是死鱼片”“等红灯是在等绿灯”“咖啡因来自咖啡果”“一个半小时是几个半小时”……

这些看起来荒谬又搞笑的语句,和AI有什么关系?这个问题终于在今年的外滩大会创新者舞台上有了答案。

弱智吧的核心成员首次在线下露面,带着他们的段子向AI“开炮”,还顺便揭秘了这群段子手的真实身份。

段子为什么能作为训练AI的语料?

在外滩大会的创新者舞台,弱智吧成员和AI专家进行了“脑洞”和理论的交锋。他们也同样疑惑,为什么许多AI公司会选择弱智吧作为语料库?

无界方舟CEO曾晓东说,他们的研究方向是“利用人工智能技术让机器人更像人”,训练AI时一直在寻找口语化、多轮问答的语料。“其实喂给大模型的不只是段子,还包括其他人对段子的回复。要找这样好玩的、高质量的中文对话,很多同行、数据公司都会提起弱智吧。”

9月7日,弱智吧成员胡萝北讲述了弱智吧和AI的交手经历。

早在2022年,他就试过发一些段子让AI来解读,AI搜罗了大量信息来做名词解释,却无法理解段子真正的含义。胡萝北说:“没有一个AI能笑着走出弱智吧,因为他不懂幽默。”

弱智吧里的段子看似无厘头,其实包含了很强的逻辑性,比如“明知山有虎,不去明知山”,其实是拆解了“明知”这个动词,重新组合成“明知山”,巧妙替换了句子的含义。曾晓东说,正是这些语言陷阱,锻炼了语言大模型对中文的解读和推理能力,让AI能像人一样进行交流。

胡萝北说,没想到有一天弱智吧的段子会成为训练大模型的语料,“AI看似与普通人无关,但机器人其实是对人类的模仿,从某种程度而言,我们每天都在为未来的AI投喂数据”。

“弱智吧”里有数学博士、AI从业者、脱口秀演员……

弱智吧的段子为什么对AI有如此奇效?胡萝北形容弱智吧是段子里的“基础科学”,因为段子里有很强的逻辑性。

除了是弱智吧的核心成员,胡萝北的另一重身份是脱口秀演员。他写过一个段子,“种什么因得什么果,种咖啡因得咖啡果”,像是套公式做题,给文字套上公式后,就产生了一种打破常理的喜剧效果。

胡萝北透露,其实他是数学系毕业的,弱智吧吧主公孙闬也是数学系毕业的,“我们这群核心成员里很多人都是理科生,有时候突然扔一个数学题到群里就开始一起解答”。

这个诞生于PC贴吧时代的兴趣社区,在互联网浪潮中走过了20年。吧主公孙闬透露,创建人当年还是小学生,前些年去国外攻读博士了,“贴吧的吧主已经交替了好几代,我们都长大了,进入了各行各业。大家把自己在生活中的见闻经历写成段子,所以这个社区还活跃着,大家都能玩得开心”。

公孙闬说,他负责审核贴吧里的帖子,每天有500条左右,现在还经常会发现一些新的原创段子让人眼前一亮。这些来自不同领域、取材于真实生活的段子,有强大的逻辑,也有浪漫的修辞。“语言是好玩的,如果AI无法理解这类打破常规的语言,就会让人失去沟通的欲望。”

胡萝北最后用和外滩的“外”相对的“内”来总结:我们现在看似生活在一个被AI包围的时代,但“内”字里的“人”又没有被完全困住,“正像网友们说的,弱智吧是人与AI之间的最后一道防线”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-09-08 11:45:05

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...,三五年内有望破解智能涌现之谜理解并超越大模型需要数学“应战” ■本报记者 许琦敏瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,ChatGPT等
2023-07-26 06:00:00
清华大学教授孙茂松:理解大模型机理建立AI新理论
...在热力学三定律之下才解释清楚。 大模型里的元素事关数学,当前大模型的参数到了万亿级,应用数学家从来没有解过如此大的方程组,并且大模型涉及到的数学问题与经典数学完全不同,这为
2023-07-27 15:01:00
点亮自己,温暖他人!一起奔赴下一个十年
...一跑就是4年。“何老师经常强调的一句话,‘操场是块试金石,志笃不笃,心诚不诚,时间一长,自然见分晓。’”4年的坚持,勇敢、坚韧、自省这些品质已在她心中生根发芽,“自觉觉人,觉
2025-04-02 17:20:00
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...品|搜狐科技作者|郑松毅谁能想到,被誉为“最大原创段子手孵化地”的弱智吧,最近竟摇身一变成了——最佳中文AI训练语料库?由此受到启发,是否并不是训练AI的优质数据不够用,而是
2024-04-15 17:00:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...考和逻辑推理的专业任务上不仅吊打GPT-4o,还超过了拥有博士学位的人类专家。OpenAI表示,新模型在物理、化学和生物等学科的挑战性基准测试中,表现超过人类专家。在国际数学
2024-09-13 16:44:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
最近,专门为人工智能(AI)设立的AI国际奥林匹克数学竞赛(IMO)即将进入尾声,其结果将随今年7月于英国巴斯举行的65届IMO大会同步揭晓。这项赛事的目的是推动发展大语言模型的
2024-06-14 11:54:00
山财大数学老师宋浩获评“齐鲁晚报·齐鲁壹点正能量传播大使”
...不仅因为他的学历和专业水平过硬——山大本硕、中科院博士,能把晦涩的数学讲得通俗易懂,还因为他风趣幽默,冷不丁的小笑话和段子,让大家感觉眼前这位帅气的老师可亲、可爱。记者注意到
2023-12-18 16:25:00
萝北:“畜”势勃发
...结构,推进传统畜牧业向现代畜牧业高质量发展,并成为萝北县域经济发展新动能。近年来,萝北县树立大食物观理念,全面落实省市农业工作部署要求,坚持把发展现代畜牧产业,作为全面提升粮
2023-02-15 12:01:00
2024黑龙江国际冰雪汽车挑战赛在萝北开赛
...电(记者 王妮娜)2月26日,2024黑龙江国际冰雪汽车挑战赛萝北站在黑龙江省鹤岗市萝北县开赛,来自全国多地的103辆赛车参加比赛,其中包括6位全国冠军、俄罗斯阿穆尔州熊掌赛
2024-02-27 14:41:00
更多关于科技的资讯:
浪潮智慧科技深耕标准建设:3项主导数字山东技术规范成功获批
近日,山东省大数据局正式下发《关于发布〈矿产资源数据治理规范〉等11项数字山东技术规范的公告》,其中由浪潮智慧科技主导编制的《智慧渔业养殖系统建设规范》《数字孪生机场模型构建规范
2025-10-11 10:24:00
长白时评评论员 杨飞近日,陕西西安等地出台政策,全面暂停网约车“一口价”等低价营销行为,严禁任何形式的价格欺诈和恶意压价
2025-10-11 10:47:00
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏)集护眼、通透、高刷新率于一体的天马 “天工屏”;“全球最窄四等边设计”的手机屏幕……今年以来
2025-10-10 08:28:00
2025河北国际工业设计周活动观察:全球智慧赋能未来智造
全球智慧赋能未来智造——2025河北国际工业设计周活动观察9月20日,2025河北国际工业设计周主会场活动在雄安新区举行
2025-10-10 08:40:00
工信部日前公布首批制造业数字化转型促进中心建设主体名单,太原福莱瑞达物流设备科技有限公司入选。制造业数字化转型促进中心是国家落实产业数字化战略的核心公共服务载体
2025-10-10 08:42:00
10月9日,从太原第二热电厂获悉,为全力保障太原市冬季供热安全稳定,持续提升供热服务质效,太原二热秉持“早谋划、早部署
2025-10-10 08:43:00
齐鲁晚报·齐鲁壹点客户端 李孟霏在刚刚过去的国庆中秋“双节”,山东移动威海乳山分公司移动社区营销团队实现品牌口碑与业务发展的双赢
2025-10-10 11:07:00
优优绿能(301590)成立于2015年,是国内直流充电桩模块领军企业之一,2024年在国内充电模块市占率达16%,位居行业第二
2025-10-10 23:06:00
恒润达生信披“迷雾”:“消失”的研发总监与首席科学家?
除研发核心人员离职或在外创办同行业企业外,上海恒润达生生物科技股份有限公司(下称“恒润达生”)招股书对研发团队人员信披的真实性
2025-10-10 23:06:00
互联网贷款普及后,不少初次接触的用户常因平台选择难、流程不熟悉犯愁。其实只要按步骤操作执行,安全又高效,下面由榕易有钱为大家梳理了几项关键步骤
2025-10-10 11:34:00
从志愿翻译到时装新星 河南姑娘在非洲书写青春与梦想
大河网讯 非洲大陆,机遇与挑战并存。越来越多的中国人选择在这里扎根创业,为当地发展注入新活力。毕业于河南工业大学的何方方便是其中之一
2025-10-10 12:11:00
姜杰秀:心中有梦,创业有方,用执着与努力让喜龙果出海
鲁网10月10日讯“我父亲就是做农副产品加工的,从小受父亲的熏陶,我对农副产品加工就有别样的情愫。于是,我就在农副产品加工上有了梦想
2025-10-10 13:56:00
中新经纬10月10日电 “市说新语”微信号10日消息,近日,国家市场监管总局(国家标准委)批准发布一批重要国家标准,涉及助老扶幼
2025-10-10 14:06:00
解锁工业自动化密码,威图与易盼2025IAS硬核破圈瞬间
"新质驱动、高端引领、数智赋能" ,2025中国国际工业博览会聚焦新工业新经济,旨在拉开加快构建一流产业生态,开启智能制造新时代的帷幕
2025-10-10 14:59:00
圆满收官 | 威图RiLineX全新一代配电平台正式发布
制造业行业数字化与智能化水平要求日益提升,这意味着制造业将面临集人力、技术、时间和成本全面优化的巨大挑战。配电系统作为工业场景下能源传输的载体
2025-10-10 14:59:00