• 我的订阅
  • 科技

理解并超越大模型需要数学“应战”

类别:科技 发布时间:2023-07-26 06:00:00 来源:每日看点快看

本文转自:文汇报

清华人工智能研究院孙茂松表示,三五年内有望破解智能涌现之谜

理解并超越大模型需要数学“应战” ■本报记者 许琦敏

瓦特改良蒸汽机后大约100年,热力学三定律才阐明其机理。眼下,ChatGPT等大模型所表现出来的智能涌现,需要多少年才能被解释清楚?昨天举行的浦江基础科学发展论坛上,清华大学人工智能研究院教授孙茂松表示,现在的AI(人工智能)绝对不会再给我们100年,理解大模型需要基础数学的加入,而一旦破解其背后的机理,就有机会超越现有大模型,建立下一代AI的理论和模型。

然而,大模型庞大的数据量对应用数学家提出了极大挑战。尽管目前世界上敢于“迎战”的数学家还为数不多,但孙茂松仍坚信,不出三五年,大模型智能涌现的机理研究一定会有突破。

智能涌现挑战全球数学家

只需输入几个例子,ChatGPT就能生成一个令人基本满意的答案。这种大大超出人们预期的结果,究竟是如何产生的?这连OpenAI团队也没弄明白。

目前,学界将ChatGPT的表现归为智能“涌现”。所谓涌现,通俗而言是指当一个个孤立的能力以某种方式组织起来,在达到一定规模后,突然爆发出非常强大的能力。人脑就是一种智能涌现的产物。

2020年GPT3发布时,大模型的智能涌现就已引起了学界关注。孙茂松认为,要阐释其背后机理,需要基础数学的介入,“它需要数学家的深邃理解力,抽提大模型背后的硬核本质”。对大模型的机理认识一旦突破,人工智能将进入一个全新时代。

然而,目前全球投入到这一挑战中的数学家寥寥。孙茂松认为,这是因为由工程驱动的AI神经网络规模已经达到了“无边无际”的程度,数学家从未解过如此庞大的方程组,而且这一问题与经典数学完全不同。

不过,他也强调,哪怕一时不能搞清大模型背后的机制,数学家的加入也能为AI发展提出新视角,创新AI现有体系。

语料耗尽将让大模型发展停滞?

训练自然语言大模型,需要不停“投喂”语料。当人类现有语料耗尽,大模型的发展会否停滞?孙茂松认为,目前大模型对语料的利用仅仅停留在粗放的简单抓取阶段,AI对语料信息的深层解析与应用还有待进一步开发。例如,如今ChatGPT只能识别网页上的文本,但对标题、小标题等代表逻辑的格式信息,还不能分辨。

下一代自然语言大模型的发展方向是要让机器能“自然而靠谱地说话”。孙茂松说,千万不要小看了“说话”这种能力,正是语言能力的发展,让智人从原始人类中脱颖而出。机器能够像人一样使用语言,“可以说开创了世界五千年以来未有之格局”。

让机器“靠谱说话”的关键,在于让语言模型的输出结果与现实与事实对齐,避免“一本正经地胡说八道”。这背后需要付出极为艰辛而巨大的努力,“目前,国内外很多初创企业都在致力于这方面的开拓”。

决胜A I未来需要顶尖人才

ChatGPT爆火,国内各大模型纷纷冒头,呈现出“百模大战”之势。孙茂松认为,这是我国在AI领域实力的体现。尽管最后不少模型都会在竞争中淘汰,但仍有相当数量的大模型会在垂直领域中找到应用场景,推动AI技术的落地与发展。

在清华大学人工智能研究院,孙茂松带领团队在语言模型的垂直细分领域进行了不少示范性尝试。比如,开发生成古诗的“九歌”小程序、国内首款汉语反向词典wantword,以及与清华中文系合作开发古文大模型等。

“尽管大模型背后的机理尚未搞清,但这并不妨碍其在实际应用中的迅速发展。”在孙茂松看来,未来要在自然语言大模型领域占据先机,就必须培养出真正的世界顶尖人才,“最前沿之争就是顶尖高手之争,人才厚度决定了技术高度,而应用决定了AI的广度”。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-26 08:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...者在采访中获悉,上海张江数学研究院不仅将汇集全国的数学家共同聚焦“数学+”赋能产业,还将联合各个高校分院共同培养“数学+”复合型人才。此前,该研究院已在上海交通大学、华东师范
2023-12-20 06:06:00
人工智能已经可以解决复杂的数学问题了,还有哪些工作无法被取代
...力。他们对书面问题提供详细而清晰的回答。几十年来,数学家一直试图将证明转化为计算机代码,这一过程被称为形式化。如果你把证明写成代码,计算机运行代码时没有错误,你就知道证明是正
2023-02-24 18:22:00
人工智能赢得国际奥数银牌
...沿的数学往往需要极为复杂的证明,比如日本的京都大学数学家望月新一在证明“abc猜想”时,其证明过程长达500页。即便在数学家中,能仔细阅读完该证明过程的就寥寥无几,要是发现其
2024-07-27 16:43:00
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...I)铺平道路? 数学一直被视为人类智力的“天花板”,数学家则不断在挑战人类智力的极限。同时,数学难题也一直是大模型难以“征服”的领域之一。数学是推理的语言。长期以来,人们一
2024-06-14 11:54:00
...。数学真要成为首个借助AI实现突破的学科吗?一方面,数学家越来越频繁地使用AI;另一方面,AI也很“配合”——既可用于解决编程等应用学科的问题,也可用来攻克包括数学在内的自然
2023-12-15 01:27:00
9.11和9.9哪个大?实测12个大模型8个都答错,ChatGPT也翻车了
一道小学生难度的数学题难倒了一众海内外AI大模型。9.11和9.9哪个更大?就此问题,第一财经记者测试了12个大模型,其中阿里通义千问
2024-07-17 11:56:00
首个AI高考全卷评测结果发布:最高分303,数学全不及格
...设计的高难度综合性测试,目前普遍被研究者用于考察大模型的智能水平。在前不久高考结束后,上海人工智能实验室旗下司南评测体系OpenCompass选取了7个大模型进行高考“语数外”全卷能力测试
2024-06-24 09:22:00
2024年世界人工智能大会“数学与人工智能”学术会议在沪举办
...智能”学术会议在上海世博中心举办。来自全球多位知名数学家和科学家围绕机器学习与人工智能的数学基础、人工智能中的算法研究等主题进行深入讨论,共同探讨数学与人工智能领域的最新研究
2024-07-10 22:53:00
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...业大学工作期间,他曾和同事在一项研究中成功提高了大模型解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMa
2024-03-13 10:26:00
更多关于科技的资讯:
出海再提速!锦江酒店(中国区)宣布旗下7天酒店出海,同日签约10个项目
锦江酒店(中国区)规模化出海再次迎来关键节点。10月31日,其于深圳正式宣布,国民品牌7天酒店将进军东南亚市场。这是继今年8月底
2025-11-01 10:02:00
10月28日,亚洲国际动力传动与控制技术展览会(PTC ASIA 2025)在上海新国际博览中心启幕。近1800家海内外知名展商齐聚
2025-11-01 07:03:00
正式发布!视源股份牵头制定《娱乐用车载显示系统图像质量技术规范》团体标准
2025年10月23日,在全国音频、视频及多媒体系统与设备标准化技术委员会(SAC/TC 242)商用显示标准研究组第六次全会暨标准研讨会上
2025-10-31 08:20:00
中感集团煤仓安全综合解决方案亮相中国国际煤炭采矿展,以系统性创新重塑矿山作业安全
在北京举行的第21届中国国际煤炭采矿技术交流与设备展览会上,中感集团创新展示的“煤仓安全综合解决方案”引发行业高度关注
2025-10-31 08:51:00
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲
2025中国国际数字经济博览会在石家庄国际会展中心开幕。科杰科技董事长于洋受邀出席2025首席数据官峰会论坛,并作主题为《人工智能产业决胜与 Data&
2025-10-31 08:51:00
■加快构建覆盖全域、经济适用、安全可靠的数字技术支撑体系,着力打通数据壁垒与业务断点,促进产业链各环节融通发展■建立功能完善
2025-10-31 09:05:00
在数字化、网络化、智能化的当下,图书馆的角色和功能正在发生深刻变化。究竟什么样的图书馆更“聪明”?近日,第五届长三角公共图书馆发展论坛在上海举行
2025-10-31 09:05:00
Mutual妙趣艺:全球战略+资源整合,打造文娱IP数字资产化标杆
Mutual妙趣艺于2020年成立于美国加州,专注于文娱IP(知识产权)数字资产化领域。公司的核心定位是打造“数字资产领域的AWS”
2025-10-31 10:57:00
鲁网10月31日讯近日,“2025年第四届移动网络高质量发展论坛”在北京盛大启幕。在本次论坛上,工业和信息化部委托中国信通院权威发布了2024年“全国百城重点区域移动网络质量专项评测结果”
2025-10-31 11:43:00
人工智能(AI)是新一轮科技革命和产业变革的重要驱动力量,广西聚焦国家所需、广西所能、东盟所盼,正加快构建一条“北上广研发+广西集成+东盟应用”的特色发展路径
2025-10-31 11:46:00
aigo国民好物成为第32届WCGC全球总决赛官方唯一翻译类供应商——以中国智造共铸无界对话的全球盛事
上海,2025年10月 —— 备受瞩目的第32届世界企业高尔夫挑战赛(WCGC)全球总决赛于2025年10月19日至23日在上海东庄海岸高尔夫俱乐部隆重举行
2025-10-31 11:52:00
让检测全面拥抱AI!科学指南针2025产品服务发布会举行
让检测全面拥抱AI!10月30日,科学指南针2025年度产品服务发布会在杭州举办,来自高校院所、企业、分析测试中心等多方行业代表到场参会
2025-10-31 11:52:00
培育钻定制哪个品牌好?2025最新测评出炉,国产珠宝高性价比领跑榜单
曾几何时,钻石承载着“钻石恒久远,一颗永流传”的爱情神话,而天然钻石的稀缺性更被赋予了极高的市场价值。然而,随着实验室培育钻石技术的突破性进展
2025-10-31 12:14:00
在企业商旅管理从“费用管控”向“全流程智能管理”演进的关键时期,平台竞争力已不再局限于单一的预订功能,而是延伸至合规风控
2025-10-31 12:16:00
拓竹荣膺《时代》最佳发明,3D打印技术步入主流创新支撑体系
近期,《时代》周刊公布2025年度最佳发明榜单,揭示一个耐人寻味的现象:在300项突破性发明中,仅有4项被明确标注为3D打印创新
2025-10-31 12:19:00