• 我的订阅
  • 社会

清华大学教授孙茂松:理解大模型机理建立AI新理论

类别:社会 发布时间:2023-07-27 15:01:00 来源:澎湃新闻

·只有搞清楚大模型的机理,才有可能克服现有人工智能大模型的局限性,超越现有大模型,建立下一代人工智能理论和模型。

·人工智能最前沿之争就是人才的竞争,顶尖高手决定了人工智能的高度,广泛的应用决定了人工智能的广度。

古诗词中,哪一诗句和唐代杜甫《绝句》中的“一行白鹭上青天”最接近?大模型的回答是宋代《野景》中的“白鹭一行登碧霄”。

清华大学教授孙茂松:理解大模型机理建立AI新理论

清华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松。

7月25日,清华大学人工智能研究院教授、欧洲人文和自然科学院外籍院士孙茂松表示,上述这类根据现有文本分析、不生成新文本的理解类大模型不存在“幻觉”。但像ChatGPT这样生成类的大模型,对话需要与事实对齐,这还要付出很大的努力,也是目前的研究热点。

他表示,当前业界对于ChatGPT的举一反三还处于“知其然,不知其所以然”的阶段,只有搞清楚大模型的机理,才有可能克服现有人工智能大模型的局限性,超越现有大模型,建立下一代人工智能理论和模型。而人工智能最前沿之争就是人才的竞争,顶尖高手决定了人工智能的高度,广泛的应用决定了人工智能的广度。

理解大模型机理,才能克服局限建立下一代AI理论

人们常常忽略语言的重要性,因为语言自然得就像空气一样。但只有人类才有语言能力,语言的地位极其重要。而ChatGPT的出现让机器也有了语言对话的能力,孙茂松说,这是5000年未有之变局,也会催生一系列新应用。

但对于ChatGPT,“现在是知其然,不知其所以然。OpenAI开发出了这样的现象,但为何会产生智能涌现这样的现象还说不清。现在人工智能领域的大公司、大机构都在拼命往前跑,把大模型效果做得更好,还没有时间停下来深刻地思考大模型的机理。”孙茂松表示,这就像蒸汽机带来了工业革命,但直到大约100年后在热力学三定律之下才解释清楚。

大模型里的元素事关数学,当前大模型的参数到了万亿级,应用数学家从来没有解过如此大的方程组,并且大模型涉及到的数学问题与经典数学完全不同,这为理解大模型机理带来了挑战。但孙茂松认为,只有搞清楚大模型的机理,才有可能克服现有人工智能大模型的局限性,超越现有大模型,建立下一代人工智能理论和模型。而这不会再像蒸汽机那样需要100年才能理解机理,他相信三五年时间就能突破大模型的机理研究。

语料利用处于粗放阶段,减少大模型幻觉是研究热点

目前大模型的语料利用还处于粗放阶段,仅仅是从互联网上抓取语料,还没有涉及网页中的超链接和图片处理、文本结构的识别与利用等。孙茂松表示,“大模型写短文可以写得很好,但写长文、短篇小说不行,它没有办法保持大逻辑流畅、人物角色连贯。因为大模型就是对下一个词的预测,预测得再好,它对语料的利用还是有深刻的不足。”

除此之外,孙茂松表示,要对语料质量保持足够关注,剔除语言不通顺的语料、计算机生成的语料,利用质量好的语料。但水至清则无鱼,越纯的语料可能导致多样性损失,例如喂给大模型的都是“高大上的语料”,大模型就看不懂带有表情符号的语料。因此要追求平衡,根据应用判断什么是好的语料。

大模型存在“幻觉”,常常一本正经地“胡说八道”。但孙茂松表示,“幻觉”是能力强的表现,是创新的源泉。大模型分为生成模型和理解模型,前者如ChatGPT,孙茂松说,以前要让计算机通顺地说话是做不到的,因为词与词的组合关系复杂。现在做到了通顺,但并不意味着所说的话是正确的,语义层、语用层都需要和现实世界对齐。“比如机器回答在上海城隍庙吃了上海小笼包和上海烤鸭,从语言角度来看,这都没有问题。哪个更符合事实,它就不知道了,这就需要人介入进来。”孙茂松表示,大模型的对话需要与事实对齐,这还要付出很大的努力,也是目前的研究热点。

对于后者,模型根据现有文本进行分析,不生成新的文本,只理解不说话,就不存在“幻觉”。利用这种理解模型,打通语料,让机器自主学习,就可以依靠模型查询相似诗句,例如哪一诗句和杜甫《绝句》中的“一行白鹭上青天”最接近?大模型的回答是宋代《野景》中的“白鹭一行登碧霄”,这就是大模型所擅长的。

AI最前沿之争是人才的竞争,顶尖高手决定高度

这一波人工智能浪潮起于2010年,彼时学术界和工业界都在开足马力研究,积累了充分的经验,ChatGPT的出现为人工智能点了一把火。孙茂松表示,国内的“百模大战”并非贬义,而是实力的象征。未来通用大模型支撑垂直模型的开发,绝大多数从业者将不会把主要精力放在基础模型上,而是面向行业应用开发垂直模型。

但在通用大模型方面,“我们确实在跟跑,跟领跑者的差距很明显。这半年我们把差距缩小了,但没有质的变化。”孙茂松表示,在ChatGPT之前,国内的大模型研究和国外相比差半个肩位,ChatGPT出现后甩开100米,这半年追了几十米,但在关键性能上还有差距。如果能够研究透彻大模型的机理,就可能棋高一着。

无论是模型还是应用,都离不开硬件厂商或云服务商,算力目前是最稀缺的资源。启明创投发布的《生成式AI》报告显示,GPU的性能实际上决定了这个新兴行业的步调,但从长期来看,人才对人工智能未来的影响超过算力。

孙茂松同样认为,人工智能最前沿之争就是人才的竞争,顶尖高手决定了人工智能的高度,广泛的应用决定了人工智能的广度。人工智能的发展需要一流的人才,这些人才除了具备顶尖的能力,还要有远大的科学理想、敏锐的洞察力和对技术的激情。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-07-27 17:46:52

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
清华大学计算机系讲席教授、人工智能研究院基础模型研究中心主任唐杰出品|搜狐科技作者|郑松毅2024年已过半,大模型之争热度不减,通往AGI的路究竟该怎么走?近日,清华大学计算机系
2024-06-05 18:36:00
...才能被解释清楚?昨天举行的浦江基础科学发展论坛上,清华大学人工智能研究院教授孙茂松表示,现在的AI(人工智能)绝对不会再给我们100年,理解大模型需要基础数学的加入,而一旦破
2023-07-26 06:00:00
大模型在产业界和学界的最新进展有哪些?
...模型已发布79个。在不久前的浦江基础科学发展论坛上,清华大学人工智能研究院常务副院长孙茂松教授对第一财经表示,我国乃至全球发展大模型最终的突破关键,是基础科学的突破。他说,对
2023-08-27 14:35:00
中新经纬5月24日电 5月23日,清华大学人工智能研究院常务副院长、欧洲科学院外籍院士孙茂松在北大光华度小满大模型公开课中,阐述了生成式人工智能对科技、文化和教育的影响。他认为,
2024-05-24 18:10:00
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
清华物理系传奇特奖得主Yao Shunyu,正式投身大模型,加入Anthropic的Claude团队。有意思的是,另一位Yao Shunyu
2024-10-29 09:54:00
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
...伊凡张伊凡2021年本科毕业于于北京大学元培学院,现为清华大学交叉信息学院博士研究生,师从袁洋助理教授。他的主要研究方向为基础模型(大语言模型)的理论和算法、自监督学习、可信
2024-09-24 13:36:00
清华量子计算成果登顶刊,来自丘成桐数学中心团队
...领域首次发现!噪声会造成量子优势突然消亡。这是来自清华大学丘成桐数学科学中心助理教授魏朝晖团队的最新研究成果,刚刚登上Science子刊。(相关成果以“关联生成中量子优势的突
2024-11-28 12:04:00
宇宙年龄被拉长到267亿岁?清华大学楼宇庆:检验起来有困难,甚至有点“邪”
...狐科技《思想大爆炸——对话科学家》栏目第22期,对话清华大学物理系教授、CUSPEA学者楼宇庆。嘉宾简介:楼宇庆,清华大学物理系教授、CUSPEA学者,哈佛大学物理博士,教育
2023-08-14 15:00:00
专访清华大学教授沈阳:AI应用实际上已经在快速普及中
...吗?3月28日第十一届中国网络视听大会上,央视网专访了清华大学新闻与传播学院教授、博士生导师、清华大学新闻与传播学院新媒体研究中心主任沈阳。央视网记者:人工智能逐渐融入大众生
2024-03-30 17:07:00
更多关于社会的资讯:
滨州市人民医院孙新国:生命禁区的守护者,与时间赛跑的铅衣卫士
齐鲁晚报·齐鲁壹点 陈甜田 通讯员 郭庆花近日,滨州市委宣传部、市委网信办、市卫生健康委联合公布了2025年“滨州好医生
2025-10-12 07:56:00
特需儿童背后的“影子老师”,让每一颗星星都闪闪发光
齐鲁晚报·齐鲁壹点 主余凤在临沂市沂河新区一所公办幼儿园的园区内,孩子们追逐嬉戏,笑声清脆。人群中,5岁的小远正小心翼翼地拉着玩具小车
2025-10-12 07:56:00
在中山陵景区游玩时晕倒得到及时救助离宁后,河南游客发来千余字感谢信□南京日报/紫金山新闻记者李子俊“我是一名来自河南的游客
2025-10-12 08:38:00
第十五届全运会江苏省体育代表团成立南京“省队市办”优秀运动队56人代表江苏出征南报网讯(记者程锦欣)10月11日,第十五届全国运动会江苏省体育代表团成立
2025-10-12 08:39:00
南报网讯(记者祝东秀)10月11日,由南京市委党史工作办公室、南京市新四军和华中抗日根据地研究会、南京市革命老区经济开发促进会联合编纂的《南京地区新四军活动亲历者说》出版座谈会在南京召开
2025-10-12 08:40:00
桐华里邻里中心·邻阅轩社区书苑开展“书香浸润童年,阅读点亮成长”主题阅读活动
鲁网10月11日讯秋意渐浓,书香正暖。10月7日,在临沂沂河新区相公街道桐华里邻里中心·邻阅轩社区书苑,一场以“阅读点亮成长”为主题的青少年阅读推广活动圆满落幕
2025-10-12 08:44:00
厦门网讯 (厦门日报记者 沈彦彦 王元晖)为进一步增强外贸发展内生动力,加快培育以技术、品牌、质量、服务为核心的出口竞争新优势
2025-10-12 09:04:00
齐鲁晚报·齐鲁壹点 连宁燕今年9月,山东省人民政府公布全省最低工资标准,威海市最低工资标准调整为每人每月2400元。根据失业保险金标准与最低工资挂钩联动机制规定
2025-10-12 10:47:00
重庆市渝北职业教育中心就“学生下跪事件”发布情况说明
大皖新闻讯 10月11日,大皖新闻报道了重庆市渝北职业教育中发生学生下跪事件。12日上午,校方就该事件发布情况说明。全文如下
2025-10-12 10:51:00
福耀科技大学学生获赠电脑是国产品牌 匿名爱心人士来自教师家庭
大皖新闻讯 记者10月12日从福耀科技大学获悉,国庆中秋假期后,有爱心人士匿名向福耀科技大学50名本科新生每人捐赠一台崭新的笔记本电脑
2025-10-12 10:52:00
中南民大首办校友返校日 校友学子共溯青春
荆楚网(湖北日报网)讯(记者林杉 通讯员袁愉雯 王钰涵)10月1日至3日,中南民族大学以“溯青春记忆 汇校友同心 谱写‘双一流’建设新篇章”为主题
2025-10-12 10:58:00
东城逸家社区卫生服务中心孙付军传承工作室获赠锦旗
近日,一位患者在家属的陪同下,将一面锦旗送至济南市民族医院东城逸家社区卫生服务中心主任郭文璐手中,借此表达诚挚谢意,对东城逸家社区卫生服务中心孙付军传承工作室负责人
2025-10-12 11:21:00
遵义市委党校:“一封家书”打开党性教育新方式
多彩贵州网讯 10月11日,遵义市委党校2025年秋季基本培训班原创的《国之本在家 一封家书》情景教学在遵义融媒集团演播厅上演
2025-10-12 11:24:00
31岁小伙康复后,向烟台毓璜顶医院东区ICU赠锦旗表谢意
齐鲁晚报·齐鲁壹点 孙淑玉 通讯员 李成修近日,烟台毓璜顶医院东区重症医学科(ICU)上演了温馨感人的一幕:31岁的张先生在经过ICU内28个昼夜的生死搏斗
2025-10-12 11:53:00
山东海阳,凭啥能频频给全国网友“刷”火箭?
齐鲁晚报·齐鲁壹点 钟建军 王琳 吕奇火箭尾焰划破海天,轰鸣声响彻云霄,10月11日上午10点20分03秒,由海阳总装出厂的引力一号(遥二)运载火箭在山东海阳附近海域发射成功
2025-10-12 11:55:00