• 我的订阅
  • 科技

大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究

类别:科技 发布时间:2023-09-28 12:01:00 来源:搜狐科技

搜狐科技《思想大爆炸——对话科学家》栏目第31期,对话复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏。

嘉宾简介:

邱锡鹏,复旦大学计算机科学技术学院教授,中国计算机学会会员,国内第一个对话式语言大模型“MOSS”负责人,曾获中国中文信息学会“钱伟长中文信息处理科学技术奖”一等奖。他的主要研究方向包括自然语言处理与基础模型,在 ACL等知名会议上发表 100 余篇学术论文,被引用1.5万余次。

大模型还能怎么创新?复旦教授邱锡鹏:需在新的架构、多模态等方面多做研究

划重点:

1.现在大模型整体架构比较雷同,要想做出创新,还需在新的架构、幻觉问题、多模态等方面多做研究。

2.我本身就比较喜欢自由的研究氛围。复旦是一个让我觉得舒服宽松的地方,能够去做自己喜欢的事情。

3.大模型是一个非常长的周期链,预训练是开始的部分,后面还有指令的微调和对齐,是有非常多研究机会的。

4.想要实现通用人工智能,需提升大模型之间多智能体协同的能力,比如说我们是不是可以用多个大模型,像人一样,取各之所长,合作起来完成一件事。

出品|搜狐科技

作者|郑松毅

“现在大模型整体架构比较雷同,要想做出创新,还需在新的架构、幻觉问题、多模态等方面多做研究。”复旦大学计算机科学技术学院教授、MOSS大模型负责人邱锡鹏,在2023中国计算机大会(CNCC)正式开幕前对搜狐科技表示。

“MOSS”是国内第一个对话式语言大模型。谈及做大模型的初心,邱锡鹏说道,大模型和人工智能方面的研究是课题组一直在做的事,ChatGPT发布之前就已经在做,只不过那时做的属于底层的基础模型,是不能直接和人进行交互的。

他认为ChatGPT的确可以被认为是革命性的,以对话的形式让模型能够和人类直接交互,同时当模型足够大时,通用能力非常强。

1997年,邱锡鹏考入复旦大学攻读学士学位,他表示,自己对人工智能的热忱就是在读本科时听完导师的报告,慢慢了解这个领域后被激发出来的,直到现在都保持非常高的热情。2001年毕业后,邱锡鹏继续在复旦大学攻读博士学位,直到2006年毕业后加入到复旦大学计算机科学技术学院,开始了自己的科研之路。

可以说,邱锡鹏将自己学业和工作的记忆都完整保存在了复旦大学。

当好奇为何邱锡鹏对复旦大学如此偏爱时,他没有过多考虑地回答道,“我本身就比较喜欢自由的研究氛围。复旦是一个让我觉得舒服宽松的地方,能够去做自己喜欢的事情。”

邱锡鹏坦言,现在国内的大模型和OpenAI的相比还是有一些差距的,一方面要去追赶,另一方面要把它非常强的推理能力尽快复现出来,并追求超越。

大模型的训练成本一直被认为是天文数字,随着大模型规模的发展,“新手”迈入大模型赛道的门槛也越来越高。

他表示,“现在大模型的训练成本相较于最初是低了些的,和训练效率有关。早期上百张卡并行的话,GPU利用率大概30%到40%,现在可以通过很多手段,把利用率提高到50%以上。另外,早期大家只关注数据量,现在更多是只训练高质量数据,从而降低训练的时间。”

现在大模型赛道究竟还适合新手入局吗?

邱锡鹏认为,大模型是一个非常长的周期链,预训练是开始的部分,后面还有指令的微调和对齐,是有非常多研究机会的。

“但预训练这块确实是投入的时间长,投入的资金也大,回报比较慢,我觉得是不太适合新人去做了,除非你能有更好的想法。因为估计你要花很长的时间,才能摸清其中的门道。”

以下为对话实录(经整理编辑)

搜狐科技:大模型发展热潮转眼间已是半年,对比开始阶段,您觉得现阶段大模型的发展方向和研发方式发生了哪些变化?

邱锡鹏:变化肯定是有的,比如往多模态和更大的模型方向去发展,还有一个就是所谓的“超级对齐”,以及开源的社区越来越多。

实话实说现在我们这些模型和OpenAI的相比还是有一些差距的,一方面我们要去追赶,另一方面要把它非常强的推理能力尽快复现出来,并追求超越。

从学术角度来说,要有创新性。现在大模型整个架构都比较雷同,未来大模型想要发展还需在新的架构、幻觉问题、多模态等方面多做研究。

搜狐科技:您是如何理解刚才提到的“超级对齐”的?

邱锡鹏:之前都是人给机器打分,但其实是有问题存在的。比如涉及到价值观的话,每个人之间都是有差异性的,不同国家和地区的人都不太一样。

现在就是在寻找一种更公平的评分机制,比如不仅利用人的反馈,还用到环境的反馈,或者说写一段代码代替人给机器打分。

搜狐科技:很多人还习惯于用参数量级评判一个模型是否为“大模型”,这种判断方式科学吗?参数量级是否还是决定大模型能力的必要条件?

邱锡鹏:参数量大并不是唯一判断条件,训练数据量也要大,使得模型具备类似思维涌现的能力。

搜狐科技:现在大模型的训练成本依旧很高吗?日前媒体报道OpenAI 的CEO奥特曼前不久还去找中东土豪融资,请问大模型训练成本未来能慢慢降下来吗?

邱锡鹏:我是觉得训练成本相较于初期是低了些的,和训练效率有关。早期上百张卡并行的话,GPU利用率大概30%到40%,现在可以通过很多手段,把利用率提高到50%以上。另外,早期大家只关注数据量,现在更多是只训练高质量数据,从而降低训练的时间。

搜狐科技:MOSS大模型商业化落地进展怎么样了,解决了哪些问题,是否已进入盈利阶段?

邱锡鹏:我们现在是开源,下载量非常多,也听说在不同的行业有具体的应用。但我们是高校团队,还是以研究为主,并没有太多深入各个行业去了解。

解决行业问题的话大致分为两个方面,第一类是直接处理文本数据的,比如医疗、金融等;另一类是充当中间控制台角色,比如在智能制造行业,用户把需求说给语言模型,再由语言模型控制机械动作。

搜狐科技:您将会在CNCC上讨论大模型的研究进展和产业应用展望,从MOSS作为最早国内对话式语言大模型来看,感觉您是一位具有前瞻性发展眼光的人。您也曾表示更看重大模型下一阶段的发展,即实现“通用人工智能”。那么您觉得大模型下一阶段的发展机会点在于什么?

邱锡鹏:现在很多智能,比如常见的语音识别、人脸识别等等都是专用的,语音识别只能做语音识别,不能做人脸识别。但“通用人工智能”就像人类的大脑一样,能处理所有事,这也是AI领域的终极目标。

对于通用人工智能来说,如何拓展出更多的模态是现在正在研究的。GPT虽然展示出很强大的通用性,但它还是停留在语言层面。下一步如果想往通用人工智能发展,就要让它能够接入图片、视频、音频等各种模态的数据,并让它能够理解和处理,包括生成。

同时要让大模型学会使用工具,就像人一样,一个人本身的能力可能并不强,但人能够使用各种工具。对于大模型而言,可以通过接入插件来实现。

第三就是要提升大模型之间多智能体协同的能力,比如说我们是不是可以用多个大模型,像人一样,取各之所长,合作起来完成一件事。

搜狐科技:您将会在CNCC上讨论让大语言模型具有内生的语音对话能力,能请您谈下具体这是怎样一种能力吗?

邱锡鹏:这是我们的工作之一,因为我们觉得现在的大模型如果想直接和人类用语音进行交流的话,前面必须先做一个语音识别,然后回复出来的文字还需要做一个文字转语音的工作,相当于多出了两个模块。

但我们觉得这好像是没有必要的,因为大模型本身能够更好的理解语言,加一个额外的声音和文本之间转换没有必要,所以我们想让它直接接收声音信号,并且直接返回声音。这样一来不仅提升了效率,还避免了原来语音识别过程中信息缺失的问题。

搜狐科技:展望十年后,您觉得“大模型时代”会演变成什么样子,会给人类社会带来哪些影响和变化?

邱锡鹏:大模型现在相当于一个中枢,那将来肯定变成各种各样角色化的智能体。比如说每个人都有自己的大模型,每个公司都有自己的模型。它能真正充当个人的助理、高级伴侣之类的。

并且它可以以实体的形态出现,比如放在机器人上或出现在家庭里面等等,我觉得很快都会实现。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-09-28 15:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

年度生成式AI大会上海站公布最新嘉宾,报名进入最后阶段
...绍主峰会新增参会的嘉宾。在首日进行的大模型峰会上,复旦大学计算机科学技术学院教授、上海市智能信息处理实验室副主任张奇将带来主题报告,联汇科技CEO兼首席科学家赵天成、VAST
2024-11-26 09:38:00
清华教授唐杰:Scaling Laws虽被质疑,但至今仍是提高大模型性能的重要方法
...事实性以及推理能力的缺陷,实现更精细的语义理解、多模态(文本、图像、语音、视频等)输入和输出,具备更强的个性化能力。”“人工智能的发展会更多瞄向通用人工智能,实现AI的自我解
2024-06-05 18:36:00
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”
2023-12-15 01:14:00
首个多模态连续学习综述,港中文、清华、UIC联合发布
...址:https://github.com/LucyDYu/Awesome-Multimodal-Continual-Learning多模态连续学习的最新进展连续学习(CL)旨在增强机器学习模型的能力
2024-11-14 09:46:00
搭建交流平台 推动技术创新 “认知世界 智创未来”主题论坛在沪举办
...工智能前沿领域的技术创新与未来发展。论坛现场论坛由复旦大学数学科学学院教授林伟主持,来自卡内基梅隆大学、牛津大学和香港大学、复旦大学的知名专家教授分享了他们的研究成果、行业见
2024-07-06 08:26:00
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...低80%,即和GPT-4o价格相当。对于OpenAI此次发布的新模型,复旦大学计算机科学技术学院教授、MOSS大模型核心人员张奇对搜狐科技表示,它依然不具备真正的推理能力。“
2024-09-13 16:44:00
AI专家呼吁业界开放共享技术,面临十大科学挑战
今年2月,复旦大学邱锡鹏团队发布MOSS,成为国内首个发布的类ChatGPT模型,而从ChatGPT诞生至今已过去9个多月
2023-08-26 21:49:00
首届中国大模型大会在北京举行
...容认知全国重点实验室主任叶蓁蓁,清华大学教授唐杰,复旦大学教授邱锡鹏分别以“应用者视角的AI发展与合作”“ChatGLM:从大模型看AGI的发展”“从大语言模型到世界模型”为
2024-06-20 17:17:00
复旦大学自然语言处理实验室上线升级版大型语言模型Moss
4月21日,复旦大学自然语言处理实验室上线了升级版大型语言模型Moss,并首次对其进行开源。复旦大学计算机科学技术学院教授MOSS系统负责人邱锡鹏表示:“Moss是国内首个插件版
2023-04-24 00:43:00
更多关于科技的资讯:
“消失的法老”回来了!“BesTV上海博物馆”今天上线 计划实现上海电视用户全覆盖
11月18日,“廿念不忘,帧帧日上——百视通成立20周年分享会”在国际会议中心举行。作为20周年重磅发布之一,由百视通与上海博物馆联合打造的“BesTV上海博物馆”产品正式亮相并登陆上海移动高清电视
2025-11-20 08:06:00
入住4年仍甲醛超标!福建卫视《现场》探访实录,解码智能门的健康升级路径
近日,福州居然之家王力安防门店迎来了一位特别的客人——消费者丁先生专程送来一面写有“贴心服务暖人心,智能监测护健康”的锦旗
2025-11-20 08:06:00
厦门网讯(厦门日报记者 林露虹) 近日,专注于毫米波雷达芯片研发的厦企——矽杰微电子(厦门)有限公司(简称“矽杰微电子”)完成C1轮增资
2025-11-20 08:29:00
厦门围绕“金鸡”品牌 在影视产业链上持续发力
陈铎(中)指导员工进行《活宝档案》动画制作。海丝(厦门)电影工业产业基地施工现场。 厦门网讯(文/图 厦门日报记者 邬秀君)走进位于软件园一期的继来之(厦门)人工智能研究院有限公司
2025-11-20 08:30:00
记者走基层|集装箱“搬上”无人车 解锁配送新技能
11月1日,在廊坊座头鲸科技有限公司智能制造基地,工作人员对蓝丁智能无人配送车底盘进行性能测试。 河北日报记者 刘 杰摄11月1日清晨
2025-11-20 08:49:00
破局之法,精耕之道 《精耕者访谈》第三季·区域之王重磅开启!
11月18日,由蓝河乳业独家冠名的《精耕者访谈》第三季·区域之王正式启动。作为母婴行业首个高端访谈栏目,其始终着眼于市场一线
2025-11-20 09:06:00
北京博大健康体检管理中心盛大启幕 以“科技+精准”重新定义健康管理新标杆
11月18日上午,北京博大健康体检管理中心(简称“博大体检”或“中心”)在京举行开业典礼,正式落地北京经济技术开发区南海绿茵国际园区
2025-11-20 09:06:00
以儿童为本——赖园青的幼儿教育科学实践之路
在人工智能与教育深度融合的浪潮中,如何让技术真正服务于幼儿认知发展?上海浦东新区民办普瑞姆幼儿园园长赖园青用贯穿理论与实践的智慧教育探索
2025-11-20 10:06:00
山东移动招远分公司秋冬宽带服务义诊暖心启动 专业服务守护数字生活
胶东在线11月19日讯(通讯员王少娜徐冰鑫)秋冬时节,居民居家上网需求激增,网络卡顿、信号盲区、设备老化等问题更易影响用户使用体验
2025-11-20 10:17:00
四梯科技重磅发布智能产业工程师证书项目 推动教育科技人才一体化发展
2025年11月14日,在深圳第二十七届中国国际高新技术成果交易会第二届产教融合与科教融汇论坛上,北京四梯科技有限公司(以下简称“四梯科技”)首次面向社会正式发布“四梯智能产业工程师证书项目”(4T SIEC)
2025-11-20 11:37:00
一屏承古韵,元景越千年!联通数智重构文博文创新范式的野望
11月17日,“中华文明起源系列——‘看·见殷商’”展览总结暨博物馆高质量发展研讨会在北京大运河博物馆举行。会上回顾了“看·见殷商”展览的创新实践
2025-11-20 12:07:00
名创优品斩获国际零售地产大奖MAPIC 2025\
在法国戛纳举办的 2025 年全球零售商业地产峰会大奖(MAPIC Awards)中,名创优品凭借其MINISO LAND战略级店态
2025-11-20 14:38:00
正雅2025中亚市场战略深入拓展,彰显国际品牌实力
2025年,正雅齿科持续推动其在中亚和俄罗斯市场的战略布局,通过一系列系统化的全球参展和品牌活动,进一步巩固其在隐形正畸领域的国际影响力
2025-11-20 15:08:00
北京搭台助“实干派”机器人出圈
这两天京城寒意持续“在线”,中关村国家自主创新示范区展示中心内却是一片热火朝天——99支团队带着各自的“智能劳动者”,在2025年第二届中关村具身智能机器人应用大赛上展开“终极对决”
2025-11-20 15:08:00