• 我的订阅
  • 科技

阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用

类别:科技 发布时间:2025-02-21 16:10:00 来源:搜狐科技

阶跃星辰CEO姜大昕:强化学习不是AI的尽头,下一步是自主学习,Agent将成超级应用

出品 | 搜狐科技

作者 | 梁昌均

“十年前,大家谈起通用人工智能(AGI),觉得这是一个遥不可及的梦想。但随着大模型的飞速进步,今天越来越多的人开始相信AGI在未来的几年就会成为现实。”2月21日下午,阶跃星辰创始人&CEO姜大昕在生态开放日上演讲时提到。

阶跃星辰是一家成立于2023年的大模型公司,由微软前全球副总裁、微软亚洲互联网工程研究院副院长姜大昕创办,此前获得上海国资、腾讯、五源资本、启明创投等投资,并位列六小龙之列。

姜大昕表示,阶跃在成立之初,就规划了实现AGI的路线图,包括模拟世界、探索世界和归纳世界三个阶段。

在模拟世界阶段,训练模型的主要范式是模仿学习,学习的主要目标是各种模态的表征,下一步是培养模型能够解决复杂问题的能力。人脑对复杂问题的解决是启动系统2的模式,通过问题拆解不断探索。

“如何让模型也能够学会这种探索的过程,学会慢思考,采用的方法就是强化学习。AlphaGo以及最近非常火热的DeepSeek,采用的就是强化学习的训练方法。”姜大昕提到。

不过,姜大昕认为,强化学习还不是AI的尽头,AI的下一个尽头是机器能够通过自主学习,主动发现物理规律。

对于最近爆火的DeepSeek,姜大昕认为,它开源了模型,为整个AI社区做出了了不起的贡献。“受到DeepSeek的感召,我们在近期发布了两款开源的多模态大模型。”

他提到的这两款模型是300亿参数的文生视频模型,以及1300亿参数的语音模型Step Audio。“我们希望通过这两款多模态大模型的的开源,助力开发者创建出更丰富多彩的应用出来。”

姜大昕还透露,阶跃正在研发推理模型Open-Reasoner-Zero,其方案相比DeepSeek-R1- Zero,效率可以达到25倍,并表示会开源实验结果、代码数据以及论文。

同时,阶跃还在研发视觉推理模型。姜大昕认为,视觉和文本一样,遇到复杂的问题,还是需要慢思考和思维链的能力,如何把强学习的方法能够引入视觉领域,实现慢思考,这是前沿的问题。

对于大模型的应用发展,姜大昕认为,随着Agent逐渐升温,已经成为海内外公认的AI超级应用。

他表示,Agent最重要的特点是能够自主帮助人类完成复杂的任务。所谓自主有两层含义,一个是自动,在执行任务的时候尽可能自动完成,减少或者无需人类的干预;一个是主动,Agent能够观察用户所处周围的环境,主动发起或者完成任务,而不是仅仅被动接受任务。

“为什么Agent会在眼下这个时间点突然变得火热,以至于很多人认为2025年将是Agent元年,我想这是因为Agent的爆发需要两个必要条件,一个是多模态的能力,一个是慢思考的能力,这两个能力在2024年的时候都实现了。”姜大昕说。

他进一步解释到,多模态的能力能够使Agent充分的理解和感知世界,更好的理解用户任务。除了多模态的能力,想要让任务的完成率或效率更高,还需要强大的推理,也就是慢思考的能力。

“现在机器的思考的能力还是比较弱,它只能思考几十秒钟,最多达到几分钟。”姜大昕认为,随着模型能力不断增强,机器思考的时间会变得越来越长,这意味着距离AGI的目标会越来越近。

同时,他认为未来会出现不同形态的Agent,未来每一台终端设备都会有一个Agent,它具备的能力会从简单任务、组合任务、复杂任务,升级到主动发起任务和最后的情感陪伴。返回搜狐,查看更多

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-02-21 17:45:08

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

阶跃星辰宣布开源图生视频模型,多模态领域的DeepSeek时刻何时来?
...对话的语音交互大模型Step-Audio。 阶跃星辰创始人、CEO姜大昕在开放日现场表示,两款模型自开源以来得到了广泛关注,产业侧有更多伙伴加入了开源生态,包括技术社区、创
2025-02-22 16:36:00
AI发展变慢了?几位AI头部创业者并不赞同
...上,国内头部AI公司的三位创业者——阶跃星辰创始人姜大昕,月之暗面创始人杨植麟,清华大学人工智能研究院副院长、生数科技首席科学家朱军,均否认了AI发展速度放缓的观点。姜大昕说
2024-09-21 13:52:00
帝都、魔都双双押宝 年底了AI圈居然还有高手
...去 10 年 AI 的最前沿发展。比如阶跃星辰的创始人、CEO 姜大昕,这哥们以前是微软前全球副总裁,日活上亿、备受差友们喜欢的 Bing 搜索
2024-12-26 00:36:00
阶跃星辰将在3月开源图生视频模型
《科创板日报》22日讯,在2025全球开发者先锋大会上,阶跃星辰CEO姜大昕透露,阶跃星辰决定继续保持开源策略,将在3月份开源图生视频模型。(记者 张洋洋)/阅读下一篇/返回网易
2025-02-22 11:10:00
...大模型。股东方代表,阶跃星辰CEO、前微软全球副总裁姜大昕博士此次出任财跃星辰首席科学家,其在机器学习、数据挖掘、自然语言处理和生物信息学等领域拥有丰富的研究及工程经验。据介
2024-03-24 00:30:00
...通用大模型公司阶跃星辰联合创办,前微软全球副总裁姜大昕任首席科学家。公司围绕金融信息服务、智能投顾、智能投研等场景,助力金融机构打造新质生产力。
2024-03-24 04:26:00
...转自:无锡日报本报讯 原无锡县化工公司的离休干部夏大昕同志,因病医治无效于2023年1月26日17时50分在无锡逝世
2023-01-29 06:46:00
...七史商榷》《廿二史考异》,分别出自赵翼、王鸣盛、钱大昕之手。赵翼作品清代赵翼(1727年—1814年),江苏常州府阳湖县人。字云崧,一字耘崧,号瓯北。长于史学,考据精赅。赵翼
2023-08-21 14:29:00
数据驱动AI的新纪元,联想凌拓的新使命
...加速推动千行百业的智能转型。在联想凌拓首席执行官陆大昕看来:“作为算力价值发挥的基础,数据存储是提升数据质量和处理效率的利器。数据存储技术的不断演进,使得智能数据管理的性能及
2024-02-06 16:42:00
更多关于科技的资讯:
省数据和政务服务局发布公告公开征集一批河北省高质量数据集河北日报讯(记者解楚楚)9月26日,河北省数据和政务服务局发布公告
2025-10-04 08:03:00
央媒看太原9月30日,央视财经频道《经济信息联播》栏目以《双节市场备货足美食特产受青睐》为题,报道了假期到来,太原市各大综合市场提前备货
2025-10-04 07:17:00
厦门网讯(厦门日报记者 朱道衡)近日,2025鼓浪屿世遗文创作品征集活动启动。此次活动面向全国(含港澳台地区)高校、企业
2025-10-03 08:37:00
厦门网讯(厦门日报记者 楚燕 通讯员 石青青)长假期间,许多人从忙碌的工作中解脱出来,趁机好好休息。可是,如果休息方式不得当
2025-10-03 08:37:00
渤海之潮涌动着澎湃的脉搏,海河之畔镌刻着科技的印记。10年前,一颗带有“清华”基因的种子在天津这片沃土扎根;10年后,它长成一棵枝繁叶茂的参天大树
2025-10-03 09:25:00
太燃了!无人机空中展旗!高新区国庆“氛围组”已上线!
2025-10-03 23:48:00
抖音生活服务联合北京卫视发起“老板驾到”直播活动,吸引用户下单超100万元团购券
9月29日,抖音生活服务联合北京卫视发起“老板驾到”直播活动,助力北京国庆中秋消费。抖音用户在@北京卫视 直播间下单超1万次
2025-10-03 18:36:00
“FutureBOT未来引力”2025北京机器人文化节首日盛况 打造国庆科技打卡新地标
国庆首日,“FutureBOT未来引力”2025北京机器人文化节在北京昌平超极合生汇正式拉开帷幕,成为国庆假期极具科技温度的打卡地
2025-10-03 19:06:00
走到白石山巅的尽头,这家建在悬崖边的“云端咖啡厅”绝对让你惊呼。
2025-10-03 11:37:00
泰康人寿发布新品“泰康百万药无忧(庆典版)医疗保险”(以下‬简称“百万药无忧”),以广覆盖、易投保、强保障、低费率为优势
2025-10-03 09:17:00
厦门网讯(厦门日报记者 翁华鸿 通讯员 林雨新)在近日举行的2025全球数据管理峰会“数据要素分论坛暨大数据统计与人工智能技术创新管理研讨会”上
2025-10-03 08:38:00
兴趣-实践-视野:达芬奇金奖少年带来的教育启示录
摘要:2025“你是达芬奇”全球青少年科学与艺术创新赛圆满落幕,其中金奖获奖少年的亲身实践告诉我们,在AI赋能的新时代
2025-10-02 16:22:00
单日调用近1万亿次,高德助力北斗规模化民用跨入新量级
2025年10月1日,随着国庆长假首日出行高峰的到来,高德基于北斗卫星导航系统的定位数量接近1万亿次,支撑导航总里程数超90亿公里
2025-10-02 22:31:00
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00