• 我的订阅
  • 科技

拓宽行业应用场景 多模态大模型加速通用AI进程

类别:科技 发布时间:2024-02-26 08:58:00 来源:人民资讯

本文转自:人民网

人民网北京2月26日电 (焦磊)只需输入文本指令,便可生成60s的视频内容,并在画面效果、视频时长、流畅度和逻辑性等方面具备惊人效果……近日,OpenAI发布的文生视频大模型Sora迅速引发人们关注。业内分析认为,该项新产品或将促使大模型厂商加大对多模态大模型的研发投入,并进一步推动AGI(通用人工智能)进程。

一直以来,视频领域便是被普遍看好的AI应用落脚点之一。继可生成图文的ChatGPT之后,Sora的发布迎合了业内对多模态大模型的期待。

模态即每一种信息的来源或形式。人们在信息获取、环境感知、知识学习与表达等方面都是采用多模态的输入、输出方式。

华福证券研报表示,相比单模态,多模态大模型同时处理文本、图片、音频以及视频等多类信息,与现实世界融合度高,更符合人类接收、处理和表达信息的方式,与人类交互方式更加灵活,表现得更加智能,能够执行更大范围的任务,有望推动AI迈向AGI。

此前,大模型在各个领域的应用主要集中在文生文、文生图之上,而在文生视频领域却进步缓慢。业内分析表示,此次Sora的发布,将促使多模态大模型成为生成式AI的重点发展方向。未来人机交互将通过文字、视觉、语音等多维度沟通,进而提升效率,逐渐向AGI方向迈进。

值得一提的是,国务院国资委日前召开“AI赋能产业焕新”中央企业人工智能专题推进会。会议提出,开展AI+专项行动,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。

视频大模型的创新进步,也引起人们对相关内容行业变革的思考。

浦银国际分析认为,对于短视频,Sora提升了内容供给及创作质量,并有效降低了门槛和成本,或将进入“全民创作”时代。而长视频对内容质量等专业化要求较高,AI生成视频在精准度、可编辑性等方面仍需进一步打磨,长期发展空间广阔。

IDC中国研究总监卢言霞认为,Sora将最先应用于短视频、广告、互娱、影视、媒体等领域。在这些领域采用多模态大模型能力,辅助人类员工生成视频,既可以提高生产速度又可以提高生产数量,还可以创造全新的视觉感受,能够帮助企业真正实现降本增效、提升用户体验。

与图文相比,视频内容所包含的数据量巨大,因而引发人们对算力需求的关注。业内分析认为,AI视频对算力的需求将会是几何式增长,算力限制可能是影响文生视频类应用开放使用的重要因素。

卢言霞表示,多模态大模型对算力的消耗更高,算力的可获取性以及成本将是挑战之一。此外,多模态大模型将带来更严峻的安全挑战。一方面多模态大模型将读取更多的图像、视频类数据,这些图像视频数据是否合规是否安全,需要得到保障;另一方面,生成视频与真实世界之间的差异,需评估是否会影响到人身安全、社会稳定、企业安全等。

根据华泰证券研报,2023年实际诞生文生视频大模型达到数十个,全球用户数量超过百万级别,但目前多数视频模型仍处于产品早期阶段。从创作端看,市场上已公开的大多数模型出自初创公司和小型技术开发团队,包括Runaway、Pika等,且目前已呈现较为可观的完成效果和商业模式。(实习生张泊洋对此文亦有贡献)

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-26 13:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

从Agent到多模态,大模型想要什么?
图片来源@视觉中国文|李智勇OpenAI 9.25发了个关于多模态版本的Blog说chatGPT现在能够看、听、说了,体验过的同学反馈还不错
2023-10-01 17:01:00
ChatGPT中短期产业化方向主要为:文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服
...域。我们认为ChatGPT中短期内产业化的方向主要分为文字模态的AIGC应用、代码开发相关、图像生成领域、智能客服四大板块
2023-02-19 10:00:00
Sora再度颠覆AI视频行业,A股哪些公司有相关布局?
...实现AGI(通用人工智能)的重要里程碑。券商建议关注多模态技术Sora视频一出,立刻震惊业界。360集团创始人、董事长周鸿祎2月16日在微博发文表示
2024-02-19 08:10:00
...于科技创新引导下的产业升级和竞争优势构建,故而在多模态大模型、云端操作系统以及机器人本体、机器人柔性关节等方面持续强化研发投入,已经完成了云端机器人的全产业链布局。其产品广泛
2024-05-14 14:39:00
智能化应用将出现爆发式增长(AI前沿观察)
...的热点目标,企业也需要持续建设自己的人才队伍。■多模态大模型塑造“多边形战士”应用——多模态大模型是当前大模型训练和开发的重要方向,能够提升智能化应用中的信息丰富度和全面性。
2024-01-19 03:22:00
空间智能产业化加速 一线企业集体锚定百度智能云
...身智能、智能硬件等领域的产业生产力。近两年,随着多模态大模型、3DGC、空间计算等技术的飞速演进,空间智能正从技术探索加速迈入产业规模化落地阶段。在空间智能大模型应用落地进程
2025-07-24 19:59:00
数据驱动未来:AI大模型在多场景应用中的挑战与机遇
...。随着人工智能的应用场景越来越多元化,需要处理多种模态的数据,例如文本、图像、语音等。未来,大模型将更加注重多模态的融合,以处理更加复杂的应用场景。返回搜狐,查看更多责任编辑
2024-02-18 21:00:00
盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证 【盛视科技:公司基于多模态大模型技术底座的应用已在口岸业务场景得到初步验证】财联社12月13日电,盛视科
2023-12-13 21:50:00
...、准确、快捷的数字化依据。此外,基于“紫东太初”多模态大模型和人工智能开放服务平台,智媒实验室将开发智慧医疗行业垂直模型,建立人工智能驱动的医疗全流程模型,助力医疗导诊优化服
2024-04-22 03:59:00
更多关于科技的资讯:
鲁网11月21日讯为回馈客户,赋能业务高质量发展,近日,河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会
2025-11-22 09:34:00
灵光4天下载破100万,扩容8轮,刷新Sora2五天纪录
11月22日消息,蚂蚁灵光上线4天下载量突破100万,冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT
2025-11-22 14:13:00
知识带货热度高,历史作家梅毅在抖音直播间发布新书
知识带货热度不减,越来越多作家走进直播间推荐新书、好书。11月20日,知名历史作家梅毅(网名“赫连勃勃大王”)携新作《天命无常
2025-11-22 15:35:00
齐绘未来发布“快上岸”智能求职小程序,多项自主知识产权技术为大学生就业赋能
北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序,以多项具备自主知识产权的AI系统为核心,为大学生提供精准
2025-11-22 15:36:00
以开源聚合力,以生态促创新,电鸿走出行业操作系统自主路径
“在过去,去一次现场要带一大堆终端,以应对现场不同设备的接入。现在,只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享
2025-11-22 15:37:00
河北新闻网讯(李力芳)2025年7月份以来,河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备
2025-11-22 18:08:00
11月21日从太钢获悉,太钢近期硅钢产品订单在欧洲高端市场实现成功落地。此次出口的硅钢产品首次实现大卷重(15-17吨)和高牌号超宽规格(1250mm)供货
2025-11-22 18:20:00
校企携手研发新型电池 拓展长时储能应用新边界
荆楚网(湖北日报网)讯(记者唐天琪 通讯员王蕾、蓝静)11月20日,以“储能大时代,长时新蓝海”为主题的中国新型储能产业创新联盟2025年度大会在武汉召开
2025-11-22 19:06:00
必胜客中国业务进入快车道:门店突破4000家
2025年11月22日,百胜中国旗下必胜客在海南三亚举行中国第4000家门店的开业庆典。这一里程碑意味着必胜客在中国的布局进入新阶段
2025-11-22 22:32:00
从乡村直播间的农特产品,到城市商场的促销热潮,再到物流行业的高效运转……记者从太原市税务局获悉,随着“双11”将下半年消费市场带入旺季
2025-11-21 08:12:00
天阳科技发布“量子增强计划”,多方聚力共筑“量子金融”新生态
近日,以 “量子计算+AI:重塑金融科技新范式” 为主题的前沿科技研讨会在北京召开,本次研讨会由天阳宏业科技股份有限公司(以下简称 “天阳科技”)主办
2025-11-21 08:29:00
奋进的河北·“十四五”答卷丨身边的“十四五”(四):车间里的“智变”
向智而行,新型工业化加速跑——河钢集团唐钢公司构建全流程一体化生产计划排程系统,实现订单与产能高效匹配;石家庄四药集团应用生产执行系统
2025-11-21 08:36:00
“看见”,是新闻工作的起点。守护新闻工作者的清晰视野,就是守护社会公器的明亮窗口。11月18日,在厦门市新闻工作者协会指导下
2025-11-21 09:40:00
网易 UU 远程 Mac 被控功能上线,提升 macOS高效办公体验
网易 UU 远程全新版本上线,在已有 Mac 控制 PC 功能的基础上,正式开放 Mac 设备被控功能,自此 Mac 实现控制与被控的双向协作
2025-11-21 09:47:00
中新经纬11月21日电 “小米公司发言人”微博21日发布关于Xiaomi Watch S4 Sport潜水功能的说明。小米公司表示
2025-11-21 11:11:00