• 我的订阅
  • 头条热搜
寥寥数语生成60秒视频 Sora能否改变影视行业?
...算机科学与工程系教授赵海。赵海教授介绍,Sora属于多模态混合模型,由大语言模型和文图生成器拼接而成。纯文图生成模型对提示词的理解能力很弱。比如,用户输入“世界和平”,它往往无法生成准确的图片。如果把文图...……更多
腾讯混元文生图大模型升级并对外开源
...显存为11GB,同时运行DialogGen(腾讯推出的文本转图像多模态交互式对话系统)和混元DiT则至少需要32GB的显存,腾讯表示他们已经在Linux上测试了英伟达的V100和A100GPU。▲配置要求据此前报道,国内首个官方“大模型标准符合性评...……更多
...,AI营销的“全能”,体现在从最初的文生文,进入到多模态的文生图、文生音频、文生视频,涵盖内容创作的各个维度,生成式人工智能技术(AIGC)行业生态链日渐完善。迪思传媒副总裁、AIGC创新研发中心负责人江忠锋表示...……更多
猎豹CEO傅盛2024年预言:千亿大模型过半凋零,人形机器人必定不能量产【附AIGC市场现状分析】
...景划分,AI大模型主要包括语言大模型、视觉大模型和多模态大模型等。业界典型的自然语言大模型有GPT-3、源、悟道和文心等。视觉大模型也已广泛应用于自动驾驶、智能安防、医学影像等领域。基于多模态大模型的以文生图...……更多
“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI
...索(DeepSeek)又抛出新模型。1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。Github社……更多
文博会观察:大模型为文化产业发展提供新机遇
...前来互动。“面向文化创作领域,腾讯混元正积极发展多模态模型,以进一步加强文生图、文生3D以及文或图生视频能力。”腾讯云副总裁、腾讯混元大模型负责人刘煜宏举例子表示,面对内容制作行业多样化需求,腾讯混元在...……更多
下载次数破39万!CMU、Meta联合发布VQAScore文生图优化方案:Imagen3已采用
...论文提名和最佳短论文奖等。其研究成果在生成模型和多模态学习领域受到了学术界和工业界的广泛认可。Pengchuan Zhang是Meta AI(原Facebook AI研究院)的人工智能研究科学家,曾在微软研究院担任高级研究科学家。他的研究领域主...……更多
商汤升级“日日新5.0”大模型,对标GPT-4Turbo
...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位,在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多
商汤科技sensetime推出“云端边”全栈大模型体系
...a5.0”性能超越GPT-4 Turbo:文理双修能力大幅提升,新增多模态交互自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TBtokens训练、覆盖大量合成数据,全新的“日日新SenseNova5.0”(以...……更多
Sora概念引爆A股!谁在布局AI视频
...技、会畅通讯、博汇科技等个股均涨停收盘。盘面上,多模态AI板块领涨A股,板块涨幅高达11.11%,板块内32只个股全部飘红,其中14只个股涨停;此外AIGC概念、Web3.0等板块同样涨幅居前。消息面上,近日,OpenAI推出了新的文生视...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
行业ETF风向标丨卷土重来纷纷大涨,文化传媒类ETF这“三驾马车”该怎么选?
...了!》继续发酵,今日,整个文化传媒板块集体大涨,在短剧的刺激下,影视行业走势最强,影视ETF领涨整个ETF市场,而另外细分领域游戏和传媒也是跟随大涨,两只规模较大的产品传媒ETF(512980)和游戏ETF(159869)半日成交均...……更多
AI视频新战场:字节对决快手、反击Sora
...早。2023年8月,该公司上线首个大语言模型“豆包”及多模态大模型BuboGPT。其抖音云雀大模型通过首批《生成式人工智能服务管理暂行办法》备案,面向公众开放;字节跳动基础模型发力语言和图像两种模态方向。而在AI应用层...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
... OpenAI o1 技术的深入分析累计点击量已超过 15 万。如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。在当前 AI 领域的快速发展中,「有效加速」和「超级对齐」已经成为两个主要的发展动向,...……更多
知乎盐言故事加速AI应用 与快手探索短剧新玩法
... Media(全媒介)。盐言故事还与快手达成合作,共同探索短剧领域“新玩法”,包括故事IP的短剧开发和版权库的开放。在文生图、文生视频、创作辅助等领域,盐言故事将探索人工智能大模型的应用革新。目前,大模型已经广...……更多
润建股份:公司曲尺平台开发的AI行业模型支持多模态 【润建股份:公司曲尺平台开发的AI行业模型支持多模态】财联社12月20日电,润建股份在互动平台表示,公司曲尺平台开发的AI行业模型支持多模态,多模态底座具备文生图...……更多
谷歌史上最强大模型!Gemini 2.0正式发布
...今为止功能最强的AI模型,带来了更强的性能、更多的多模态表现(如原生图像和音频输出)和新的原生工具应用。Gemini 2.0关键基准测试中相较于前代产品Gemini 1.5 Pro实现了性能的大幅提升,速度甚至达到了后者的两倍。支持图...……更多
...续发酵,在资本市场掀起了轩然大波,因其游戏+情景微短剧的设定,使得传媒短剧类公司站上了风口浪尖。”业内人士日前对记者说。前不久,国内首个聚焦微短剧的行业大会在杭州召开。会上透露,2022年全国微短剧市场规模...……更多
Sora为何没能诞生在中国?
...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步,包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多
AI相关板块集体延续回调,人工智能AIETF跌2.61%
...布盘古大模型5.0版本,标志着人工智能技术在全系列、多模态、强思维三个方面的全新升级。盘古模型赋予机器人前所未有的适应性和灵活性,无论是面对工业环境还是家庭生活场景,都能游刃有余。国信证券认为,2024年人工...……更多
马斯克说人类愿赌服输!OpenAI首个文生视频模型炸街,哪些行业又将颠覆
...分析师告诉澎湃新闻记者,OpenAI此次推出的Sora是OpenAI多模态能力在应用层面的又一个新高度,也是AI领域新的里程碑。从功能来看,能够用文字生成长达60秒的视频,意味着Sora可以极大程度地降低创意视频的制作门槛,解放生产...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...VAR指出是因为自回归模型逐个预测token的行为不符合图像模态的特点,提出“next-scale prediction”范式,将视觉自回归建模为逐个预测更大尺度scale的token map。这一方式避免了原始基于next-token的自回归方案难以建模图像模态的问题...……更多
...要求不高的一些长尾视频的制作也会有很好的补充,包括短剧里比较难模拟的环境,也可以用Sora低成本制作。”同时,Sora对算力拉动有一定的支持作用。Sora模型对视频的大量数据训练,如果参数量进一步提升,甚至达到像GPT4...……更多
AIGC只是工具升级,还是即将颠覆行业?上影节激辩AI
...在互动平台对投资者表示,公司计划用AI参与制作动画微短剧,以中国古典名著作为题材,生产一部可能长达千集的AI动画微短剧。上影节期间,上影集团举行了“全球AI电影马拉松大赛”颁奖典礼。这项在洛杉矶启动的赛事旨在...……更多
...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力,与此同时,在应用产品层面也实现了更卓越的多模态能力,支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展...……更多
周鸿祎参演!“AI+影视”,即将爆发?
...可以用简单的自然语言和人进行交互,再到声音图像整个模态的生成,最后在视频创作方面的能力突破,今年有可能是“AI+影视”爆发的时期。AI声音合成技术,不仅适用于影视配音,还可用于有声书制作、播客创作、广告配音...……更多
视频生成大模型sora和可灵的区别在哪里?
...评价可能过高。 相关研报指出,目前,国内大语言及多模态大模型正持续追赶海外主流大模型,模型能力逐步提升,带动下游应用发展。过去几个月,国内头部应用总访问量与海外头部应用总访问量差距逐渐缩小,看好未来国...……更多
开源社区参数量最大的文生视频模型来了,腾讯版Sora免费使用
...展现每一个动作的流畅过程。 语义遵从:业界首个以多模态大语言模型为文本编码器的视频生成模型,天然具备超高语义理解能力,在处理多主体及属性绑定等生成领域的难点挑战时表现出色。 原生镜头转换:多视角镜头切...……更多
更多关于科技的资讯:
促进民营经济高质量发展·超能量的“中小微”(十九)|乡村小厂造出“搬运神器”
11月12日,智捷智能科技香河有限公司工作人员在室外场地对智能搬运叉车进行调试。 河北日报记者 刘英摄11月12日,天津滨海新区一处海滩上
2025-11-29 07:31:00
厦门网讯(厦门日报记者 许舒昕)在注意力被算法切割的当下,一张纸质报纸竟在粉丝圈掀起抢购潮——从常规售价2元到二手平台单份22
2025-11-29 09:13:00
一、大数据视域下高校学生资助精准识别与分配的核心概念界定大数据技术是对数据进行加工、整理与计算的技术。其核心在于通过信息存储
2025-11-29 12:02:00
大数据技术在高校学生资助工作中发挥了重要保障作用。相对于传统资助模式存在的问题。大数据通过整合多源数据、构建评估模型,能够实现从被动申请到主动发现的转变
2025-11-29 12:20:00
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00