模态,生成,模型,模态,模型,生成头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

...Meta最近开源了多个AI项目，包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等，提升了AI在图像处理和语音识别领域的能力，进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多

2024-11-28 12:02:00一文,大礼包,大礼,安全性,语音,图像

商汤科技发布日日新5.0大模型

...提供坚实基础。本次“日日新5.0”另一大核心指标就是多模态能力，与此同时，在应用产品层面也实现了更卓越的多模态能力，支持高清长图的解析和理解以及文生图交互式生成，还可以实现复杂的跨文档知识抽取及总结问答展...……更多

2024-04-29 04:36:00商汤,模型,科技,商汤,能力,模型

豆包“王炸”：字节跳动一天发布两款视频生成大模型

...同声传译模型，已全面覆盖语言、语音、图像、视频等全模态，全方位满足不同行业和领域的业务场景需求。在产品能力日益完善的同时，豆包大模型的使用量也在极速增长。据火山引擎披露，截至9月，豆包语言模型的日均token...……更多

2024-09-24 18:15:00豆包,字节,生成,模型,视频,豆包

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

喜马拉雅音频大模型亮相，AI赋能内容创作者

...展示AI时代云上创新的潮流科技。喜马拉雅珠峰AI音频多模态大模型亮相云栖大会，在“人工智能+”主题馆吸引众多市民驻足围观体验。AI（人工智能）已经在深刻影响着我们的生活，也影响和改变着内容创作行业。作为在线音...……更多

2024-09-21 09:50:00喜马拉雅,创作者,模型,创作,音频,内容

阿里云重磅升级全栈AI体系，一文看懂云栖大会技术发布

...模型智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。2025云栖大会，阿里云CTO周靖人发布多项重磅技术更新在大语言模型中，阿里通义旗舰模型Qwen3-Max全新亮相，性能超过GPT5、Claude Opus 4等，跻身全...……更多

2025-09-24 13:30:00一文,阿里,重磅,体系,大会,升级

昆仑万维SkyReels团队正式发布并开源SkyReels-

...fusion-forcing)框架的无限时长电影生成模型，其通过结合多模态大语言模型(MLLM)、多阶段预训练(Multi-stage Pretraining)、强化学习(Reinforcement Learning)和扩散强迫(Diffusion-forcing)框架来实现协同优化。回顾过去……更多

2025-04-21 13:53:00万维,昆仑,团队,生成,视频,模型

中国首个音乐SOTA模型「天工音乐大模型」今日公测

...赋予「天工3.0」超强的性能表现。在MMBench等多项权威多模态测评结果中，「天工3.0」超越GPT-4V，全球领先。（天工3.0多模态性能超越GPT-4V，全球领先）同时，「天工3.0」旗下的「天工SkyMusic」音乐大模型也在今日面向全社会开...……更多

2024-04-17 15:31:00天工,公测,模型,音乐,中国,天工

群核科技（酷家乐）陈卓：用多模态AI助理赋能设计产业，用合成

...3D空间领域生成式AI引擎，包括底层的超级算力中心、多模态的海量产业数据，以及自研空间AIGC大模型。在这个引擎之上，已经开始生长出丰富的，服务于不同场景和需求的AI应用，它们正在解决每个应用场景中的个性化问题。...……更多

2024-05-28 09:06:00家乐,模态,生产力,助理,大会,产业

马斯克 xAI 展示首个多模态模型 Grok-1.5V

...下旬推出 Grok-1.5 大语言模型之后，近日再次推出首个多模态模型 Grok-1.5 Vision。xAI 表示将于近期邀请早期测试者和现有的 Grok 用户测试 Grok-1.5 Vision（Grok-1.5V），不仅能理解文本，还能处理文档、图表、截图和照片中的内容。xAI ...……更多

2024-04-13 16:20:00马斯,马斯克,模态,模型,模态,模型

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...金融、数据分析等场景落地提供基础。“日日新5.0”的多模态能力在多模态大模型权威综合基准测试MMBench中综合得分排名首位，在多模态榜单MathVista、AI2D、ChartQA、TextVQA、DocVQA、MMMU中取得领先成绩。“日日新5.0”支持高清长图...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

华中科技大学白翔教授发布多模态大模型

...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”，对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注：多模态大模型是一类可...……更多

2023-12-15 01:14:00华中科技大学,华中,模态,模型,教授,大学

生成式人工智能新时代

...？张亚林介绍，文本、音频、图像、视频、游戏生成，跨模态、多模态的生成，虚拟人的生成等，都可以通过各种素材的生成进行互换，这对我们周围的传统媒体带来巨大冲击。怎样支撑生成式AI大模型的发展？张亚林说，我们...……更多

2023-12-22 00:26:00人工智能,新时代,人工,生成,智能,庆阳

突破视频多模态大模型瓶颈！「合成数据」立大功，项目已开源

... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型（LMMs）的发展受限于从网络获取大量高质量视频数据。为解决这一问题，我们提出了一种替代方法，创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多

2024-10-22 09:54:00模态,大功,瓶颈,模型,突破,项目

Sora为何没能诞生在中国？

...种物理现象。OpenAI一定会在文本、图像、音频、视频等多模态领域发展。视频是发展多模态最重要的一步，包含了世界运转的基本规律。”Sora生成的视频效果仍令刘子纬感到震撼。刘子纬3年前便开始研究AI视频生成。相较文字...……更多

2024-03-19 05:31:00中国,模型,生成,视频,文生,中国

视觉理解、3D生成，豆包这次又玩出了什么新花样？

...做呢，月之暗面Kimi发布视觉思考模型k1；腾讯微信推出多模态大模型POINTS1.5；巨人网络发布千影有声游戏生成大模型，还有不胜枚举的初创公司带着自家模型的新进展试图刷个脸熟。所以呢，豆包又又又更新了。（图源：雷科技...……更多

2024-12-18 22:49:00豆包,花样,生成,视觉,模型,豆包

全面叫板OpenAI！谷歌发布多模态大模型全家桶：从AI助手

...先一天后，科技巨头谷歌不甘示弱，推出了自己的最新多模态AI（人工智能）产品。当地时间5月14日，在谷歌I/O开发者大会上的主题演讲中，谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo，...……更多

2024-05-15 09:54:00文生,模型,模态,全家,助手,视频

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准，发现现有的多模态模型和 LLM 都表现存在系统性缺陷，同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中，这篇论文获得杰出论文奖。论...……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

每日与世界30亿次交互！这家AI独角兽企业发布视频、音乐生成

...字交互只是很小的一部分，更多的是语音和视频交互。多模态的内容，比如声音、图文和视频，已经成为信息传递的主流。为了能够提高渗透率，多模态是必经之路。”闫俊杰透露，目前video-01只提供了文生视频，在未来产品会...……更多

2024-09-04 13:45:00独角兽,生成,模型,世界,企业,视频

智源研究院发布FlagEval“百模”评测结果

...年下半年大模型发展更聚焦综合能力提升与实际应用。多模态模型发展迅速，涌现了不少新的厂商与新模型，语言模型发展相对放缓。模型开源生态中，除了持续坚定开源的海内外机构，还出现了新的开源贡献者。语言模型，针...……更多

2024-12-20 11:22:00评测结果,研究院,评测,结果,研究,模型

中国企业调用大模型日均超10万亿Tokens，阿里通义份额第

...模型”，转向“为特定业务场景寻求最优解”，对不同的模态、尺寸和落地场景匹配的需求将进一步爆发。开源模型成为大模型企业级市场新一轮增长的关键驱动力。沙利文报告认为，随着千问Qwen、DeepSeek等国产模型在2025年持...……更多

2025-09-01 13:55:00通义,阿里,中国,份额,模型,中国企业

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...究团队及其合作者旨在为足球视频理解开发一个全面的多模态框架。具体来说，他们做出了以下贡献：（1）他们提出了 SoccerReplay-1988，这是迄今为止最大的多模态足球数据集，其中包括来自 1988 场完整比赛的视频和详细注释，...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

从空间智能到具身智能，跨维践行Sim2Real AI最高效路

...使用双眼感知世界一样，具身智能要求机器人能够通过多模态传感器进行感知、交互和决策，形成综合的空间认知和操作能力。问：空间智能与具身智能的异同点是什么？贾奎：就像前面提到的，空间智能赋予 AI 感知并理解现...……更多

2024-07-23 09:40:00智能,路径,空间,智能,机器人,机器

【2025数博会】“月球科学多模态专业大模型V2.0”正式发

...行业大模型成果发布暨供需对接活动”上，“月球科学多模态专业大模型V2.0”正式发布，并将全面赋能“数字月球云平台”，加速月球科研与工程应用智慧化进程。“月球科学多模态专业大模型V2.0”发布现场。本次发布的V2.0版...……更多

2025-08-30 04:58:00月球,模态,模型,数字,科学,专业

多模态AI午前大涨，游戏ETF半日涨幅近4%

今日午前，多模态AI题材午前崛起，Sora方向领涨，其中，游戏ETF（516010）和游戏ETF（159869）半日涨幅分别达到3.95%和3.93%，领涨整个ETF市场。投资逻辑方面，日前，谷歌发布了基础世界模型Genie，Genie是一个110亿参数的基础世界模...……更多

2024-03-16 23:35:00模态,涨幅,指数,影视,上市公司,动漫游戏

“图片生成领域的DeepSeek”！智象未来图像生成大模型全

...中国科大校友梅涛等人创办，目前已成长为全球领先的多模态生成式人工智能创新企业。公司自主研发的生成式视觉多模态大模型，是超百亿级别的大模型，具备强大的视觉内容生成与理解能力。其模型生成视频内容关联性强、...……更多

2025-04-17 10:54:00生成,模型,图像,领域,权威,全球

谷歌发博文介绍vloggerai模型可让人物“动起来”

...表情地朗读音频内容。VLOGGERAI是一种适用于虚拟肖像的多模态Diffusion模型，使用MENTOR数据库进行训练，该数据库中包含超过80万名人物肖像，以及累计超过2200小时的影片，从而让VLOGGER生成不同种族、不同年龄、不同穿着、不同...……更多

2024-03-20 02:21:00模型,人物,肖像,影片,模态,人脸

贵州大数据企业为130万家用户提供AI营销方案

...能体，是一枝梅与成都任我行软件股份公司共同开发的多模态大模型应用。“依托于完全自研、有自主知识产权的Drawing多模态大模型，一个管家婆智能体相当于为企业提供3位精通文秘、美工、视频的新媒体营销‘数字员工’，...……更多

2025-07-24 21:38:00万家,贵州,方案,营销,数据,用户

联通元景大模型亮相2024年中国品牌日打造产业智能化新范式

...供互联网实时资讯问答以及更好的数学计算等服务。在多模态大模型的视觉能力方面,工作人员分别提供了不同场景的视频和图片,“元景看见”迅速对视频、图像画面进行实时识别理解,并以文字描述方式呈现出来。除通用视觉能...……更多

2024-05-13 15:00:00范式,中国,模型,智能,产业,品牌

中文大模型最新评测出炉：腾讯混元国内第一！

快科技8月5日消息，在最新发布的中文多模态大模型SuperCLUE-V基准评测中，腾讯混元大模型获国内排名第一，稳居卓越领导者象限。此次评测聚焦于大模型理解复杂现实世界的关键能力，即多模态理解，俗称“图生文”。多模态...……更多

2024-08-05 08:07:00腾讯,中文,模型,评测,模型,模态

page 5/1000 首页上一页 1 2 3 456 7 8 9 10 下一页末页

更多关于科技的资讯：

“数字之城”杭州如何驶入文旅发展新赛道？

中新网杭州12月18日电(曹丹)近日，《AI涌现——2025杭州数字文旅产业发展年度报告》在浙江杭州发布。报告显示，该市数字文旅骨干企业2025年前三季度营收同比增长10

2025-12-19 08:24:00

天立教育与腾讯教育达成战略合作，携手推动K12教育智能化升级

2025年12月16日，天立教育与腾讯教育达成战略合作。双方将深度融合腾讯的前沿AI技术能力，与天立启鸣在K12教育领域积累的教学经验与实践场景

2025-12-19 08:26:00

特步签约全运会冠军刘景扬，从耐力赛道到速度赛场的战略延伸

12月18日，中国领先体育用品品牌特步正式宣布第十五届全运会女子100米栏冠军刘景扬成为特步体育代言人。此次合作不仅是特步运动资源矩阵的拓展

2025-12-19 08:26:00

西交利物浦大学启用沉浸式球幕影院，MEGA创意媒体盛典与国际

12月18日，西交利物浦大学影视与创意科技学院揭幕沉浸式球幕影院，并举办第五届MEGA国际创意媒体盛典，同时宣布国际沉浸媒体联盟正式成立

2025-12-19 08:26:00

协同作战、共创大美食材节，良之隆集团328百天倒计时动员会举

12月18日，是良之隆・2026第十四届中国食材电商节的倒计时100天。在此之际，良之隆集团举办了3·28百天倒计时动员会

2025-12-19 08:26:00

东湖评论：社科+AI，马克思主义理论学科大有可为

马克思曾指出：“生产力是社会发展的最终决定力量。”AI作为第四次工业革命的重要推动力量，正用数据、算法和算力重构生产力的模样

2025-12-19 10:56:00

虚拟数字人“国标”让智能服务迈上新台阶

我国虚拟数字人领域首个国家标准《信息技术客服型虚拟数字人通用技术要求》近日正式发布。该标准的出台填补了行业技术规范的空白

2025-12-19 12:14:00

烟草证变“信用凭证”！建行上饶分行“善营贷”为商户注入经营活

“有烟草证就能办纯信用贷款，50万元额度随借随还，这下旺季订烟的资金缺口彻底补上了！”上饶市余干县一家超市负责人李先生

2025-12-19 12:14:00

无锡移动以用户体验重塑服务价值

在数字经济与日常生活深度融合的今天，优质的服务体验已成为衡量企业核心竞争力的重要标尺。中国移动通信集团江苏有限公司无锡分公司（下称“无锡移动”）再次荣获国家级“用户满意服务”认证

2025-12-19 13:15:00

米连科技布局多元社交矩阵，满足不同情感连接场景

当提及线上社交平台时，许多人脑海中首先浮现的仍是“婚恋”或“约会”的单一标签。然而，米连科技通过其创新实践，正在系统性地打破这一固有印象

2025-12-19 13:58:00

之江实验室021科学基础模型开发迈出重要一步为科研培养智慧

浙江日报杭州12月18日讯（记者何冬健通讯员肖乐）记者18日从之江实验室举办的021科学基础模型创新合作大会上获悉

2025-12-19 08:54:00

聚焦“共享用工”与“数字人” 填补产业管理空白高新区（滨江

在共享经济与人工智能技术加速融合、新就业形态不断涌现的当下，如何规范发展、保障权益、激发创新活力成为关键。近日，由杭州高新区（滨江）市场监督管理局牵头起草的两项团体标准——《共享

2025-12-19 06:51:00

小镇工厂在拼多多掀起产业浪潮︓宠物经济如何催生﹃猫窝革命﹄?

本报记者程宬3000元本金、一张百货柜台、十来个工人，这是彭广杰2020年春天的全部家底；三年半后，他的PAOFU宠物用品旗舰店在拼多多日出5000单

2025-12-19 07:18:00

具身智能加速融入千行百业

在工厂轻松搬运物料、在医院为患者做预诊、在赛场上竞速奔跑……2025年即将收官，“具身智能”以高票入选年度十大流行语榜单第二名

2025-12-19 07:18:00

南京企业青睐创新联合体

出门问问打造的AIGC产品服务用户数已超1500万、江苏奥赛康研制的新型抗感染药物加速攻关……时至今日，在南京，一个个令人瞩目的成果背后

2025-12-19 07:18:00

头条订阅服务