模态,模型,文心,模型,哪吒,模态头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠，连

...世界顶级赛事中，平安产险（参赛团队名称PA-VCG）在“多模态文档推理理解”这一高复杂度任务中，凭借领先的大模型技术体系与卓越的多模态理解能力，从全球众多顶尖科研机构与知名科技企业中脱颖而出，强势夺冠，连续4...……更多

2025-06-17 17:47:00模态,产险,国际,平安,顶尖,赛事

超6亿！文心大模型日调用量半年增长10倍，AI成百度最强加速

...力工具”，拥有智能PPT、智能文档、智能画本等上百项多模态AI功能。根据量子位智库数据，百度文库今年上半年网页端访问量超过2亿，位居国内第一。极光旗下月狐数据发布的《2024年智能PPT行业市场研究分析》则指出，百度...……更多

2024-08-24 09:36:00文心,模型,半年,增长,引擎,模型

科学家研发自动驾驶新模块，让自动驾驶场景理解更接近人类认知

...一款名为 LVAFusion 的模块，旨在更高效、更准确地融合多模态信息。图 | 徐冬阳（来源：徐冬阳）自动驾驶在路上应该具备学习优秀人类驾驶员的能力，因为人类在面对多数场景的时候，可以迅速地定位在关键区域。为了提高端...……更多

2024-04-11 10:53:00驾驶,认知,科学家,模块,场景,人类

AI“明星”选手巅峰对决！记者实测最新谷歌Gemini与GP

...模型能够实现无缝的文本、视频和音频输入，并生成相应模态的输出，真正意义上实现了多模态交互。紧随其后一天，年度Google I/O开发者大会如期而至，谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新，...……更多

2024-05-17 14:26:00实测,巅峰,选手,记者,明星,模型

全球首个多模态地理科学大模型“坤元”发布：可据指令生成专业地

...，中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型，“坤元”不仅精通地理学的精髓，更在“懂地理”、“精配图”、“知人心”、“智生...……更多

2024-09-19 19:53:00坤元,地理,模态,图表,指令,生成

大模型“遍地”都是，谁能真正解放生产力？

...，其苦于人工标注久矣，不想再人工打标视频、图片等多模态信息。但市场现实情况是，供不应求：除了大厂以外，少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然，听到了太多客户关于大模型难以落地...……更多

2023-11-30 14:50:00生产力,模型,解放,生产,模型,考拉

通义千问发布新一代端到端旗舰模型Qwen2.5-Omni：看

...快科技3月27日消息，阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输...……更多

2025-03-27 08:34:00通义,旗舰,新一代,模型,模态,文本

刚刚，我们感受了一波最「像人」的国产AI，模型还是开源的

...择了两条路线分别开拓：一条是 GPT-4o 所代表的端到端多模态大模型的探索，一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上，OpenAI 跨文本、视觉和音频端到端地训练了一个新模型，所有输入和输出都由同一神经...……更多

2024-10-26 09:49:00一波,模型,国产,还是,语音,模型

中国信通院开展医疗健康大模型效能评估工作

...、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。结果显示，通用大模型在医学知识广度方面具有一定优势，医疗健康行业大模型在特定医疗任务上表现优异。以讯飞星火医疗大模型...……更多

2024-10-10 20:28:00信通,效能,中国,模型,评估,医疗

阿里万相视频生成大模型重磅开源！消费级显卡也能运行

...。随着万相的开源，阿里云两大基模全部开源，实现了全模态、全尺寸大模型的开源。自2025年1月DeepSeek爆火以来，开源已经逐渐成为国内外大模型领域的“标配”。进入2月，字节豆包、昆仑万维、百度文心、阿里通义千问等纷...……更多

2025-02-26 00:34:00阿里,重磅,显卡,生成,模型,运行

ETF基金日报丨动漫游戏相关ETF领涨，机构认为游戏新品上线

...出前10详情见下表: 三、机构观点① 游戏新品上线＋AI多模态模型赋能，游戏板块或迎来业绩与估值双轮驱动开源证券认为，海外科技巨头基于AI多模态大模型的竞争日趋激烈，或驱动大模型多模态底层能力不断突破，叠加GPTs的...……更多

2023-12-12 11:09:00双轮,模态,估值,动漫游戏,板块,模型

小度推出全球首个AI原生操作系统DuerOS X

...，用户用得越多，小度就会越懂用户。在交互层，“多模态感知”技术的应用，让DuerOS X产⽣更丰富的感知⼒。无论用户是通过语音、文字、还是表情来与小度沟通，它都能准确地理解你的意图，并给出恰当的回应；“拟人化...……更多

2024-04-17 13:47:00全球,系统,智能,李莹,模型,应用

空间智能版ImageNet来了！李飞飞吴佳俊团队出品

...来自斯坦福李飞飞吴佳俊团队！HourVideo，一个用于评估多模态模型对长达一小时视频理解能力的基准数据集，包含多种任务。通过与现有模型对比，揭示当前模型在长视频理解上与人类水平的差距。2009年，李飞飞团队在CVPR上首...……更多

2024-11-11 13:31:00团队,智能,空间,视频,模态,模型

智谱AI发布基座大模型GLM-4，发起大模型开源基金

...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日，在智谱AI（即北京智谱华章科技有限公司）首届技术开放日上，智谱AI发布新一代基座大模型GLM-4，支持128K的上下文窗口长度，单次提示词能处...……更多

2024-01-17 16:47:00模型,基座,基金,模型,文生,模态

AI更有感情色彩！星纪魅族宣布：深度接入阿里云全模态大模型Q

...（COO）廖清红宣布，公司将深度接入阿里云首个端到端全模态大模型Qwen2.5-Omni，这一举措将显著提升星纪魅族产品的AI情感理解能力。通过此次合作，星纪魅族能够在复杂任务中提供更智能、更自然的反馈与决策，标志着公司在A...……更多

2025-03-27 18:35:00星纪,模态,阿里,接入,深度,模型

AI界新晋王者被曝抄袭、作弊、做假，脸都丢光了

...像与人类互动。由此，谷歌追随者高呼：“Gemini让原生多模态（即文本、声音、视频等模态）真正做到丝滑融合，发展原生多模态将成为未来主流路径！”视频发布不到一天，这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多

2023-12-20 00:10:00王者,抄袭,模型,万物,公司,数据

阿里CEO吴泳铭：生成式AI让世界有了一个统一的语言——To

...为了AI发展的最大障碍。当前的数字化世界，信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立，彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多

2024-09-20 09:51:00阿里,生成,统一,语言,世界,模态

AI潮起共筑数智之基

...大会上，中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座，并开放三大人工智能基地，加快大模型产业化、规模化发展，为数字中国建设注入更加强劲动能...……更多

2024-05-25 07:21:00潮起,模型,中国,中国移动,移动,模态

文档处理效能飙升！浩鲸科技“文档大模型”核心技术揭秘！

...的整体性方案，不仅包含了文档大模型能力，还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机，基于垂直模型能力和软硬件相互配合，可帮助企业实现文档的知识抽取、知识融合，直至知识推理和问答的全流程覆...……更多

2024-09-26 13:36:00文档,效能,模型,核心,处理,技术

联汇科技发布最新智能体应用——第二代多模态智能体OmAgen

...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品，实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业，打造 MaaS & AaaS产品与服务，为行...……更多

2024-07-18 14:51:00联汇,二代,模态,智能,应用,科技

OpenAI「草莓」两周内发布？网传不是多模态，反应慢了10

...图片，这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的，这似乎是「草莓」一个明显缺点。大家比较关心的还有定价问题。「草莓」的定价可能与 OpenAI 的聊天机器人不同，后者有...……更多

2024-09-12 09:46:00模态,草莓,反应,草莓,模型,问题

调用量激增约30倍！文心大模型火了，李彦宏：AI应用将迎爆发

...界面上自由拖拽文档、音视频等富媒体素材，迅速生成多模态内容。再比如，法律智能体“法行宝”，已回答用户1660万个法律问题，不仅能像专业律师一样给出解答，还能计算法律赔偿金额、撰写法律文书，并推荐适配律师。...……更多

2024-11-13 14:10:00李彦,文心,模型,应用,智能,应用

迎战GPT-4V！谷歌PaLI-3视觉语言模型问世，更小、更

...像与语音识别能力。本月初，微软更是公布了 166 页的多模态版 GPT-4V 的相关文档，详细探讨了 GPT-4V 的功能和使用情况，这一举动引起了业界的广泛关注。然而，在视觉语言模型的角逐中，谷歌也不甘示弱。近日，Google Research...……更多

2023-10-17 16:31:00更快,模型,视觉,语言,训练,模型

头部企业为何纷纷接入DeepSeek模型？现象级合作背后蕴藏

...请求时，响应可能会延迟或中断。此外，像视频生成、多模态识别这类复杂的任务也会消耗大量计算资源，导致暂时性宕机。目前，DeepSeek、OpenAI等企业正致力于设计人工智能专用芯片。这些芯片通过优化架构与信号传输效率，...……更多

2025-02-26 12:40:00头部,接入,模型,背后,现象,趋势

稚晖君时隔两年首更：会骑自行车的通用人形机器人来了搭载多模

...该机器人搭载情感计算引擎。彭志辉称，灵犀X2搭载了多模态交互大模型“硅光动语”，因此它是第一台真正具备复杂交互能力的“灵动机器人”，具备毫秒级交互反应，以及通过视觉理解和认知世界的能力。为“失眠”的稚...……更多

2025-03-11 10:05:00模态,人形,机器人,模型,自行车,机器

趣丸科技副总裁兼CTO谢睿：多模态智能激发应用新场景 | 新

...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》，借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果，以及赋能智能音频和数字安全方面的一些思考。首先，请允许我简...……更多

2024-05-24 22:22:00模态,生产力,副总,场景,大会,智能

吉利星睿AI大模型正式发布引领中国汽车进入全场景AI时代

...用的智能生态闭环。星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型，并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多

2024-01-11 11:18:00吉利,中国,模型,场景,时代,汽车

多模态能力的进化，是AI眼镜成为生活必需品的关键

AI 浪潮下，多模态能力成为 AI 领域，特别是 AI 眼镜行业的高频热词。不少专家坚信，这项技术是突破单一交互局限的关键，有望重塑 AI 眼镜的使用体验。所谓多模态能力，即整合视觉、听觉、语言、触觉等多维度感官数据，...……更多

2025-04-08 17:49:00模态,生活必需品,必需品,进化,眼镜,关键

【2025数博会】阶跃星辰副总裁赵海涛：多模态是通向AGI的

...动产业跃迁”主题活动上，阶跃星辰副总裁赵海涛以“多模态是通向AGI的必经之路”为主旨，分享了阶跃星辰在多模态大模型方面的前沿探索，展示了未来人机交互与产业智能化的新范式。赵海涛强调，多模态是通往AGI的必经之...……更多

2025-08-31 15:51:00模态,之路,海涛,必经,副总,星辰

Mistral放大招！124B多模态巨无霸登场，免费版Cha

...大招了！一连发布两大更新——Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是...……更多

2024-11-20 09:43:00巨无霸,免费版,模态,突袭,模型,生成