• 我的订阅
  • 头条热搜
平安产险在ICDAR2025国际多模态理解竞赛中强势夺冠,连续4年荣获国际顶尖赛事冠军!
...世界顶级赛事中,平安产险(参赛团队名称PA-VCG)在“多模态文档推理理解”这一高复杂度任务中,凭借领先的大模型技术体系与卓越的多模态理解能力,从全球众多顶尖科研机构与知名科技企业中脱颖而出,强势夺冠,连续4...……更多
超6亿!文心大模型日调用量半年增长10倍,AI成百度最强加速引擎
...力工具”,拥有智能PPT、智能文档、智能画本等上百项多模态AI功能。根据量子位智库数据,百度文库今年上半年网页端访问量超过2亿,位居国内第一。极光旗下月狐数据发布的《2024年智能PPT行业市场研究分析》则指出,百度...……更多
科学家研发自动驾驶新模块,让自动驾驶场景理解更接近人类认知
...一款名为 LVAFusion 的模块,旨在更高效、更准确地融合多模态信息。图 | 徐冬阳(来源:徐冬阳)自动驾驶在路上应该具备学习优秀人类驾驶员的能力,因为人类在面对多数场景的时候,可以迅速地定位在关键区域。为了提高端...……更多
AI“明星”选手巅峰对决!记者实测最新谷歌Gemini与GPT-4o
...模型能够实现无缝的文本、视频和音频输入,并生成相应模态的输出,真正意义上实现了多模态交互。紧随其后一天,年度Google I/O开发者大会如期而至,谷歌CEO Sundar Pichai宣布了一系列围绕其最新生成式AI模型Gemini的重大更新,...……更多
全球首个多模态地理科学大模型“坤元”发布:可据指令生成专业地理图表
...,中国科学院地理科学与资源研究所正式发布全球首个多模态地理科学大模型“坤元”。作为专为地理科学领域量身打造的专业语言大模型,“坤元”不仅精通地理学的精髓,更在“懂地理”、“精配图”、“知人心”、“智生...……更多
大模型“遍地”都是,谁能真正解放生产力?
...,其苦于人工标注久矣,不想再人工打标视频、图片等多模态信息。但市场现实情况是,供不应求:除了大厂以外,少有大模型团队具备多模态大模型开放能力。深耕于产业多年的考拉悠然,听到了太多客户关于大模型难以落地...……更多
通义千问发布新一代端到端旗舰模型Qwen2.5-Omni:看听说写样样精通
...快科技3月27日消息,阿里云宣布今天发布新一代端到端多模态旗舰模型Qwen2.5-Omni。该模型专为全方位多模态感知设计,能够无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音合成输...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
...、多场景文书生成、多环节辅助诊疗、多轮对话交互、多模态支持等六大方向的实际应用效能。结果显示,通用大模型在医学知识广度方面具有一定优势,医疗健康行业大模型在特定医疗任务上表现优异。以讯飞星火医疗大模型...……更多
阿里万相视频生成大模型重磅开源!消费级显卡也能运行
...。随着万相的开源,阿里云两大基模全部开源,实现了全模态、全尺寸大模型的开源。自2025年1月DeepSeek爆火以来,开源已经逐渐成为国内外大模型领域的“标配”。进入2月,字节豆包、昆仑万维、百度文心、阿里通义千问等纷...……更多
...出前10详情见下表: 三、机构观点① 游戏新品上线+AI多模态模型赋能,游戏板块或迎来业绩与估值双轮驱动开源证券认为,海外科技巨头基于AI多模态大模型的竞争日趋激烈,或驱动大模型多模态底层能力不断突破,叠加GPTs的...……更多
小度推出全球首个AI原生操作系统DuerOS X
...,用户用得越多,小度就会越懂用户。 在交互层,“多模态感知”技术的应用,让DuerOS X产⽣更丰富的感知⼒。无论用户是通过语音、文字、还是表情来与小度沟通,它都能准确地理解你的意图,并给出恰当的回应;“拟人化...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
智谱AI发布基座大模型GLM-4,发起大模型开源基金
...优秀开源开发者提供1000亿免费API tokens。GLM-4文生图和多模态理解得到增强。1月16日,在智谱AI(即北京智谱华章科技有限公司)首届技术开放日上,智谱AI发布新一代基座大模型GLM-4,支持128K的上下文窗口长度,单次提示词能处...……更多
AI更有感情色彩!星纪魅族宣布:深度接入阿里云全模态大模型Qwen2.5-Omni
...(COO)廖清红宣布,公司将深度接入阿里云首个端到端全模态大模型Qwen2.5-Omni,这一举措将显著提升星纪魅族产品的AI情感理解能力。通过此次合作,星纪魅族能够在复杂任务中提供更智能、更自然的反馈与决策,标志着公司在A...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...像与人类互动。由此,谷歌追随者高呼:“Gemini让原生多模态(即文本、声音、视频等模态)真正做到丝滑融合,发展原生多模态将成为未来主流路径!”视频发布不到一天,这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
AI潮起 共筑数智之基
...大会上,中国移动正式发布了由万卡级智算集群、千亿多模态大模型、汇聚百大要素的生态平台共同构成的“九天”人工智能基座,并开放三大人工智能基地,加快大模型产业化、规模化发展,为数字中国建设注入更加强劲动能...……更多
文档处理效能飙升!浩鲸科技“文档大模型”核心技术揭秘!
...的整体性方案,不仅包含了文档大模型能力,还提供了多模态文档工具链 DocChain 和开箱即用的软硬件一体机,基于垂直模型能力和软硬件相互配合,可帮助企业实现文档的知识抽取、知识融合,直至知识推理和问答的全流程覆...……更多
联汇科技发布最新智能体应用——第二代多模态智能体OmAgent
...工智能2.0技术在各个行业的深度应用。公司自研OmModel 多模态大模型、iBase向量数据库以及多模态自主智能体等创新产品,实现多模态场景下的技术创新。面向运营商、媒体、能源电力等行业,打造 MaaS & AaaS产品与服务,为行...……更多
OpenAI「草莓」两周内发布?网传不是多模态,反应慢了10多秒
...图片,这意味着「草莓」还不像 OpenAI 其他模型那样是多模态的。目前大家见到的大模型都是多模态的,这似乎是「草莓」一个明显缺点。大家比较关心的还有定价问题。「草莓」的定价可能与 OpenAI 的聊天机器人不同,后者有...……更多
调用量激增约30倍!文心大模型火了,李彦宏:AI应用将迎爆发期!
...界面上自由拖拽文档、音视频等富媒体素材,迅速生成多模态内容。再比如,法律智能体“法行宝”,已回答用户1660万个法律问题,不仅能像专业律师一样给出解答,还能计算法律赔偿金额、撰写法律文书,并推荐适配律师。...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
头部企业为何纷纷接入DeepSeek模型?现象级合作背后蕴藏发展新趋势→
...请求时,响应可能会延迟或中断。此外,像视频生成、多模态识别这类复杂的任务也会消耗大量计算资源,导致暂时性宕机。目前,DeepSeek、OpenAI等企业正致力于设计人工智能专用芯片。这些芯片通过优化架构与信号传输效率,...……更多
稚晖君时隔两年首更:会骑自行车的通用人形机器人来了 搭载多模态大模型
...该机器人搭载情感计算引擎。彭志辉称,灵犀X2搭载了多模态交互大模型“硅光动语”,因此它是第一台真正具备复杂交互能力的“灵动机器人”,具备毫秒级交互反应,以及通过视觉理解和认知世界的能力。 为“失眠”的稚...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
吉利星睿AI大模型正式发布 引领中国汽车进入全场景AI时代
...用的智能生态闭环。 星睿AI大模型包括语言大模型、多模态大模型、数字孪生大模型3大基础模型,并由此衍生出NLP语言大模型、NPDS研发大模型、多模态感知大模型、多模态生成大模型、AI DRIVE大模型、数字生命大模型6大能力模...……更多
多模态能力的进化,是AI眼镜成为生活必需品的关键
AI 浪潮下,多模态能力成为 AI 领域,特别是 AI 眼镜行业的高频热词。不少专家坚信,这项技术是突破单一交互局限的关键,有望重塑 AI 眼镜的使用体验。所谓多模态能力,即整合视觉、听觉、语言、触觉等多维度感官数据,...……更多
【2025数博会】阶跃星辰副总裁赵海涛:多模态是通向AGI的必经之路
...动产业跃迁”主题活动上,阶跃星辰副总裁赵海涛以“多模态是通向AGI的必经之路”为主旨,分享了阶跃星辰在多模态大模型方面的前沿探索,展示了未来人机交互与产业智能化的新范式。赵海涛强调,多模态是通往AGI的必经之...……更多
Mistral放大招!124B多模态巨无霸登场,免费版ChatGPT震撼突袭
...大招了!一连发布两大更新——Pixtral Large:前沿级124B多模态模型,用于驱动新Le Chat。全新Le Chat:具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供!Mistral的CEO兼联创Arthur Mensch宣布道:「此次发布是...……更多
更多关于科技的资讯:
关育兵近日,抖音博主“@爱吃蛋”凭借精确到秒的煮蛋教程,8天时间涨粉356万,被称为“蛋神”“煮蛋仙人”。最初,一名抖音用户分享“爸爸做出的完美水煮蛋”
2025-12-15 11:25:00
部分热门款式甚至卖断货 雪具市场迎“冬”风 国货订单激增
商报讯 随着入冬滑雪季的开启,多家雪场已经陆续“开板”迎客,滑雪装备市场也在悄然升温。国产雪具品牌凭借高性价比、差异化的设计及国潮元素融合等优势
2025-12-15 11:36:00
能源行业最大年度演讲在青岛举办 解码能源行业发展新趋势
12月10日至12日,“进化的能源·马一峰年度演讲2026”暨第21期综合能碳培训资源链接大会在青岛举行。作为能源行业最大的年度演讲和极具影响力的生态盛会
2025-12-15 11:55:00
厦门网讯(厦门日报记者 林露虹)厦门企业海辰储能聚焦长时储能,推出三大突破性的创新解决方案,以破解新能源消纳难题,满足AIDC(人工智能数据中心)能源转型需要
2025-12-15 08:58:00
“眼”观未来“镜”显风采 厦门眼镜产业发力新赛道
连续多年举办的厦门眼镜展。(厦门日报记者 王元晖 摄)艾普光学生产线。(资料图/厦门日报记者 林铭鸿 摄)嘉宾在厦门眼镜展上体验智能眼镜
2025-12-15 08:58:00
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知
AI搜索时代企业信息困局破解:智推互联以权威新闻,重塑品牌认知当AI成为信息分发的核心枢纽,企业却陷入前所未有的传播困境
2025-12-15 09:25:00
影视AI赛道再添强援 长江电影智象未来联合实验室挂牌 打开商业化想象空间
2025年12月11日,湖北长江电影集团与智象未来在武汉正式揭牌成立“长江电影智象未来影视AI联合实验室”,双方同步签订战略合作协议
2025-12-15 09:55:00
从古典中读懂未来:一位小提琴演奏者的“琴弓革命”
在不少人眼中,王辰翔的成长轨迹几乎是古典音乐领域的“标准答案”:四岁半拿起小提琴,少年时期便师从名家;先后进入中央音乐学院附小
2025-12-15 10:25:00
山东移动阳谷分公司助力酒店实现数字化升级
鲁网12月12日讯近日,山东移动阳谷分公司为汉庭酒店西汉庄店量身打造一体化通信解决方案,全面赋能酒店数字化转型升级。通过精准对接酒店在网络带宽
2025-12-15 09:49:00
每集2分钟、一共28集,短剧《昭世录》在美国、英国、泰国等地的短视频平台上线后爆火,海外播放量近2亿。这部短剧由位于嘉兴经开区的嘉兴九州文化传媒有限公司出品
2025-12-15 07:32:00
12月11日,金华市蓝海光电技术有限公司激光雷达事业部总经理刘崇求向记者展示了一款新型机器人导航激光雷达。该雷达除了能360度平面扫描探测
2025-12-15 07:32:00
12月14日,首届全国独角兽企业大赛总决赛在宁波高新区收官。本次总决赛由工业和信息化部火炬高技术产业开发中心、中国电子学会
2025-12-15 07:32:00
12月12日下午,“2025浙江省新消费创新大赛资源对接活动”在杭州余杭未来科技城举办。活动以“潮起新消费 智汇浙未来”为主题
2025-12-15 07:32:00
“亲,这个问题难倒我了”“对不起,我理解不了您的意思”……这些出自AI客服的经典“名言”你熟悉吗?你是不是也被AI客服“逼疯”过呢?随着年终消费季的到来
2025-12-15 07:50:00
杭州故事,叩开世界的“心门”
在中国美术学院举办的“黑神话:悟空”艺术展。记者 步恩撒 摄踏上取经路,比抵达灵山更重要——黑神话:悟空。来西游神话当一回“天命人”
2025-12-15 08:03:00