• 我的订阅
  • 头条热搜
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
文本、图像、点云任意模态输入,AI能够一键生成高质量CAD模型了
...同完成,是全球首个同时支持文本描述、图像、点云等多模态输入的计算机辅助设计(CAD)生成大模型。计算机辅助设计(Computer-Aided Design,简称 CAD)软件是工业软件的重要分支,也是工业设计流程中的核心工具。然而,目前...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
拓斯达新一代X5机器人控制平台如何突破具身智能的“小脑”瓶颈?
...策,并向控制模块发出指令。该环节以中央计算单元与多模态决策算法为核心。【小脑】负责运动控制、感知外界状态,在大脑的策略下实现机器人动作的执行和反馈。控制:将决策指令转化为实际操作,实现与物理世界的互动...……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
...到2035年有望达3.5万亿元●当前AI正在“大暴走”,将从单模态大模型时代进入多模态大模型新时代。这将大幅提升大模型对视觉、图像的重视,并为机器提供理解世界的“大脑”,具身智能也将随之诞生。具身智能有可能最先落...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...AI 领域的一家,从去年至今,从星辰语义大模型到星辰多模态大模型和星辰语音识别大模型,中国电信旗下大模型始终保持着快速迭代,且完成了语义、语音、视觉、多模态的全模态大模型布局。7月5日,中电信人工智能科技有...……更多
...面,通过软硬件、云模型、端模型协同优化,实现座舱全模态主动理解、全舱位车内场景感知、多视角车外场景感知以及弱网、高信息负荷场景等全工况安心可用;在组织服务方面,通过生成式场景引擎,围绕用户需求与场景进...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
探访数字人公司世优科技:AI数字人“情智兼备”的创新之旅
...拿下虎啸奖元宇宙营销类金奖,6月发布新一代AI数字人多模态交互系统“世优波塔”、7月深度参与2024全球数字经济大会成为“北京市通用人工智能产业创新伙伴计划”第三批成员并登录央视新闻联播……今年,世优科技再次因为...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
苹果大模型,不藏了
...模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...题。此外还有一个更加实际问题是,与现有的 GPT-4 等多模态模型相比,据称「草莓」仍然缺乏多模态处理能力,这也意味着它在处理图像、视频等复杂数据时可能面临局限性。 还有价格。首先要说明的是,在官方还未发布甚至...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
全自动组装家具! 斯坦福发布IKEA Video Manuals数据集:首次实现「组装指令」真实场景4D对齐
...主组装IKEA家具,或者通过AI驱动的AR眼镜。」突破性的多模态对齐组装一件IKEA家具需要理解多种形式的指令:说明书提供了任务的整体分解和关键步骤;视频展示了详细的组装过程;而3D模型则定义了部件之间的精确空间关系。I...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
2024产学研融通创新活动:AI应用落地是重点
...,以及大模型小模型怎么互通也是大家关注的重点,突破模态瓶颈,增加视频、音频的多模态通用模型是后续突破的重点。当前基础模型发展收敛,行业模型落地成为新起点,未来模型发展仍遵循规模定律,关键在于解决“最后...……更多
谷歌发布Gemini,机构看好多模态AI应用商业变现前景,软件ETF(159852)年内份额增长近1.5倍丨ETF观察
近日,多模态AI概念持续活跃。谷歌等科技公司也纷纷推出了新的多模态AI产品,大模型多模态化有望成为AI领域的热门趋势。综合多家机构观点,AI多模态模型的不断突破和加速落地,有望进一步打开AI应用商业化空间。截至12...……更多
WPS AI以“慢”制胜 金山办公36年技术积淀助力飞跃发展
...会上,熊龙飞展示了WPS AI专业应用领域的最新成果,如跨模态技术、高度可复用的引擎系统等方面的突破。这些技术成果不仅提升了文档处理的效率和准确性,更为用户带来了全新的智慧办公体验。在多模态技术在文档处理中的...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
更多关于科技的资讯:
理想智驾负责人郎咸朋:李想对我发过一次火 智驾做不到头部就不用干了
快科技12月26日消息,理想汽车今日晚间举办“2024理想AI Talk”。主持人问道,听说李想对智驾团队曾发了很大的火
2024-12-26 20:37:00
帧率提升200%!AMD RX 7900 XT挑战5款FSR 3.0大作
一、前言:蓝宝石RX 7900 XT极地挑战5款FSR 3游戏今年最火的游戏当属《黑神话:悟空》无疑,它也可能是目前为止最为消耗显卡资源的3A大作
2024-12-26 20:37:00
赵孝国:立足品质,餐饮行业需要一次“重塑”
12月26日,2024山东餐饮零售业品牌影响力巡礼活动成功举办。来自餐饮界的大咖、精英对话交流,为从业者提供发展新思路
2024-12-26 20:38:00
餐饮行业如何平稳穿越行业周期?行业大咖们这样说!
12月26日,“2024山东餐饮零售业品牌影响力巡礼”表彰大会在济南舜耕山庄隆重举办。此次大会汇聚了众多餐饮零售行业的精英大咖
2024-12-26 20:41:00
贵阳第二家学习“胖东来”模式 永辉超市新世界花园店12月27日开业
多彩贵州网讯(本网记者 文彬 陈仕发) 历时31天闭店调改,永辉超市贵阳新世界花园店将于12月27日9:00重新开业。作为贵阳第二家学习 胖东来模式调改开业的门店
2024-12-26 20:47:00
小米平板7即将在印度发布 主打生产力 国行早已开售
【CNMO科技消息】近日,小米正式宣布,其最新平板——小米平板7即将登陆印度市场。根据亚马逊的预热页面显示,这款平板的印度发布会将于2025年1月10日举行
2024-12-26 20:54:00
真我14 Pro+曝光 1.5K等深四微曲屏+潜望长焦稳了
【CNMO科技消息】前不久发布的真我Neo7新品,可以说是凭借着7000mAh的泰坦电池、天玑9300+、IP69+IP68满级防水以及首销2099元起的价格杀疯了
2024-12-26 20:55:00
苹果 iOS 19兼容性曝光:最低门槛提升至A12芯片
【CNMO科技消息】根据外媒透露,苹果公司下一代操作系统更新的设备兼容性情报已提前外泄。所有当前能够运行iOS18的iPhone型号预计也将继续获得iOS19的支持
2024-12-26 20:55:00
华为Mate X6销量超越Mate70 Pro?果然强得飞起
【CNMO科技消息】现在距离华为Mate品牌盛典过去也有将近一个月时间了,包括此前上市的Mate70系列和MateX6依旧是一机难求的状态
2024-12-26 20:55:00
曝OPPO或首发新款天玑次旗舰芯片 两大子品牌Q2发力
【CNMO科技消息】今年10月24日,OPPO发布了OPPOFindX8及OPPOFindX8Pro,全球首批搭载联发科天玑9400芯片
2024-12-26 20:55:00
采访商佑安:做品牌是远程攻击,不要总想着肉搏
第一次见观速咨询商佑安老师是在11月底,是在9月底,在新加坡举办的“以品牌为中心的第二次增长”为主题的营销会上,来的嘉宾很多传统企业和新加坡快餐连锁行业的CEO
2024-12-26 20:55:00
一加Ace 5系列详细参数汇总:全面升级 或2399元起
【CNMO科技消息】一加Ace5系列将于明日(12月26日)14:30发布。12月25日,博主@数码闲聊站汇总了一加Ace5系列的详细参数
2024-12-26 20:56:00
荣耀公布MagicOS 9.0五大升级亮点
【CNMO科技消息】据CNMO了解,荣耀MagicOS9.0第二波升级已经到来,官方总结了五大升级亮点,包括YOYO智能体
2024-12-26 20:57:00
华为手环10曝光,或与华为Pura 80同台亮相
据报道称,华为手环10已经通过了印尼SDPPI认证和TUVSUD认证,同时认证显示该款设备支持IP68级别防尘防水性能
2024-12-26 20:58:00
OPPO A5 Pro支持360°抗摔:通过多项军标环境测试
2024年12月24日,OPPO推出A5Pro手机,该产品以卓越的360°抗摔性能引发了行业内外的广泛关注,其实现了全方位的防护
2024-12-26 20:58:00