• 我的订阅
  • 头条热搜
突破视频多模态大模型瓶颈!「合成数据」立大功,项目已开源
... S-Lab 的博士生 Bo Li, 字节跳动研究员 Wei Li, Zejun Ma.视频多模态大模型(LMMs)的发展受限于从网络获取大量高质量视频数据。为解决这一问题,我们提出了一种替代方法,创建一个专为视频指令跟随任务设计的高质量合成数据集...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
中国也有Sora同款训练架构公司,清华班底,智谱也投了 | 36氪首发
...也出现了大模型独角兽智谱AI的身影。36氪获悉,近日多模态AI模型公司生数科技完成新一轮数亿元融资。该轮融资由启明创投领投,达泰资本、鸿福厚德、智谱AI、老股东BV百度风投和卓源亚洲跟投。据介绍,融资主要用于多模...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
Gemini引领多模态AI热潮,产业发展有望加速
12月11日,多模态AI概念股继续活跃,苏州科达(603660.SH)三连板。截至当日中午收盘,因赛集团(300781.SZ)涨13.32%,苏州科达涨9.96%,宣亚国际(300612.SZ)涨9.7%。消息面上,GoogleAI大模型Gemini近日发布,Gemini是Google到目前为止规……更多
国际首个,我国团队开发糖尿病诊疗多模态大模型 DeepDR-LLM
...构建了全球首个面向糖尿病诊疗的视觉-大语言模型的多模态集成智能系统 DeepDR-LLM,成果于 2024 年 7 月 19 日在 Nature Medicine 发表(题为 Integrated image-based deep learning and language models for primary diabetes care)……更多
阿里CEO吴泳铭:生成式AI让世界有了一个统一的语言——Token
...为了AI发展的最大障碍。当前的数字化世界,信息以多种模态存在——自然语言、程序代码、图像、视频、音频、3D模型、数学符号……这些信息形式各自独立,彼此之间的“对话”几乎不存在。AI虽然能够在单一模态下表现出色...……更多
...到2035年有望达3.5万亿元●当前AI正在“大暴走”,将从单模态大模型时代进入多模态大模型新时代。这将大幅提升大模型对视觉、图像的重视,并为机器提供理解世界的“大脑”,具身智能也将随之诞生。具身智能有可能最先落...……更多
解密星辰大模型·软件工厂 软件开发迈入智能化全流程新阶段
...AI 领域的一家,从去年至今,从星辰语义大模型到星辰多模态大模型和星辰语音识别大模型,中国电信旗下大模型始终保持着快速迭代,且完成了语义、语音、视觉、多模态的全模态大模型布局。7月5日,中电信人工智能科技有...……更多
...面,通过软硬件、云模型、端模型协同优化,实现座舱全模态主动理解、全舱位车内场景感知、多视角车外场景感知以及弱网、高信息负荷场景等全工况安心可用;在组织服务方面,通过生成式场景引擎,围绕用户需求与场景进...……更多
●多模态使人形机器人能融合图像、语义、力感知、环境感知等多种因素,综合判断、生成任务并执行任务,是让人形机器人具有自主思考能力的关键核心技术●标志着成都在我国多模态模型应用于人形机器人领域率先取得突...……更多
清华领衔发布多模态评估MultiTrust:GPT-4可信度有几何?
...并实现部分专利产学研转化落地应用。以GPT-4o为代表的多模态大语言模型(MLLMs)因其在语言、图像等多种模态上的卓越表现而备受瞩目。它们不仅在日常工作中成为用户的得力助手,还逐渐渗透到自动驾驶、医学诊断等各大应...……更多
...式的变革提供了可能。“空天·灵眸”是我国首个面向多模态遥感数据生成式基础模型,也是首个专为遥感领域打造的专业基础模型。自2022年首次推出后,空天院研究团队在“基础模型+下游任务”计算范式积累上持续探索。于...……更多
GPT-4V暴露致命缺陷?JHU等发布首个多模态ToM 测试集
...来自 JHU, NYU, MIT, Harvard 等机构的研究团队开创了第一个多模态的 ToM 测试基准,发现现有的多模态模型和 LLM 都表现存在系统性缺陷,同时他们提出了一种有效的新方法。在刚结束的 ACL 2024 会议中,这篇论文获得杰出论文奖。论...……更多
探访数字人公司世优科技:AI数字人“情智兼备”的创新之旅
...拿下虎啸奖元宇宙营销类金奖,6月发布新一代AI数字人多模态交互系统“世优波塔”、7月深度参与2024全球数字经济大会成为“北京市通用人工智能产业创新伙伴计划”第三批成员并登录央视新闻联播……今年,世优科技再次因为...……更多
支付宝发布多模态医疗大模型:支持千亿级视觉识别
...快科技7月5日消息,在2024世界人工智能大会上,支付宝多模态医疗大模型正式亮相,成为国内首批多模态医疗大模型之一。据悉,该医疗大模型的基石,源自蚂蚁集团自主研发的蚂蚁百灵大模型,这一先进平台不仅拥有“视听言...……更多
苹果大模型,不藏了
...模型领域的步伐。上个月,苹果先是推出了名为Ferret的多模态大语言模型,图像处理技术堪称惊艳;而后又发布了一篇题为《闪存中的大型语言模型:在有限内存下高效的大型语言模型推理》的论文,直指大模型落地iPhone等“内...……更多
GPT刚刚公开「草莓」项目:推理能力翻倍,定价200美元?
...题。此外还有一个更加实际问题是,与现有的 GPT-4 等多模态模型相比,据称「草莓」仍然缺乏多模态处理能力,这也意味着它在处理图像、视频等复杂数据时可能面临局限性。 还有价格。首先要说明的是,在官方还未发布甚至...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
「千诀科技」推出通用感知大模型,专注机器人全脑研发 |早期项目
...大产品突破。丘脑是一个多功能的脑区,用于将动物的多模态感官信息进行提取,传输至大脑皮层。丘脑的作用远超过一个简单的信息传递站,它除了收发感官信息以外,还要对其进行一定的处理,包括压缩、解析以及调节生理...……更多
趣丸科技副总裁兼CTO谢睿:多模态智能激发应用新场景 | 新质生产力·AI Partner大会
...能够受邀参加36氪AI Partner大会。今天我的演讲主题是《多模态智能激发应用新场景》,借这个场合与各位新老朋友分享趣丸科技在人工智能方面的最新探索成果,以及赋能智能音频和数字安全方面的一些思考。首先,请允许我简...……更多
vivo发布自研大模型,为用户和开发者带来诸多惊喜
...随着大模型技术日益成熟,vivo在语言、图像、语音、多模态等全模态的AI技术上逐步升级为大模型能力,正从传统的AI技术时代迈向大模型AI技术时代。vivoAI算法技术总监李方圆全新蓝心大模型带来4项核心升级:1、语言大模型升...……更多
2024产学研融通创新活动:AI应用落地是重点
...,以及大模型小模型怎么互通也是大家关注的重点,突破模态瓶颈,增加视频、音频的多模态通用模型是后续突破的重点。当前基础模型发展收敛,行业模型落地成为新起点,未来模型发展仍遵循规模定律,关键在于解决“最后...……更多
谷歌发布Gemini,机构看好多模态AI应用商业变现前景,软件ETF(159852)年内份额增长近1.5倍丨ETF观察
近日,多模态AI概念持续活跃。谷歌等科技公司也纷纷推出了新的多模态AI产品,大模型多模态化有望成为AI领域的热门趋势。综合多家机构观点,AI多模态模型的不断突破和加速落地,有望进一步打开AI应用商业化空间。截至12...……更多
WPS AI以“慢”制胜 金山办公36年技术积淀助力飞跃发展
...会上,熊龙飞展示了WPS AI专业应用领域的最新成果,如跨模态技术、高度可复用的引擎系统等方面的突破。这些技术成果不仅提升了文档处理的效率和准确性,更为用户带来了全新的智慧办公体验。在多模态技术在文档处理中的...……更多
更快、更强、更可控:智谱“起舞弄清影”,视频生成卷出新高度!
...张鹏则表示,对于Sora的出现,他并不吃惊,因为立足多模态领域的深耕,智谱也正在做这件事。如今,“清影”面世,让外界看到了智谱在视频生成领域的阶段性成果。而“人人可用”的开放姿态,也让没有视频制作基础的小...……更多
【产业互联网周报】字节回应被曝秘密利用OpenAI;英特尔预告Gaudi 3将超越H100;阿里云M7蔡英华离职;马斯克回应Grok抄ChatGPT作业
...,但其中未见蔡英华的动向。(36氪)贾佳亚团队推出多模态大模型LLaMA-VID据介绍,该模型可支持单图、短视频,还可以将3个小时的电影或视频精简为数个Token,直接使用大语言模型进行理解和交互。(36氪)蚂蚁集团回应职级...……更多
开源证券:多模态模型再迎新突破,继续布局AI应用及算力
...议关注券商、银行。(三)券商行业掘金 开源证券:多模态模型再迎新突破,继续布局AI应用及算力1、OpenAI发布首个文生视频模型Sora,可输出长达60秒的视频2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora可以直接输出长...……更多
“弱智吧”成最佳中文AI语料库,究竟什么算优质数据?
...算法至关重要,以便进行准确的预测和分类。此外,在多模态大模型构建过程中,大规模也经常需要具有语义对齐的多模态数据,对模型的构建也是非常重要的。这些数据能够使大模型学习到不同模态(如图片和文字)之间的映...……更多
“杜甫很忙”梗图变视频!智谱AI生成视频模型上线
...过半,经过一轮“价格战”后,各家大模型企业正在将多模态能力的突破作为大模型发展的下一个关键节点,大模型行业本身也正经历从单模态到多模态,再到全模态的演进。就在本月初的世界人工智能大会上,腾讯集团副总裁...……更多
更多关于科技的资讯:
微软Win11全新设置UI:更容易了解PC配置
快科技1月5日消息,微软通过在Windows 11的设置中的“系统”页面添加“卡片”,希望用户能够更轻松地掌握其电脑的关键规格
2025-01-05 11:16:00
一条街开3家店的蜜雪冰城 真的赚钱吗
如果要在中文互联网上选出一个经久不衰的显眼包,那差评君,必须给雪王投上一票。随手一搜,到处都能看到雪王这个街溜子的出圈名场面
2025-01-05 11:16:00
卖一台亏3万的车卖爆!智界R7上市100天累计大定破5.8万台
快科技1月5日消息,鸿蒙智行官方今日宣布,智界R7上市100天累计大定突破58000台。最新销量数据显示,智界R7在上月卖出超1
2025-01-05 11:16:00
张朝阳跨年演讲 “我们生活在量子力学的世界”
“在2025年的前一个小时,我们还在计算,看来2025年是动脑子的一年。”12月31日晚上10点,搜狐创始人、董事局主席兼首席执行官
2025-01-05 11:32:00
Intel跌跌不休!AMD处理器Steam份额大涨至38.73%:X3D立大功
快科技1月5日消息,玩家对AMD处理器的喜爱,已经直观反映到了Steam数据上。根据Steam最新公布的12月份硬件调查数据
2025-01-05 11:46:00
在Mac上玩3A游戏 是果粉专属行为艺术吗
选 Win 还是选 Mac ,关于这个问题,永远都能看到两拨人在网络上互撕。但是不管 Mac 用户们怎么强调 Mac 的精致和续航
2025-01-05 11:46:00
功能下放!微软持续将Win11 24H2新特性移植到23H2
快科技1月5日消息,无论用户喜欢与否,微软都在持续将Windows 11 24H2中的新功能新特性移植到23H2版本中
2025-01-05 11:46:00
从微软转战谷歌:硅片技术巨头谢赫跳槽!
快科技1月5日消息,据媒体报道,近期,微软前硅片制造与工程领域的资深专家Rehan Sheikh(谢赫)近日宣布加入谷歌
2025-01-05 11:46:00
山东移动济宁分公司助力打造智慧化工“新标杆”构建产业数字化新生态
大众网记者 段正浩 通讯员 孙新茂 济宁报道在国家大力推动工业智能化转型的产业政策背景下,为持续推动化工产业智改数转、绿色发展
2025-01-05 12:02:00
最新研究:农村5G基站少 手机辐射高于城市
快科技1月5日消息,据媒体报道,瑞士巴塞尔大学的一项新研究发现,农村使用5G手机上传美丽风景视频的用户所遭受的辐射水平几乎是城市中用户的两倍
2025-01-05 12:16:00
网约车司机加女乘客微信被封号30天:车内录音曝光 官方回应
1月5日消息,据小莉帮忙报道,近日,河南郑州,网约车司机崔先生反映,因为拉了一个女乘客,两个人相聊甚欢便加了微信,结束后乘客还给了好评
2025-01-05 12:16:00
旗下首款!华擎官宣将在CES推出背插主板
快科技1月5日消息,华擎宣布将在CES 2025展会上推出其首款BMD背插式主板,标志着华擎将进入背插主板市场,填补了其在该领域的空白
2025-01-05 12:16:00
哪吒U三电系统全部短路 车主:车修一半4S店说要关门了
快科技1月5日消息,据博主“拜托了老司机”透露,一位哪吒U车主向其反馈,他的车在4S店修了一半,4S店通知他4S店要闭店关门了
2025-01-05 12:16:00
超75万人预约!暴雪《守望先锋》国服下周公测:不删档保留进度
快科技1月5日消息,暴雪《守望先锋》国服将于2月19日正式回归,《守望先锋》官网显示,国服预约人数已超75万人。据了解
2025-01-05 12:16:00
小米SU7车祸频发引关注 雷军想了一招:网友大赞 开汽车行业先河
快科技1月5日消息,日前,小米汽车正式开启安全驾驶挑战,并邀请每一位小米SU7车主加入。据官方介绍,此次挑战活动时间为2025年1月1日-3月31日
2025-01-05 12:46:00