• 我的订阅
  • 头条热搜
阶跃星辰李璟:多模态是AGI的必经之路,视觉模型可按语言模型路线实现大一统
...智能的上限仍然是当下最重要的事情。“我们始终认为多模态对AGI的实现非常重要,是实现AGI的必经之路。”对大模型的下一步发展,李璟表示,阶跃星辰主要会在两个方向发力。一是在预训练的基础上加上强化学习,提高模型...……更多
国产大模型加速落地,争夺“中国版ChatGPT”心智定位
...击,即可畅享Kimi+带来的便捷与智能。此前,讯飞星火、商汤科技等也分别推出全新的大模型产品。李开复表示,大模型推理成本的下降会推动中国AI大模型进入”落地为王”的阶段,今年会迎来“大模型应用爆发元年”。他同...……更多
...单前三!阿里通义千问Qwen2.5-Omni凭“能看能听能说”的全模态能力登顶全球开源模型榜首,深度求索DeepSeek的V3-0324在代码生成上碾压GPT-4.5,群核科技的SpatialLM把三维空间认知玩出了花。如今,杭州已经成了全球范围内少有的,...……更多
AIGC+机器人=具身智能?硅谷最酷的两个男人不谋而合 A股预演“下个浪潮”
...潮将是“具身智能”,他也公布了Nvidia VIMA,这是一个多模态具身人工智能系统,能够在视觉文本提示的指导下执行复杂的任务。反映在A股二级市场上,今日,相关标的强势上涨,多只个股涨停。截至收盘,鸣志电器、优德精密...……更多
一文看尽Meta开源大礼包!全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等
...Meta最近开源了多个AI项目,包括图像分割模型SAM 2.1、多模态语言模型Spirit LM、自学评估器和改进的跨语言句子编码器Mexma等,提升了AI在图像处理和语音识别领域的能力,进一步推动了AI研究的进展。开源绝对是AI如今发展迅猛的...……更多
林达华谈大模型发展之路:未来会有更高效的模型结构出现
...一年,人工智能领域风起云涌,模型架构、训练数据、多模态、超长上下文、智能体发展突飞猛进。大模型的技术演进路在何方?3月24日,在2024全球开发者先锋大会的大模型前沿论坛上,上海人工智能实验室领军科学家林达华...……更多
华中科技大学白翔教授发布多模态大模型
...华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型号称能够实现对世界的“观察”,对图片进行深入的问答交流和精确描述。▲图源Monkey项目的GitHub页面IT之家注:多模态大模型是一类可...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...新提供坚实的技术支撑。评测榜单涉及的大语言模型和多模态大模型超过150个,已有包括Meta、阿里巴巴、腾讯、百度等30余家国内外企业和科研机构采用OpenCompass助力开展技术研发。作为本次榜单国内模型第一,总排名第二,GLM-...……更多
AI 3D生成天花板再拉升!清华团队炼成3D Scaling Law
...产⼒的关键要素。”公开资料显示,该公司的CEO、CTO都是商汤出身:创始人兼CEO宋亚宸,曾在商汤落地过多个从零到一的AI项目,曾参与大模型六小强之一MiniMax的创立;CTO梁鼎,清华本硕博,师从戴琼海院士,曾任商汤通用模型...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...来自斯坦福李飞飞吴佳俊团队!HourVideo,一个用于评估多模态模型对长达一小时视频理解能力的基准数据集,包含多种任务。通过与现有模型对比,揭示当前模型在长视频理解上与人类水平的差距。2009年,李飞飞团队在CVPR上首...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
多模态LLM视觉推理能力堪忧,浙大领衔用GPT-4合成数据构建多模态基准
...进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准,并设计了一种新颖的数据合成方法。无论是语言模型还是视觉模型,似乎都很难完成更抽象层次上的理解和推理任务。语言模型已经可以写诗写小说...……更多
感官协同配合的精细操纵,人大胡迪团队探索机器人模态时变性挑战
...冯若轩为中国人民大学二年级硕士生,主要研究方向为多模态具身智能,师从胡迪教授。引言:在机器人操纵物体的过程中,不同传感器数据携带的噪声会对预测控制造成怎样的影响?中国人民大学高瓴人工智能学院 GeWu 实验室...……更多
AI视觉迎GPT-3时刻!国内市场规模将达6000亿 受益上市公司梳理
...化并形成各自特有算法的技术能力。截至2021年上半年,商汤科技以47%市占率位列行业第一;旷视科技和海康威视位列第二、第三名,市占率分别为8%和7%。云从科技、创新奇智、依图科技、大华股份等位列行业Top10。此外,据财...……更多
多模态竞技场对标90B Llama 3.2!Pixtral 12B技术报告全公开
...客之姿杀入江湖的Mistral AI,在9月份甩出了自家的首款多模态大模型Pixtral 12B,如今,报告之期已至,技术细节全公开。作为欧洲的OpenAI,Mistral最近压力不小。端侧小模型端不出来,对比评测的结果又遭到质疑。上个月震撼登场...……更多
AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024
...失函数和混合未配对音视频数据训练。该模型不仅在单一模态任务上表现优异,更在视听联合任务中展现了卓越的性能,证明了其全面性和准确性。想要看懂短视频,除了视觉内容外,语音和音频等听觉信息,如视频音乐、音效...……更多
阿里通义实验室黄斐:开源进入千问时代,即将发布的推理模型会更好用
...包括了更快的响应和更低的成本。全能模型则是指能将多模态混合的模型,在输入输出方面更加自由。黄斐认为,在模型之外,AI Agent(智能体)也是一个需要重点关注的领域:“未来的一段时间内,AI Agent一定也是一个比较火...……更多
科技巨头齐聚MEET2025:共话AI、Agent、具身智能机器人等浪潮趋势
...。作为国内AGI(通用人工智能)领域的先行者与探索者,商汤科技董事长兼CEO徐立博士则从第一批AGI创业者的视角,结合商汤科技在AI技术研发与商业化应用中的丰富经验,带来了他对AGI发展第二个十年的深情展望。 其后的演...……更多
蚂蚁数科能源电力时序大模型EnergyTS发布 预测精度超谷歌、亚马逊
...大模型技术创新带来了传统行业的变革机遇,大模型的多模态感知理解能力将引发新交互、新服务,AI链接物理世界成为可能。在新能源领域,新能源光伏和风力发电环节,容易受到太阳辐照、风速、云量、温度、设备性能等多...……更多
制造业AI也迎来大模型时刻? | 智造观察
...户采用。不过,从同一时期的百度、阿里等科技大厂,到商汤、旷视等独立AI公司,它们先后宣告投入大模型,也在逐渐折射出一个现状:并不是所有企业都适合投入基础大模型,无论是多模态还是深入行业,大模型背后的核心...……更多
科学家打造多模态模型,7B和1.3B小模型均开源,可部署手机等终端
在最近一项研究中,DeepSeek-AI 团队针对多模态大模型展开了深入探索。选择这一研究方向,背后有着多重考量。最初,该团队围绕是否聚焦于多模态生成、多模态理解、或是两者的统一框架进行了广泛讨论。基于对通用人工智...……更多
APUS发布1000亿天燕大模型AiLMe,CEO称日活用户已超百万|钛快讯
...动全面拥抱 AI 的战略转型。从产品场景路径看,相较于商汤、华为盘古等To B(企业端)大模型,APUS的天燕大模型AiLMe主要在C端落地,贴近ChatGPT模式。李涛称,APUS是最早开始关注并投入 AI 的入局者之一,2018年就进行了 AI 技术...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...息处理全国重点实验室两大平台,长期从事机器学习、多模态学习和具身智能方向的研究。本工作第一作者为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为...……更多
2B多模态新SOTA!华科、华南理工发布Mini-Monkey,专治「切分增大分辨率」后遗症
【新智元导读】Mini-Monkey 是一个轻量级的多模态大型语言模型,通过采用多尺度自适应切分策略(MSAC)和尺度压缩机制(SCM),有效缓解了传统图像切分策略带来的锯齿效应,提升了模型在高分辨率图像处理和文档理解任务的...……更多
迎战GPT-4V!谷歌PaLI-3视觉语言模型问世,更小、更快、更强
...像与语音识别能力。本月初,微软更是公布了 166 页的多模态版 GPT-4V 的相关文档,详细探讨了 GPT-4V 的功能和使用情况,这一举动引起了业界的广泛关注。然而,在视觉语言模型的角逐中,谷歌也不甘示弱。 近日,Google Research...……更多
MMMU华人团队更新Pro版!多模态基准升至史诗级难度:过滤纯文本问题、引入纯视觉问答
...候选选项、引入纯视觉输入设置)更严格地评估模型的多模态理解能力;模型在新基准上的性能下降明显,表明MMMU-Pro能有效避免模型依赖捷径和猜测策略的情况。多模态大型语言模型(MLLMs)在各个排行榜上展现的性能不断提...……更多
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...规模高达2100亿,覆盖蛋白质、DNA、RNA、细胞等七大主流模态。背后玩家正是来自李彦宏孵化创办的百图生科。与应用于其他行业的基础模型有所不同,他们解码的是生命语言,而非自然语言,意味着不仅能处理复杂的生物序列...……更多
...育万亿产业集群。大会现场,来自上海人工智能实验室、商汤科技、阶跃星辰、智象未来、蜜度蜜巢、开放传神、松鼠AI、粒界科技等徐汇区的代表企业和机构现场发布了自己的最新产品,或是成为分论坛的主办者。上海人工智...……更多
刚刚,我们感受了一波最「像人」的国产AI,模型还是开源的
...择了两条路线分别开拓:一条是 GPT-4o 所代表的端到端多模态大模型的探索,一条是 o1 所代表的关于推理 Scaling Law 的探索。具体到 GPT-4o 上,OpenAI 跨文本、视觉和音频端到端地训练了一个新模型,所有输入和输出都由同一神经...……更多
科学家开发多模态音乐理解和生成大模型,兼具理解和创作音乐能力
...音乐理解和生成结合在一起的想法比较新颖,论文也是多模态大模型领域的先期工作之一。并且,除了大模型本身,我们提出的针对模型训练的数据集制作流程和整理的数据集,对学术界也具有较大价值。”腾讯 ARC Lab 刘山松研...……更多
更多关于科技的资讯:
青岛联通5G-A智慧网络突破国际音乐殿堂“通信屏障”
在青岛西海岸新区,一座融合东西方艺术精髓的现代化校园里,跳动的数字信号与跃动的音乐旋律正谱写着数字时代的艺术教育新篇章
2025-07-09 12:23:00
中手游宣布与恺英网络续约,并将基于《仙剑奇侠传》IP开发新的卡牌 RPG 游戏
7月9日消息,中手游今日发布公告,宣布与恺英网络旗下《仙剑奇侠传:新的开始》的正版IP授权达成续约协议。同时,双方宣布新签订一款基于《仙剑奇侠传》IP改编的卡牌RPG游戏授权合作
2025-07-09 12:26:00
果然财经丨青岛传统旅行社转型记
齐鲁晚报·齐鲁壹点 杨雪水汽布满整个楼道、窗外蝉鸣不绝,暑期的旅游市场犹如高温天气般火热,热度持续攀升。在中国国旅(青岛)国际旅行社的销售部
2025-07-09 12:26:00
中文泛娱打造Sayhi国际片场,行业聚力释放短剧能量
由中文泛娱文化发展有限公司(下称中文泛娱)打造的Sayhi国际片场于6月28日盛大开业,坐落于上海东方智媒城,是一个围绕短剧业务展开的复合型空间
2025-07-09 13:39:00
博大数据跻身信通院TOP15算力服务商,以“稳进者”之姿筑基数字经济中坚
近日,在全球数字经济大会智能算力创新发展论坛上,中国信息通信研究院(简称“中国信通院”)权威发布《算力中心服务商分析报告(2025年)》
2025-07-09 13:40:00
荣获2025 IFOY年度大奖!中力自动搬运车展现中国风采!
国际认证,中国唯一!中力自动搬运车荣获IF终极大奖——2025 IFOY "年度仓储搬运车"IFOY AWARDWAREHOUSE TRUCK OF THE YEAREP Equipment X-MOVER EXP15中国智造再攀高峰
2025-07-09 13:41:00
深耕 SLG 与多元破局并行,儒意景秀 2025 上半年战略成效解析
作为全球手游市场规模最大的品类,策略类游戏(SLG)凭借其超长生命周期、高用户平均收入(ARPU)及强社交属性,持续成为众多游戏厂商的重要收入引擎
2025-07-09 13:41:00
中国灵活用工行业的起源可追溯至上世纪90年代,其发展主要受政策驱动、经济转型及劳动力市场结构性变革三大因素推动。2015年后伴随互联网平台经济崛起
2025-07-09 13:42:00
WeTrade获得ASIC牌照:强化全球合规体系,筑牢交易信任基石
WeTrade全球战略布局再达关键里程碑,旗下澳大利亚实体公司——WeTrade Capital (Australia) Pty Ltd
2025-07-09 13:43:00
国泰全新IT办公室进驻深圳前海
国泰集团行政总裁林绍波(左五)、国泰中国内地董事郑家驹(右五)、国泰数码及信息科技董事方逸翔(左四)、国泰中国内地商务及运营总经理徐谷昀(右四)
2025-07-09 13:44:00
记者接到消费者反映,他们在网络平台上吐槽某商品不好用的差评帖,莫名其妙就消失了。并且发现在好多直播电商平台的差评区里,充斥的竟然都是各种好评和夸夸帖
2025-07-09 11:50:00
中庸电力:满负荷生产 冲刺30亿元年度目标
十堰广电讯(全媒体记者 耿吉国 郧西融媒记者 王霞 实习生 王鸿乐)年初以来,中庸电力(郧西)集团有限公司国内外订单接连不断
2025-07-09 10:41:00
携程联合泰山文旅首发“泰山观日出专线直通车”
泰山日出,被誉为“天下第一奇观”,其壮美时刻随季节更迭。进入七月暑期,根据泰山风景名胜区管理委员会发布的信息,日出时间通常在清晨5点左右
2025-07-09 10:43:00
石家庄中小企业可申领人工智能算力券 最高额度不超过100万元 河北日报讯(记者许君强)近日,石家庄市政府印发《石家庄市人工智能算力券实施方案(试行)》
2025-07-09 10:48:00
青岛即墨:雪糕市场涨价未阻销量 平价产品占比持续攀升
大众网记者 朱晓娟 李丹 青岛报道连日来,盛夏热浪席卷青岛即墨,街边超市的冷饮店冰柜前人流不息,冰品消费持续攀升。然而
2025-07-09 10:51:00