• 我的订阅
  • 头条热搜
从空间智能到具身智能,跨维践行Sim2Real AI最高效路径
...使用双眼感知世界一样,具身智能要求机器人能够通过多模态传感器进行感知、交互和决策,形成综合的空间认知和操作能力。问:空间智能与具身智能的异同点是什么?贾奎:就像前面提到的,空间智能赋予 AI 感知并理解现...……更多
又热闹了!OpenAI的加强版“Her”正式开放,压过了Gemini的“生产级”大升级…
...然语音对话获得了实时解答。目前,OpenAI尚未提供这项多模态功能的推出时间表。此外高级语音模式也暂时不对欧盟、英国、瑞士、冰岛、挪威和列支敦士登等地区开放。尽管如此,终于能亲自上手OpenAI版的“her”,对已经混AI...……更多
7个第一,11个首发,讯飞星火放大招,大模型规模化落地可期!
...有的远场高噪、全双工、多语种多方言能力上,升级了多模态能力,新增了超拟人和个性化能力。超拟人数字人首次亮相,多模态的交互从超拟人的语音变成超拟人的数字人,实现语音、视频、图文的全部联动的多模态交互。 ...……更多
GPT-4o的识图能力有多牛?四大维度深度体验
...的?后训练功不可没从前述体验看,GPT-4o的反应速度和多模态能力令人印象深刻。OpenAI首席执行官阿尔特曼直言,新的GPT-4o是OpenAI“有史以来最好的模型”。那么,GPT-4o的多模态能力是如何“炼”成的呢?这背后的秘密或许可以...……更多
智谱AI发布视频生成大模型,B站参与研发,亦庄提供算力|甲子光年
...示,这个生成速度在业内已经算非常快了。张鹏认为,多模态模型的探索还处于非常初级的阶段。从生成视频的效果看,对物理世界规律的理解、高分辨率、镜头动作连贯性以及时长等,都有非常大的提升空间。从模型本身角度...……更多
Gemini的展示是剪辑造假?我们亲测了一下,发现…
...场,隆重推出他们史上“规模最大、能力最强”的原生多模态大模型Gemini 1.0。并称已在多项基准测试中打败GhatGPT,综合能力称霸目前市面上所有AI大模型。官方放出的一段6分22秒演示视频更是震撼:Gemini能流畅而准确地识别出...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
新智元报道编辑:LRST【新智元导读】现有多模态大模型在对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学...……更多
用过GPT-4 Turbo以后,我们再也回不去了
...年 4 月。 定制化:GPT3 16k、GPT4 微调、定制模型服务。 多模态:Dall-E 3、GPT4-V 和 TTS 模型现已在 API 中。 Whisper V3 开源(即将推出 API)。 与开发者分享收益的 Agent 商店。 GPT4 Turbo 的价格约是 GPT4 的 1/3……更多
科学家建立新评价基准,助力评估大模型数据分析能力
...更加符合预期的结果。整体来看,缺乏交互式数据分析的基准——是本次研究面临的最大问题之一。为了解决这一问题,他们以“斯坦福小镇”项目为启发,创建了“DECISION COMPANY”。“DECISION COMPANY”是数据分析领域的首个多代...……更多
谷歌版贾维斯即将问世,最强Gemini 2.0加持!AI自主操控电脑时代来临
...,最后就可以完成用户任务。可见,想要把类似GPT-4V的多模态大模型应用于操作系统上,模型还需要具备强大的屏幕解析能力,主要包括两方面:1、准确地识别用户界面中的可交互图标;2、理解屏幕截图中各种元素的语义,并...……更多
具身智能GPT-2时刻!国内公司做出全球最大端到端统一具身大模型
...在走。机器之心:这种「大统一」模型与大语言模型、多模态大模型以及之前的机器人模型的关系是?统一具身模型的技术方向,既完全不同于传统机器人学习的小模型技术,也完全不同于以往语言、多模态大模型的技术。首先...……更多
生成式AI:手机厂商高端梦最后的希望
...搬上手机?Amon认为,目前大模型正朝着“轻量化”“多模态”方向发展,以云端作为AI大脑,边缘端和终端作为小脑,这样一种云+端的“混合AI”模式成为技术发展的主要趋势。如何将AI大模型搬到手机上,手机厂商应充分考虑...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...示,在接下来的几个月中,他们预计将推出新功能(如多模态)、更长的上下文窗口、更多不同大小版本的模型和更强的性能,以及 Llama 3 研究论文。另外,Llama 3 模型将很快在 AWS、Databricks、Google Cloud、Hugging Face、Kaggle、IBM Wats.……更多
马斯克的AI大模型登场
...用户每天为推特生产包括文本、图像、视频在内的巨大多模态数据库。在算力方面,之前有消息称,马斯克一次性从英伟达购买了1万个处理大型AI模型数据的GPU,总费用达数千万美元,或许就是为了xAI。xAI官网信息也显示,“xAI...……更多
2023-11-06 09:22:00马斯克的AI大模型登场
“眼里有活”的斯坦福机器人来一个?数十种家务全包 成本约3万美元
...和平台的发展:1、以机械臂作为物理输入/输出设备的多模态大模型:VIMA、PerAct、RvT(英伟达)、RT-1、RT-2、PaLM-E(谷歌)、RoboCat(DeepMind)、Octo(伯克利、斯坦福、CMU)等;2、弥合 System 1(负责低级控制)和 System 2(负责高.……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...认为,该成果具有广泛的应用潜力,可以推广到文音视图模态的不同任务上,包括多模态理解、生成基座模型等。5. 写在最后团队关注底层问题,尤其在 LLMs 和多模态方面,期望实现更多突破。更多团队技术研究进展,可以通过...……更多
姚班天才组队开发《完蛋!我被大模型包围了》续作!专为摸鱼爱好者打造
...子工作室”,还有了大模型明星创业玩家阶跃星辰提供多模态和multi-Agent等大模型技术支持。上周简单内测后,现在上线微信小程序,搜索头号做题家,人人都能玩。好奇,自家后浪能把前浪拍死在沙滩上不? 来揭开《我把大...……更多
...量效率,首次赋能光计算实现自然场景千类对象识别、跨模态内容生成等人工智能复杂任务。相关研究成果4月12日发表于《科学》。作为人工智能的“三驾马车”之一,算力是训练人工智能模型、推理任务的关键。倘若把大模型...……更多
...径。为什么这样认为。对此,王鹤在具身智能大会具身多模态大模型论坛上给出了解释,科技行者就这一演讲关键内容进行了不改变原意的整理:机器人从动嘴到动手有多难最近,具身多模态大模型非常火,我们看到了OpenAI和Fig...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...示了AFM-server在HuggingFace OpenLLM排行榜V1,以及HELM-Lite v1.5.0基准上的结果。可以看到,AFM预训练模型有着强大的语言和推理能力,从而为后训练和特征微调提供了坚实的基础。后训练 人类评估对于苹果AI的应用场景来说,人类评估...……更多
...片公司也在合作,共同推动端侧大模型的落地。未来:多模态经历过语言大模型的开发,我们其实已经把底层的坑都蹚过了,我们有能力去做更大参数的模型,但具体要不要做千亿或者万亿的大模型,更多还是从投入产出比的角...……更多
“3D视频版Sora”来了!
...-Diag和FV4D)方面都击败了此前的模型。结语:Stability AI多模态再添新布局Stability AI以文生图开源模型起家,在文本、视频、3D等多个模态上都有所布局。此次开源SV4D,是其在3D+视频生成两个方向上的共同进展。尽管该模型目前仍...……更多
AI界新晋王者被曝抄袭、作弊、做假,脸都丢光了
...像与人类互动。由此,谷歌追随者高呼:“Gemini让原生多模态(即文本、声音、视频等模态)真正做到丝滑融合,发展原生多模态将成为未来主流路径!”视频发布不到一天,这位超级巨头却遭“打假”。彭博专栏作家帕米·奥...……更多
让机器人拥有人一样潜意识,英伟达1.5M小模型就能实现通用控制了
...现得更好吗? Q2: HOVER 能比其他训练方法更有效地训练多模态仿人机器人控制器吗? Q3: HOVER 能否在真实世界的硬件上实现多功能多模态控制?与专家策略的对比该团队在不同控制模式下比较了 HOVER 和相应专家策略的表现。以 ExB...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
...史记录。o1 模型拥有真正的通用推理能力。在一系列高难基准测试中展现出了超强实力,相比 GPT-4o 有巨大提升,让大模型的上限从「没法看」直接上升到优秀水平,不专门训练直接数学奥赛金牌,甚至能在博士级别的科学问答...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...动评分器 ( FLAMe-RM 和 FLAMe-Opt-RM)。在12个自动评分器评估基准中的8个基准上,FLAMe及其变体的自动评分性能优于用专有数据训练的GPT-4o、Gemini-1.5-Pro等模型。- 计算高效的多任务训练:引入了一种计算更为高效的方法,使用创新...……更多
RTX 40系GPU AI性能首测
...IAACE技术Demo,它突破了游戏中NPC角色互动的界限,采用多模态方法来展示NPC,将认知、感知和行为系统集成在一起,以实现身临其境的叙事效果。在活动现场NVIDIA也展示了新版本的ChatRTX,增加了更多的功能,在新版本中它加入...……更多
科学家研发AI睡眠模型,捕捉多导睡眠图数据特征,提升睡眠障碍
...出一款名为 MSSC-BiMamba 的 AI 模型,能够捕捉多导睡眠图多模态数据特征,提升睡眠分期与睡眠障碍的诊断效率。图 | 郭晶晶(来源:郭晶晶)据介绍,考虑到多导睡眠监测的特点,该团队设计了这款多模态睡眠状态分类模型。该...……更多
北大林宙辰团队全新混合序列建模架构MixCon:性能远超Mamba
....5 倍(如图 5 所示)。数据集评估本文在一系列标准学术基准测试中评估 Conba 性能,包括常识推理任务(如 HellaSwag、WinoGrande、ARC - E、ARC - Challenge)、阅读理解任务(如 BoolQ、QuAC)、聚合基准测试(如 MMLU、BBH),采用不同……更多
京东探索研究院院长、京东科技人工智能业务负责人何晓冬:让大模型在产业先跑起来
...犀大模型,经过不断升级,已从单一的语言处理走向了多模态能力,涵盖了语言、语音、图像、视频和数字人等。这一跨越,得益于京东在对话、语音、商品图像、视频、直播等多模态数据层面的训练积累以及包括BUTD Attention、A...……更多
更多关于科技的资讯:
折叠屏iPhone前瞻:书本式折叠方案 定价或超2万元
苹果一直以来都在持续推出高端iPhone,以高利润来应对整体销量下滑的挑战。近日天风国际证券分析师郭明錤发布简报,预测苹果公司将于2026年底或2027年初发布其首款折叠屏iPhone
2025-03-06 22:43:00
选装价4.2万!小米SU7 Ultra碳纤维双风道前舱盖受损太多没法修
快科技3月6日消息,今日,小米汽车发布答网友问第117集,都是一些很实用的注意提醒。对于小米SU7 Ultra的碳纤维双风道前舱盖如果发生碰撞
2025-03-06 22:43:00
豪华品牌标配!小米汽车宣布免费提供维修代步车
快科技3月6日消息,在小米汽车最新一期的答网友问中,针对新提小米SU7 Ultra车主提出的“免费代步车”问题进行了回复
2025-03-06 23:13:00
顶配价格超10万!苹果新款MacBook Air/MacStudio看点汇总
3月5日晚,苹果发布了包括搭载M4芯片的MacBook Air、Mac Studio以及突破性的M3 Ultra芯片在内的新品
2025-03-06 23:13:00
男子在杭州太子山意外拍到黄山:光明顶清晰可见
3月6日消息,据媒体报道,浙江杭州杨先生在杭州太子尖拍摄到安徽黄山的壮观云海。当事人表示,杭州太子尖到安徽黄山直线距离约70公里
2025-03-06 23:13:00
【浪潮星锐】商广勇:关于我职业生涯关键词的三次进化
对于商广勇来说,“创新”是他职业生涯的一大关键词。在浪潮近二十年,在他看来,创新是自己一直不变的底色,但每个阶段对于创新的理解也不尽相同
2025-03-06 23:27:00
超跑同款!小米SU7 Ultra主动尾部扩散器有何作用:官方解答来了
快科技3月6日消息,在最新一期的小米汽车答网友问中,官方详细解释了小米SU7 Ultra主动尾部扩散器的作用。该扩散器位于车尾下方
2025-03-06 23:43:00
《双人成行》团队新作《双影奇境》今日发售:国区198元 全球最低价
快科技3月7日消息,今天零点,2021年TGA年度游戏《双人成行》团队新作——《双影奇境》国区正式解禁开售,国区售价198元
2025-03-07 00:43:00
中国移动董事长杨杰:正全面进行6G研发 比5G有三方面升级
快科技3月7日消息,5G方兴未艾,而6G已离我们越来越近。据中证金牛座,日前,中国移动董事长杨杰接受采访时表示:“我们正在全面进行6G研发
2025-03-07 00:43:00
替代高通!曝苹果自研基带升级版明年量产:补齐最后一块短板 支持毫米波
快科技3月7日消息,分析师郭明錤爆料,苹果C1基带的升级版计划明年量产,新款基带芯片支持毫米波,补齐最后一块短板。郭明錤指出
2025-03-07 00:43:00
在快节奏的工作环境中,管理者作为团队的领航人物,其角色至关重要。然而,当管理者逐渐脱离实际业务,沉浸在会议、报告和宏观规划中时
2025-03-07 02:08:00
烟台高新区:抢占未来发展“智”高点
胶东在线3月3日讯(通讯员 郭健) 人工智能作为新一轮科技革命的关键驱动力,对国家级高新区发展意义重大。烟台高新区卫生健康局持续聚焦人工智能产业
2025-03-07 03:03:00
本文转自:人民日报邹  翔人工智能会取代你我吗?这一话题引发热议,有代表委员认为人工智能正赋能千行百业并逐渐取代人工,还有代表委员认为要加强学习
2025-03-07 06:11:00
本文转自:人民日报人工智能(AI)是科学技术发展到新一轮的最新变革,它不仅推动产业升级,改变传统经济的面貌,而且对人类社会生活产生深远影响
2025-03-07 06:13:00
一块医药:助力构建医药供应链新生态  提升服务品质助力美好生活
本文转自:人民日报作为国内领先的成长型连锁药店供应链与运营服务商,湖南一块医药科技有限公司(简称“一块医药”)始终秉持“技术驱动+全链路赋能”的企业战略
2025-03-07 06:13:00