• 我的订阅
  • 头条热搜
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...健性。 尤其需要注意,随着任务难度提升,Dualformer 的优势也会增大。对于最大的 30×30 迷宫,Dualformer 的 1-Optimal-64 成功率是仅解答模型的 2.8 倍,在 3-Optimal-64 上是 2.97 倍。Dualformer 的 SWC 分数也比基线高……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...务的模型,在A*搜索算法生成的路径上训练而来,在路径规划任务(如迷宫、推箱子游戏)上表现良好,可以以更高效率找到最优解。研究发现,人类会在思考过程中倾向于找捷径。为了更进一步模拟人类,Dualformer在随机推理轨...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...对状态进行最佳优先搜索,实现了对复杂推理任务的全盘规划,从而提升开源模型在推理任务上的性能。其中g(s_t)表示当前轨迹中的多个历史状态,既{s1,...,s_t},的聚合收益。具体g(s_t)的函数形式可以通过人为定义,例如判断当...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...续性记忆,不能推理(只要推理的定义是合理的)、不能规划。」Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...,代码也即将在近期开源。大模型如何统一具身指令导航规划?不同的导航任务要求截然不同的能力,经典的物体导目标航任务需要理解房间结构和物体之间的联系,视觉语言导航任务侧重于严谨地遵循指令,而新兴的需求驱动...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
理想的智能驾驶,到底「City 不 City」?
...能够在各种道路条件下行驶; 绕行丝滑:具备时空联合规划能力,对道路障碍物的避让和绕行更加流畅;路口轻松:通过超视距导航选路能力,在复杂路口也能顺畅通行;默契安心:考虑用户心理安全边界,实现分米级微操,...……更多
o1带火的CoT到底行不行?新论文引发了论战
...问题上为 MMLU 和 MMLU Pro 带来助益。CoT 在形式推理方面的优势和劣势下面来解释 CoT 有助于符号推理任务的原因。很多符号和半符号推理任务都可以分成两个阶段:规划与执行。该团队也基于此思路进行了分析。设置 1 和 2:少样...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...,并生成高保真度、一致性强的新视角视频。△相机轨迹规划算法此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...ew在规划任务上,表现显著优于o1-mini。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...boMamba图 1. RoboMamba 具备的机器人相关能力,其中包括任务规划、提示性任务规划、长程任务规划、可操纵性判断、可操纵性生成、未来与过去预测、末端执行器位姿预测等。摘要机器人操纵的一个基本目标是使模型能够理解视觉...……更多
...,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步骤包括:在预训练阶段,MCTS模块在特定任务上进行预训练,以学习有关有效思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预...……更多
机器学习和人工智能在各行各业掀起了新的变革浪潮
...程。虽然大语言模型陆续开发了上下文敏感记忆、多步骤规划和战略性工具等高级功能,但这些“智能体”在执行任务时通常无法吸取历史经验,从而导致其解决问题的能力效率低下。来自清华大学、大连理工大学和北京邮电大...……更多
行业丨抢滩下一个高地,分布式云计算迎来黄金发展期!
...现低延迟的实时AI推理,提升用户体验。分布式云计算的优势高可靠性分布式系统通过将数据分散存储在多个节点上,实现了数据的冗余备份和容错处理,提高了系统的可靠性。可扩展性分布式云计算可以根据需求按需增加或减...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...抓取需要全面的语义理解、场景感知、决策和稳健的控制规划。具身抓取方法将传统的机器人运动学抓取与大型模型(如大语言模型和视觉语言基础模型)相结合,使智能体能够在多感官感知下执行抓取任务,包括视觉主动感知...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...高效的变体,即群体相对策略优化 (GRPO)。这两者主要在优势值的计算方法上不同:PPO 使用一个网络来估算状态值,并通过广义优势估算 (GAE) 技术来计算优势值;而 GRPO 则简化了这个过程,直接使用标准化的奖励信号来估算动作...……更多
车企争抢L3路试牌照,谁会是宝马奔驰后的下一批?
...车道划线,对车道的定位观感更加准确。由于感知模型的优势,采用该类感知模型的车型都会更容易获得L3路试牌照。华为虽然现在并没有公布公布L3级自动驾驶进度,但网传华为将参与L3级自动驾驶相关标准的制定。本月稍早前...……更多
...发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...基础模型表现得好很多,但当需要生成多个答案时,这种优势就不明显了 —— 在某些情况下,甚至完全相反。模型在生成答案时缺乏多样性,这对于搜索的效果非常不利。特别是在极端情况,比如采用「贪心解码」,模型给出...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...、「诗词赏析」这类比较具有中文特色的问题,CoE的领先优势更加明显。目前,360的「多模型协作」已经能打败并远远甩开GPT-4o,媲美o1-preview。这就是复仇者联盟的力量,即使灭霸的能力再强,团结起来的团队,依旧是强大、...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...无法完全替代预训练的扩展,但已显示出在某些情况下的优势。引发网友热议这项研究被网友po出来后,引发热议。有网友甚至表示这解释了OpenAI“草莓”模型的推理方法。为什么这么说?原来就在昨晚半夜,外媒The Information放...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...场算力需求提供了在用户高并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...发展时期,我们正处于下一波增长的有利位置。商汤核心优势在于‘大装置+大模型’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互,以及低成本模型推理架构上构建独特的优势,从而在激烈的市...……更多
...专属大模型、提升训推效率和精度、降低落地门槛等多重优势。 从容大模型训推一体机则基于华为最新Atlas900系列训练服务器,预置从容大模型训练推理一体化平台。平台适配国产化芯片,通过工程优化,实现和英伟达芯片的...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...验室在榜单发布同时表示:“中文场景下国内的模型更具优势,中文闭源大模型接近GPT-4 Turbo的水平。”OpenCompass 2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...成帧数的增加,Tora比基于UNet的方法具有越来越大的性能优势,保持较高的轨迹控制的稳定度。例如基于同一输入,Tora生成的视频比DragNUWA、MotionCtrl模型生成的更加平滑,对运动轨迹的遵循也更准确。//oss.zhidx.com/uploads/2024/08/66ac...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
...关系挖掘等多个任务上,相较于现有方法具有显著的性能优势。随着近年来大型语言模型(LLMs)的迅速发展,学术界对将其应用于时间序列分析领域表现出浓厚的兴趣。时间序列分析在金融、能源管理、气候科学、自然科学和...……更多
把Waymo玩成GTA游戏!全生成式的车辆行驶轨迹视频合成器来了
...所需视角,以控制图像生成结果。 FreeVS 方法训练数据与推理效果示例。即使训练数据中无车辆横向移动到逆行车道的例子,生成模型仍然可依靠侧向相机的训练对((c)->(a))学习相机的侧向移动,从而生成合理的高质...……更多
更多关于科技的资讯:
小米终结特斯拉销量神话
外媒惊呼,特斯拉神话已经被小米终结了。在中国市场,特斯拉Model 3的销量已经被小米SU7超越。连外国网友也不由惊叹小米SU7的实力
2025-03-08 13:45:00
“实习生也月入过万”,这一行业严重缺人
作者: 张旦珺市场对寻求AI人才的渴望,到了按图索骥的程度。晚点latepost曾在报道中记录过这样一个细节:当一位投资人循着AI论文上的名字一个个去拜访时
2025-03-09 03:32:00
英特尔酷睿Ultra 9 285H性能实测:50W超越前代90W性能
年初英特尔正式发布了英特尔酷睿Ultra 200H标压处理器,该系列对应上一代酷睿Ultra 100H系列处理器,最高规格为16核CPU+8核GPU的配置
2025-03-08 22:45:00
直屏回归!小米16 Pro采用全新设计
近期,知名数码博主数码闲聊站带来了一则消息:即将在10月左右发布的迭代旗舰手机,将普遍转向直屏设计,并引入LIPO这一前沿技术
2025-03-08 23:15:00
《哪吒2》让新加坡发行方惊到了:排片量位居首位
3月8日消息,据媒体报道,当地时间3月6日,《哪吒之魔童闹海》在新加坡33家电影院全面上映。据悉,目前该影片的排片量在新加坡所有正在上映的电影中居首位
2025-03-09 00:16:00
上海迪士尼三月竟然改名字:网友热议
3月9日消息,据媒体报道,上海迪士尼乐园的名字被改成了“迪士妮乐园”。对此,有网友表示,这不是迪士尼第一次改名。此前上海迪士尼度假区公众号发文称
2025-03-09 00:16:00
《黑神话》立功!Steam中国玩家激增:简体中文用户占比已突破50%
根据Automaton的消息称,在上个月V社发布了最新的Steam硬件和软件调查,结果显示:截至2025年2月,简体中文用户数量增加了20
2025-03-08 13:45:00
酒蒙子有救了!女子植入戒酒芯片称酒就像白开水
快科技3月8日消息,对于嗜酒如命的人而言,戒酒属实是个老大难的问题,不过随着科技的发展,一切皆有可能。据“成都市第四人民医院”官方报道
2025-03-08 14:15:00
何小鹏在央视采访中表示:机器人是汽车发展下一个形态之一
快科技3月8日消息,全国人大代表、小鹏汽车董事长何小鹏在接受央视采访时,深入探讨了智能网联新能源汽车及智能机器人的未来发展趋势
2025-03-08 14:45:00
女生每天自驾110公里跨市上班:是时候换台纯电车了
快科技3月8日消息,你能忍受最长的通勤距离是多远?有私家车的话每天跑100公里可能还行,但如果时间长度拉到10年呢?在河南荥阳
2025-03-08 14:45:00
小男孩如愿坐上小米SU7 Ultra 冲回家拿车模送车主
快科技3月8日消息,在这个看似平常的早晨,汽车博主@臧智渊却收获了一份意想不到的温暖与感动。当他的小米SU7 Ultra临时停在二环路边时
2025-03-08 14:45:00
犯罪片《最暖的归途》立项:《第二十条》同编剧
快科技3月8日消息,据灯塔专业版备案信息库,电影《最暖的归途》立项备案,备案单位北京光线影业有限公司、最高人民检察院影视中心
2025-03-08 15:15:00
小红书快成为新一代的App Store了
不是哥们,现在的开发者都这么野吗?老差友都知道,咱公众号时不时分享一些好玩、有趣的小软件。这些 App 我能第一时间知道
2025-03-08 15:15:00
最快300km/h!不少小米SU7 Ultra车主晒狂飙速度 雷军是否该限速
快科技3月8日消息,随着越来越多用户提车小米SU7 Ultra,那么上路后感受它的速度就是必不可少的操作了。已经有不少小米SU7 Ultra车主在社交媒体上晒视频
2025-03-08 15:45:00
超《复联3》近在咫尺!《哪吒2》票房破147亿
快科技3月8日消息,根据网络平台数据显示,全球动画电影票房榜冠军《哪吒之魔童闹海》总票房已突破147亿元人民币。目前,该片在全球票房排名中位列第7位
2025-03-08 15:45:00