• 我的订阅
  • 头条热搜
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...健性。 尤其需要注意,随着任务难度提升,Dualformer 的优势也会增大。对于最大的 30×30 迷宫,Dualformer 的 1-Optimal-64 成功率是仅解答模型的 2.8 倍,在 3-Optimal-64 上是 2.97 倍。Dualformer 的 SWC 分数也比基线高……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...务的模型,在A*搜索算法生成的路径上训练而来,在路径规划任务(如迷宫、推箱子游戏)上表现良好,可以以更高效率找到最优解。研究发现,人类会在思考过程中倾向于找捷径。为了更进一步模拟人类,Dualformer在随机推理轨...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...对状态进行最佳优先搜索,实现了对复杂推理任务的全盘规划,从而提升开源模型在推理任务上的性能。其中g(s_t)表示当前轨迹中的多个历史状态,既{s1,...,s_t},的聚合收益。具体g(s_t)的函数形式可以通过人为定义,例如判断当...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...续性记忆,不能推理(只要推理的定义是合理的)、不能规划。」Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...,代码也即将在近期开源。大模型如何统一具身指令导航规划?不同的导航任务要求截然不同的能力,经典的物体导目标航任务需要理解房间结构和物体之间的联系,视觉语言导航任务侧重于严谨地遵循指令,而新兴的需求驱动...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
理想的智能驾驶,到底「City 不 City」?
...能够在各种道路条件下行驶; 绕行丝滑:具备时空联合规划能力,对道路障碍物的避让和绕行更加流畅;路口轻松:通过超视距导航选路能力,在复杂路口也能顺畅通行;默契安心:考虑用户心理安全边界,实现分米级微操,...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
o1带火的CoT到底行不行?新论文引发了论战
...问题上为 MMLU 和 MMLU Pro 带来助益。CoT 在形式推理方面的优势和劣势下面来解释 CoT 有助于符号推理任务的原因。很多符号和半符号推理任务都可以分成两个阶段:规划与执行。该团队也基于此思路进行了分析。设置 1 和 2:少样...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...,并生成高保真度、一致性强的新视角视频。△相机轨迹规划算法此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...boMamba图 1. RoboMamba 具备的机器人相关能力,其中包括任务规划、提示性任务规划、长程任务规划、可操纵性判断、可操纵性生成、未来与过去预测、末端执行器位姿预测等。摘要机器人操纵的一个基本目标是使模型能够理解视觉...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...ew在规划任务上,表现显著优于o1-mini。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个...……更多
...,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步骤包括:在预训练阶段,MCTS模块在特定任务上进行预训练,以学习有关有效思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预...……更多
机器学习和人工智能在各行各业掀起了新的变革浪潮
...程。虽然大语言模型陆续开发了上下文敏感记忆、多步骤规划和战略性工具等高级功能,但这些“智能体”在执行任务时通常无法吸取历史经验,从而导致其解决问题的能力效率低下。来自清华大学、大连理工大学和北京邮电大...……更多
行业丨抢滩下一个高地,分布式云计算迎来黄金发展期!
...现低延迟的实时AI推理,提升用户体验。分布式云计算的优势高可靠性分布式系统通过将数据分散存储在多个节点上,实现了数据的冗余备份和容错处理,提高了系统的可靠性。可扩展性分布式云计算可以根据需求按需增加或减...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...抓取需要全面的语义理解、场景感知、决策和稳健的控制规划。具身抓取方法将传统的机器人运动学抓取与大型模型(如大语言模型和视觉语言基础模型)相结合,使智能体能够在多感官感知下执行抓取任务,包括视觉主动感知...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...高效的变体,即群体相对策略优化 (GRPO)。这两者主要在优势值的计算方法上不同:PPO 使用一个网络来估算状态值,并通过广义优势估算 (GAE) 技术来计算优势值;而 GRPO 则简化了这个过程,直接使用标准化的奖励信号来估算动作...……更多
车企争抢L3路试牌照,谁会是宝马奔驰后的下一批?
...车道划线,对车道的定位观感更加准确。由于感知模型的优势,采用该类感知模型的车型都会更容易获得L3路试牌照。华为虽然现在并没有公布公布L3级自动驾驶进度,但网传华为将参与L3级自动驾驶相关标准的制定。本月稍早前...……更多
行业第一梯队智驾稳了!理想端到端+VLM智驾体验
...接管通过闸机、高速ETC收费站方面,理想还有明显的领先优势。One More Thing这次的智驾体验路线目的地是广州中汽研检验中心,理想汽车此次包场测试,还带来了即将为车主推送的全速域无上限激活的AEB紧急制动和全自动紧急转...……更多
...发了一种新的方式,帮助人工智能(AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...、「诗词赏析」这类比较具有中文特色的问题,CoE的领先优势更加明显。目前,360的「多模型协作」已经能打败并远远甩开GPT-4o,媲美o1-preview。这就是复仇者联盟的力量,即使灭霸的能力再强,团结起来的团队,依旧是强大、...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...无法完全替代预训练的扩展,但已显示出在某些情况下的优势。引发网友热议这项研究被网友po出来后,引发热议。有网友甚至表示这解释了OpenAI“草莓”模型的推理方法。为什么这么说?原来就在昨晚半夜,外媒The Information放...……更多
Scaling Law瓶颈,Cursor编程为什么这么强?新研究掏出秘密武器
...基础模型表现得好很多,但当需要生成多个答案时,这种优势就不明显了 —— 在某些情况下,甚至完全相反。模型在生成答案时缺乏多样性,这对于搜索的效果非常不利。特别是在极端情况,比如采用「贪心解码」,模型给出...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...标进行训练,旨在最小化预测点和原始点之间的差异。在推理和下游任务应用中,预训练的 UniTraj 编码器可以作为通用特征提取器,通过简单的适配器训练,即可支持多种轨迹相关的分析任务,如分类、预测和异常检测等。实验...……更多
大模型推理乘上RISC-V快车?国内AI芯片创企推大模型系列一体机
...场算力需求提供了在用户高并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下,希姆计算的大模型...……更多
商汤生成式AI业务飙涨256%,成为中国大模型、智算服务市场占有率领头羊
...发展时期,我们正处于下一波增长的有利位置。商汤核心优势在于‘大装置+大模型’深度协同,具备打造对标一流的大模型能力,在原生多模态、视频流自然交互,以及低成本模型推理架构上构建独特的优势,从而在激烈的市...……更多
...专属大模型、提升训推效率和精度、降低落地门槛等多重优势。 从容大模型训推一体机则基于华为最新Atlas900系列训练服务器,预置从容大模型训练推理一体化平台。平台适配国产化芯片,通过工程优化,实现和英伟达芯片的...……更多
智谱AI新一代基座大模型GLM-4在司南评测中跻身前列,位居国内第一
...验室在榜单发布同时表示:“中文场景下国内的模型更具优势,中文闭源大模型接近GPT-4 Turbo的水平。”OpenCompass 2.0全面量化模型在知识、语言、理解、推理和考试等五大能力维度的表现,客观中立地为大模型技术创新提供坚实...……更多
更多关于科技的资讯:
传美国计划将算能科技列入实体清单!被指偷偷找台积电代工
据路透社援引消息人士的话报道称,美国政府计划将中国科技公司中国厦门算能科技(SOPHGO)列入美国商务部的实体清单,理由是认为其充当了其他被禁企业间接获取台积电产能的角色
2024-12-21 12:02:00
主机硬件大战:微软Xbox 、索尼PS只能活一个 你会选谁
快科技12月21日消息,市场研究公司DFC Intelligence最新报告显示,下一世代索尼和微软两台游戏机“只能活一个”
2024-12-21 12:02:00
10年做到100万台!机械革命游戏本的昨天、今天、明天
如果要买一台既有高性能、还有高性价比的游戏本,你会考虑哪个品牌?是联想、华硕、惠普这些传统大厂?还是机械革命、雷神、机械师这些新兴品牌
2024-12-21 12:32:00
垄断真可怕!RTX 5090、5080售价再曝光:英伟达让两者相差近万元
快科技12月21日消息,随着2025年的CES展会临近,英伟达RTX 50系列也即将揭开神秘面纱,你是不是已经在持币等买了呢
2024-12-21 13:02:00
iPhone用户的五大痛点!2025年库克能给解决了吗
年末了,是时候盘点和思考这一年的收获。2024年的智能手机市场确实精彩,国产手机竞争激烈,苹果这一年在中国市场感受到了前所未有的压力
2024-12-21 13:02:00
《英雄联盟:双城之战2》首次全集限免:B站、腾讯视频免费看
快科技12月21日消息,《英雄联盟:双城之战》官方介绍,第二季全集限免将于12月28日16:00正式开启,届时在腾讯视频和B站可免费观看全集
2024-12-21 13:32:00
考研政治有多难 名师肖秀荣:近十年最难的一次
快科技12月21日消息,今日上午,2025年全国硕士研究生招生考试初试开考,上午11时30分,思想政治理论或管理类综合能力考试结束
2024-12-21 13:32:00
高通打赢芯片诉讼!未违反Arm许可协议
快科技12月21日消息,当地时间周五,高通公司在与芯片设计公司Arm进行的一场诉讼中取得胜利。据悉,Arm此前指控高通通过收购芯片创业公司Nuvia获得并使用了Arm的技术
2024-12-21 10:01:00
快买正版!国际唱片业:现在中国互联网每天上百万AI做的音乐都是非法盗版
快科技12月21日消息,国际唱片业协会大中华区总兼中国区首席代表郭彪公开表示,现在中国互联网上每天有上百万AI做的音乐
2024-12-21 10:01:00
女子每天凌晨2点多被隔壁鸡鸭声惊醒:一波接一波根本停不下来
12月21日消息,有过农村生活经验的朋友对公鸡打鸣肯定不陌生,这些叫声非常嘹亮,在安静的凌晨能传出非常远的距离。而且如果有多只公鸡
2024-12-21 10:31:00
于东来直播员工午休打麻将引围观:要让员工每周工作36小时、月薪8千+
快科技12月21日消息,一个企业的老板,公开直播手下员工打麻将,这是什么体验?昨天于东来个人账号开播,带网友云逛胖东来办公区域
2024-12-21 10:31:00
周鸿祎:AGI发展遇瓶颈 智能体和专业大模型将扛大旗
快科技12月21日消息,近两年AI发展迅速,但目前种种迹象表明,一些AI巨头寄予厚望的AGI(通用人工智能)之路似乎已经遭遇瓶颈
2024-12-21 10:31:00
江苏:2024世界智能制造大会在南京开幕
本文转自:人民网2024年12月20日,以“加快打造智能制造升级版,因地制宜发展新质生产力”为主题的2024世界智能制造大会在南京开幕
2024-12-21 11:10:00
大众帮办|遭美团强制调低房价,百元酒店陷“低价内卷”困局
“美团一单能给我们调低20元,现在快到年底了,调价幅度又要加大,调价助手又关不掉,后期也不给商家补偿,有时候害怕进订单
2024-12-21 11:18:00
三年破万!小鹏汽车欧洲第10000辆交付:中国新势力第一
快科技12月21日消息,小鹏汽车达成了一项新成就——首家在欧洲市场交付达成1万辆的中国造车新势力,这距离其首次向欧洲出口汽车仅3年时间
2024-12-21 11:31:00