• 我的订阅
  • 头条热搜
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...健性。 尤其需要注意,随着任务难度提升,Dualformer 的优势也会增大。对于最大的 30×30 迷宫,Dualformer 的 1-Optimal-64 成功率是仅解答模型的 2.8 倍,在 3-Optimal-64 上是 2.97 倍。Dualformer 的 SWC 分数也比基线高……更多
Meta版慢思考来了!田渊栋团队整合快慢思考,能走迷宫推箱子
...务的模型,在A*搜索算法生成的路径上训练而来,在路径规划任务(如迷宫、推箱子游戏)上表现良好,可以以更高效率找到最优解。研究发现,人类会在思考过程中倾向于找捷径。为了更进一步模拟人类,Dualformer在随机推理轨...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...为了解决以往工作的局限性,他们在模型中集成了明确的规划和推理功能,增强了其自主导航和与复杂数字环境交互的能力。他们构建了一个大规模的 GUI agent 轨迹数据集,整合了多模态推理和接地(grounding),并采用了两阶段...……更多
百倍提升7B模型推理能力!颜水成团队携手新加坡南洋理工大学发布Q*算法
...对状态进行最佳优先搜索,实现了对复杂推理任务的全盘规划,从而提升开源模型在推理任务上的性能。其中g(s_t)表示当前轨迹中的多个历史状态,既{s1,...,s_t},的聚合收益。具体g(s_t)的函数形式可以通过人为定义,例如判断当...……更多
LeCun 的世界模型初步实现!基于预训练视觉特征,零样本规划
...续性记忆,不能推理(只要推理的定义是合理的)、不能规划。」Yann LeCun 批评 LLM 的推文之一相反,他更注重所谓的世界模型(World Model),也就是根据世界数据拟合的一个动态模型。比如驴,正是有了这样的世界模型,它们才...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...引导模型解决问题的过程,如对问题的理解、知识回忆、规划、执行、反思、总结等。模型在面对复杂任务时,会显式且动态地选择元动作,再进一步展开相关动作的具体思维过程。通过这种设计,利用部分训练任务,可强化模...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...,代码也即将在近期开源。大模型如何统一具身指令导航规划?不同的导航任务要求截然不同的能力,经典的物体导目标航任务需要理解房间结构和物体之间的联系,视觉语言导航任务侧重于严谨地遵循指令,而新兴的需求驱动...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...贯性,对推理并不重要,而一些关键 token 则需要复杂的规划,给 LLM 带来了巨大的挑战。为了探索 LLM 在不受限制的潜空间中进行推理的潜力,而不是使用自然语言,他们提出了一种新的范式——可持续思维链(Coconut)。他们利...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
LLM仍然不能规划,刷屏的OpenAI o1远未达到饱和
实验证明,大模型的 System 2 能力还有待开发。规划行动方案以实现所需状态的能力一直被认为是智能体的核心能力。随着大型语言模型(LLM)的出现,人们对 LLM 是否具有这种规划能力产生了极大的兴趣。最近,OpenAI 发布了 o1 ...……更多
理想:升级版端到端+VLM、AI推理可视化交互系统 将于月底全量推送
...系统1模型实时推理出的10种模态轨迹,每种模态代表一种规划决策,系统会选出当下的最优的决策轨迹。而系统2 VLM(视觉语言模型),它能理解交通规则,读懂路牌的标识,分析复杂的路况,可以说双系统就是文武双全。通过这...……更多
理想的智能驾驶,到底「City 不 City」?
...能够在各种道路条件下行驶; 绕行丝滑:具备时空联合规划能力,对道路障碍物的避让和绕行更加流畅;路口轻松:通过超视距导航选路能力,在复杂路口也能顺畅通行;默契安心:考虑用户心理安全边界,实现分米级微操,...……更多
大模型不会推理,为什么也能有思路?有人把原理搞明白了
大模型不会照搬训练数据中的数学推理,回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理,在今年 6 月,一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多
阿里妈妈首提AIGB并实现大规模商业化落地,将正式开源Benchmark
...跌。而 DiffBid 可以明显减少这种问题除了实际线上效果的优势外,相比于其他方法,DiffBid 还具有其他两方面的优势。首先,相比于通过端到端方法直接输出 Bidding 信息,DiffBid 生成的轨迹信息具有更好的可解释性(图 4)。有助...……更多
阿里多模态检索智能体,自带o1式思考过程!复杂问题逐步拆解
...系列基准数据集上的实验中,OmniSearch展现了显著的性能优势。特别是在处理需要多步推理、多模态知识和快速变化答案的问题时,OmniSearch相较于现有的mRAG方法表现更为优异。目前OmniSearch在魔搭社区还有demo可玩。动态检索规划...……更多
o1带火的CoT到底行不行?新论文引发了论战
...问题上为 MMLU 和 MMLU Pro 带来助益。CoT 在形式推理方面的优势和劣势下面来解释 CoT 有助于符号推理任务的原因。很多符号和半符号推理任务都可以分成两个阶段:规划与执行。该团队也基于此思路进行了分析。设置 1 和 2:少样...……更多
京东云:智能体大规模“上岗”,企业深度应用正当时
...混合代理模型(Mixture-of-Agents,MoA),融合大小型模型的优势,通过规划推理构建动态DAG执行引擎,大幅提升任务执行效率;集成了覆盖搜索、数据分析、代码开发等领域的丰富工具链,支持文本、图像、视频等多模态输入输出...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量语料学会生成文本,那...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...,并生成高保真度、一致性强的新视角视频。△相机轨迹规划算法此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一...……更多
MiniMax进化论:一群「偏执者」的破浪前行
...用创新,其典型代表比如cursor、lovart、manus。 因为Agent的优势之一,就是可以通过多步操作集成达成更直观可用的结果。而一个惊艳的成果展示,往往就是一个技术从实验室到产业加速的重要转折点,这次出圈的Hailuo Video Agent也...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
...模型,赋予 AI 大模型对于 4D 空间的理解、生成、常识和推理的能力,实现 4D 空间中的交互和行动,走向通用空间智能。通用空间智能对于影视游戏、元宇宙等虚拟空间的内容创作,以及自动驾驶、具身智能等物理空间的数据生...……更多
听得懂、看得见、找得到!理想汽车下一代自动驾驶架构MindVLA亮相
...术基于端到端和VLM双系统架构,通过3D空间编码器和逻辑推理生成合理的驾驶决策,并利用扩散模型优化驾驶轨迹,整个过程需在车端实时运行。 MindVLA采用3D高斯作为中间表征,利用海量数据进行自监督训练,显著提升下游任...……更多
联想发布超级智能体矩阵,端侧AI开启规模化落地
...安全、合规和治理的要求,就构成了联想混合式人工智能优势集。通过释放优势集的潜力,帮助企业全方面实现智能化应用,联想将最终实现企业智能双胞胎的愿景。 依托优势集的技术赋能,联想致力于为企业打造覆盖全业务...……更多
o1规划能力首测!已超越语言模型范畴,preview终于赢mini一回
...ew在规划任务上,表现显著优于o1-mini。相比于传统模型的优势更是碾压级别,在超难任务上的准确率比Llama3.1-405B高了11倍。要知道之前,OpenAI自己人也发了一张图,显示preview论性能比不过满血版,论经济性又不如mini,处于一个...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...boMamba图 1. RoboMamba 具备的机器人相关能力,其中包括任务规划、提示性任务规划、长程任务规划、可操纵性判断、可操纵性生成、未来与过去预测、末端执行器位姿预测等。摘要机器人操纵的一个基本目标是使模型能够理解视觉...……更多
...,并在Gameof24、8-Puzzle和PocketCube等严苛测试中展现出明显优势。XOT框架的关键步骤包括:在预训练阶段,MCTS模块在特定任务上进行预训练,以学习有关有效思维搜索的领域知识。策略和价值网络指导搜索过程。在推理过程中,预...……更多
机器学习和人工智能在各行各业掀起了新的变革浪潮
...程。虽然大语言模型陆续开发了上下文敏感记忆、多步骤规划和战略性工具等高级功能,但这些“智能体”在执行任务时通常无法吸取历史经验,从而导致其解决问题的能力效率低下。来自清华大学、大连理工大学和北京邮电大...……更多
行业丨抢滩下一个高地,分布式云计算迎来黄金发展期!
...现低延迟的实时AI推理,提升用户体验。分布式云计算的优势高可靠性分布式系统通过将数据分散存储在多个节点上,实现了数据的冗余备份和容错处理,提高了系统的可靠性。可扩展性分布式云计算可以根据需求按需增加或减...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...抓取需要全面的语义理解、场景感知、决策和稳健的控制规划。具身抓取方法将传统的机器人运动学抓取与大型模型(如大语言模型和视觉语言基础模型)相结合,使智能体能够在多感官感知下执行抓取任务,包括视觉主动感知...……更多
更多关于科技的资讯:
在数字经济浪潮奔涌、国企改革持续深化的时代背景下,绵阳安鼎元作为四川安州发展集团旗下专业的国有资产管理平台,勇立潮头,以深刻的变革意识和前瞻的战略视野
2025-11-27 10:07:00
厦门网讯(厦门日报记者 沈彦彦 王元晖)“政策一出台,咨询电话就没停过!”厦门厦旅国际旅行社有限公司湖滨东营业部负责人谢晓燕放下手中的咨询电话
2025-11-27 08:12:00
“脑”力全开!江西抢滩脑机接口新蓝海
当好莱坞经典电影《盗梦空间》描绘的人类通过脑机接口潜入他人意识的场景,从科幻照进现实,一场关乎未来产业格局的竞赛已悄然启幕
2025-11-27 07:13:00
专利技术遭盗用,创新成果被侵犯,专利权人该如何维权?11月24日,市知识产权纠纷调委会通过一起实用新型专利侵权的调解案例释法
2025-11-26 08:11:00
感恩节“心”守护:灵动生活集团全链条心理服务破局,让3000万用户听见温暖的回响
当感恩节的暖意在街头巷尾流转,“守护”与“感恩”成为叩击人心的关键词。在心理健康已从“小众需求”转变为“全民刚需”的今天
2025-11-26 08:35:00
省发展改革委近日批复了山西省教育科技人才一体化服务产业云平台项目可行性研究报告,建设地址位于中北大学校内。作为山西聚焦“产学研用深度融合”的关键信息化基建项目
2025-11-26 08:41:00
为推动智能建造落地应用,搭建行业交流平台,近日,“晋塔”智能装备观摩活动在太原市多个施工项目同步启动。“晋塔”智能施工升降机
2025-11-26 08:42:00
经济热力站|绿色转型为基 金融创新为翼 科技赋能为核——助推首都经济高质量发展再上新台阶
11月19日,“京彩不设限・经济热力站”月度主题走访活动再度启程,记者跟随采访团先后走进北京绿色交易所、中国邮政储蓄银行北京分行及北京银行顺义科技研发中心
2025-11-26 10:06:00
赞皇县:AI赋能“一网通办” 业务办理效率提升70%
河北新闻网讯(次柳静)近日,石家庄市赞皇县数据和政务服务局依托DeepSeek大模型与智能算法,创新打造AI“智能填报”平台
2025-11-26 10:07:00
河北师范大学金融学院举行“产品经理人才共创培养体系”主题培训
河北新闻网讯 近日,河北师范大学金融学院邀请北京来学吧信息技术有限公司相关负责人到校,开展了主题为“产品经理人才共创培养体系”主题培训
2025-11-26 10:09:00
南京生物医药:研发“拔节孕穗”,产业新星闪耀
第91届全国药交会在宁落幕南京生物医药:研发“拔节孕穗”,产业新星闪耀□南京日报/紫金山新闻记者张甜甜连续3天,南京国际博览中心人流如织
2025-11-26 10:26:00
2025年两院院士增选结果揭晓 南京地区7人入选 在宁院士总数达102人
南报网讯(记者何洁张安琪)11月21日,2025年两院院士增选结果正式揭晓,选举产生中国科学院院士73人、中国工程院院士71人
2025-11-26 10:27:00
隐风文化:锚定四大理念,以精品力穿越短剧周期
由北京隐风文化科技有限公司出品的奇幻爱情短剧《岁岁怀安》延续预约150万的热度,上线后迅速跃居红果站内热播榜高位,这也是今年团队继《咬清梨》《怎敌她动人》之后
2025-11-26 11:06:00
视源股份荣获2024年度广东省科技进步一等奖
2025年11月20日,广东省人民政府正式发布《2024年度广东省科学技术奖通报》(粤府〔2025〕50号)。视源股份牵头完成的“高自然度智能交互显示终端关键技术及产业化”项目
2025-11-26 11:06:00
视源股份成为英特尔首批尊享级合作伙伴 合作再升级
近日,英特尔合作伙伴联盟完成战略升级,联盟最高等级“钛金级”正式更迭为“尊享级”。视源股份凭借其在计算机领域的深厚积累
2025-11-26 11:06:00