推理,模型,能力,论文,社区,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...，随着 OpenAI o1 模型的推出，关于大型语言模型是否拥有推理能力的讨论又多了起来。比如苹果在前段时间的一篇论文中指出，只要给模型一些干扰，最聪明的模型也会犯最简单的错误（参见《给小学数学题加句「废话」，OpenAI ...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...很多不同的GPU型号和显存大小。再加上，目前广泛应用于推理阶段的量化技术，比如可以用FP16或FP8精度，这会改变推理和训练/微调成本的比重。以上这些限制因素，都让模型规模的选择成为一个非常具有挑战性的问题。总体而...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

百倍提升7B模型推理能力！颜水成团队携手新加坡南洋理工大学发

...-7b等小模型达到参数量比其大数十倍、甚至上百倍模型的推理能力，使模型性能迎来惊人提升。自OpenAI的Q*项目曝光后，业内相关讨论始终层出不穷。据现有信息汇总，Q*项目被视作OpenAI在探索人工通用智能（Artificial General Intelli...……更多

2024-06-26 09:19:00南洋,水成,新加坡,理工大学,算法,推理

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

昇思MindSpore 2.3全新发布

...级实现脚本、分布式策略，运行时的统一，Baichuan2-13B的推理部署只需1天。在大模型推理上，通过LLMServing实现推理吞吐提升2倍多；升级模型压缩工具金箍棒2.0实现千亿大模型压缩至十倍。为降低开发门槛，昇思持续升级MindSpore...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

击败GPT-4o的开源模型如何炼成?关于Llama 3.1

...经远超计算最优的时长。结果表明，这些较小模型在相同推理预算下的表现优于计算最优模型。在后训练阶段，Meta 使用了 405B 的旗舰模型进一步提高了 70B 和 8B 模型这些较小模型的质量。3、为了支持 405B 模型的大规模生产推理...……更多

2024-07-25 09:32:00模型,论文,模型,训练,论文,开发

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

昆仑万维重磅发布天工AI高级搜索功能，做最懂金融投资、科研学

...AI高级搜索功能，具备四大亮点：·全面升级多层次分析推理能力·升级的金融投资专业AI搜索·升级的科研学术专业AI搜索·针对文档AI阅读分析的智能优化「天工AI高级搜索」不仅能提供精准的结果，更能通过多角度的专业优化，...……更多

2024-11-05 14:56:00天工,万维,昆仑,科研学术,搜索,重磅

大模型新趋势之MoE：现状、挑战及研究方向

...，MoE在训练过程通过门控模型实现“因材施教”，进而在推理过程实现专家模型之间的“博采众长”。图1MoE架构原理示意图1MoE的特征优势是专家化、动态化、稀疏化，在模型研发成本、训练/推理效率和整体性能之间实现最佳...……更多

2024-11-04 16:00:00研究方向,模型,现状,方向,趋势,研究

OpenAI 超强 o1 智商超 120 遥遥领先于其他模型

...的 agent，是关键的一步。而这篇论文就重点研究了扩展「推理期计算」（inference-time computation）这个问题。研究团队分析了扩展测试时计算的两种主要机制：（1）针对密集的、基于过程的验证器奖励模型进行搜索；（2）根据测...……更多

2024-09-18 09:49:00智商,选手,模型,博士,领先,年代

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

Llama版o1来了，来自上海AI Lab，强化学习代码已开

复刻OpenAI o1推理大模型，开源界传来最新进展：LLaMA版o1项目刚刚发布，来自上海AI Lab团队。简介中明确：使用了蒙特卡洛树搜索，Self-Play强化学习，PPO，以及AlphaGo Zero的双重策略范式（先验策略+价值评估）。在2024年6月，o1发...……更多

2024-11-06 09:49:00上海,代码,学习,训练,模型,蒙特卡洛

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...十亿左右。“做大”，能让大模型具备更强的涌现能力和推理能力，从而适用于难度更高的任务。“做小”，能让大模型获得更优秀的推理能力，从而能被部署到手机、手表、耳机、录音笔等各类小微终端之中。情景学习（ICL，...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

科学家推出大模型数据集，涵盖奥赛数学题，有望让AI辅导数学课

...解决复杂数学问题的能力。通过此，他们不仅提高了算法推理速度，还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100，也更加符合算法在复杂数学问题下的评价场景。目前，赵子龙的合作者正在基于本次成果开...……更多

2024-03-13 10:26:00数学,数学题,科学家,模型,辅导,课程

第一个100%开源的MoE大模型，7B的参数，1B的推理成本

...语言模型 (LM) 在各种任务上取得了重大进展，但在训练和推理方面，性能和成本之间仍然需要权衡。对于许多学者和开发人员来说，高性能的 LM 是无法访问的，因为它们的构建和部署成本过高。改善成本 - 性能的一种方法是使...……更多

2024-09-06 10:01:00推理,模型,成本,参数,模型,训练

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

推理性能直逼o1，DeepSeek再次出手，重点：即将开源

...出手了，这次又是重磅炸弹。昨晚，DeepSeek 上线了全新的推理模型 DeepSeek-R1-Lite-Preview，直接冲击 OpenAI o1 保持了两个多月的大模型霸主地位。在美国数学竞赛（AMC）中难度等级最高的 AIME 以及全球顶级编程竞赛（codeforces）等权...……更多

2024-11-22 09:50:00推理,性能,再次,重点,模型,推理