新论,推理,符号,性能,任务,数据头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

o1带火的CoT到底行不行？新论文引发了论战

To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据

Claude自动玩崩铁清日常，NUS新论文完整测评AI电脑操

Claude操控电脑，究竟可以做到什么程度？新加坡国立大学团队在20多个场景下做了全面测试，其中最引人瞩目的是：AI可以自动玩手游清日常任务了！研究中选用了米哈游《崩坏：星穹铁道》，可以跟它说”帮我完成今天的模拟...……更多

2024-11-26 09:43:00新论,电脑,任务,模型,动作,测试

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

2022生成模型进展有多快，新论文盘点9类生成模型代表作

ChatGPT的出现，彻底将生成AI推向爆发。但别忘了，AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识……尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

算力直降97%，GPT-3存储只用20MB？！这篇新论文火了

好家伙！1750亿参数的GPT-3只需20MB存储空间了？！基于1.58-bit训练，在不损失精度的情况下，大幅节省算力（↓97%）和存储（↓90%）。最近，从事机器学习的Will小哥发了一篇论文，直接引来几十万网友or同行围观。他提出了一项...……更多

2024-12-30 09:11:00文火,新论,存储,训练,小哥,模型

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

揭示Transformer「周期建模」缺陷！北大提出新型神经

...中的商业周期、物理学中的电磁波，以及数学运算和逻辑推理等。因此，在许多任务和场景中，人们希望对周期进行建模，以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功，但是它...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

快科技10月13日消息，近日，苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...的文本，则展示了娴熟而准确的技能应用。表6呈现了，新论文所提出的方法，在4个案例中实现了最高准确率。总之，作者提出一个LLM提取元认知知识框架，其形式是根据解决问题所需的概念，对数学数据集中的问题进行分类的...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

让AI管理大型代码库，开发者福音 | 阿里/新加坡国立/西安

...。原论⽂的分析进⼀步指出，CodexGraph在处理不同难度的推理任务时，单⼀查询与多重查询策略的效果存在差异。在CrossCodeEval中，多重查询策略更有效；⽽在SWE- bench中，单⼀查询策略表现更佳。此外，去除Cypher LM agent会显著增...……更多

2024-08-12 09:49:00西安交大,新加坡,阿里,西安,开发者,福音

CPU,正在被AI时代抛弃？

...以通过语音识别技术被录入到病例系统中，随后大模型AI推理技术辅助进行智能总结和诊断，医生们撰写病例的效率显著提高。AI推理的应用不仅节省了时间，也保护了患者隐私；在法院、律所等业务场景中，律师通过大模型对...……更多

2024-07-11 16:45:00正在,时代,模型,推理,英特,英特尔

大模型不会推理，为什么也能有思路？有人把原理搞明白了

...——从许多文档中综合程序性知识并进行类似的推理。新论文的一作、UCL 在读博士 Laura Ruis 表示，该研究是基于对 5M 预训练文档（涵盖 25 亿个 token）对事实问题、算术、计算斜率和线性方程的影响的分析。总而言之，他们为...……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

智谱AI CEO张鹏：大模型更聪明了开发者门槛降低

...百页的上下文窗口长度，具备更强的多模态能力，更快的推理以及更高并发，还大大降低了推理成本。 “一直以来，普通用户甚至是开发者，需要用像魔法咒语一样的提示词，或者机器才能解读执行的代码，来调用大模型的各...……更多

2024-01-17 09:53:00张鹏,开发者,门槛,模型,开发,张鹏

大模型是否有推理能力？DeepMind数月前的论文让AI社区

...《给小学数学题加句「废话」，OpenAI o1 就翻车了，苹果新论文质疑 AI 推理能力》）。这种现象被归结为「当前的 LLM 无法进行真正的逻辑推理；相反，它们试图复制在训练数据中观察到的推理步骤」。然而，事实真的是这样吗...……更多

2024-10-23 12:05:00推理,模型,能力,论文,社区,模型

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型