推理,模型,思维,语言,社区,语言头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量语料学会生成文本，那...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

蚂蚁自研知识增强大模型服务框架KAG，可显著提升知识推理准确

...地，也一定要对时间、数字和逻辑敏感，无论让它做多跳推理，还是逻辑规则数字计算，而这些恰好是大语言模型所不擅长的，包括前一段时间热议的 9.9 和 9.12 比大小的例子。基于此，我们认为在垂直领域落地的时候，大语言...……更多

2024-09-13 13:33:00知识,准确率,推理,蚂蚁,框架,模型

清华团队提出大模型“密度定律”；足球领域首个视觉语言基础模型

...交视觉-语言-动作建模框架RevThink：使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术分享群」。SwiftEdit：50 倍速文本引导图像...……更多

2024-12-10 09:53:00模型,语言基础,清华,定律,密度,团队

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

科学家竞相破解大型语言模型背后的谜团

...复杂行为。面对复杂问题，人类在潜意识里会进行分步骤推理。受此启发，谷歌团队2022年引入了“思维链提示”，以描述一种让LLM展示其“思维”的方法。简单来说，思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多

2024-05-18 02:42:00谜团,科学家,模型,背后,语言,科学

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

谷歌最新自然语言推理算法

谷歌发布全新反向推理算法LAMBADA，无惧搜索空间爆炸！自动推理绝对算是自然语言处理领域的一大难题，模型需要根据给定的前提和知识推导出有效且正确的结论。尽管近年来NLP领域借着大规模预训练语言模型在各种「自然语...……更多

2023-01-09 21:57:00自然语言,算法,推理,自然,语言,目标

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

微软华人团队发布全新基准AGIEval，专为人类考试而生

...2.5%，表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练，文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来，大型基础模型如GPT-4...……更多

2023-05-13 21:28:00微软,基准,专为,团队,人类,全新

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...ion模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。新模型具体如何推理，直接上实例，比如问题是：减去所有的小亮球和紫...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

郑小林:建立思维链的AI 具有里程碑意义

...段即对话式AI，AI能解决语言交互问题；第二阶段是具备推理阶段；第三阶段，AI能感知物理世界并与物理世界实现交互；第四阶段，AI将进入创新领域，具备开创新想法和技术的能力；到了第五阶段，AI将具备战略思维和自我管...……更多

2024-09-27 07:04:00小林,里程,里程碑,思维,意义,小林

ChatGPT大流行的思考-解析篇

...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢？我们不妨从人类学习思路入手，我们学习一般可分为获取知识-存储知识-推理知识-更新知识，而这也是GPT发展及学习的...……更多

2023-02-17 21:00:00知识,模型,推理,数据,方法,学习

人工智能已经可以解决复杂的数学问题了，还有哪些工作无法被取代

...决数学问题的系统，它是一个组合了自然语言处理和数学推理的系统。这个系统的作用是帮助计算机理解自然语言中的数学问题，从而能够通过推理和计算得出问题的答案。具体来说，这个系统包括多个子系统，包括自然语言处...……更多

2023-02-24 18:22:00人工智能,人工,数学,智能,问题,工作

超越ChatGPT：人类特有的思维要强化

...据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足，可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽管ChatGPT可以“写”出人机莫辨的论文、诗歌，但当你尝试问它类似这样的问...……更多

2023-02-14 06:05:00思维,人类,思维,关联,教育,学习

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

OpenAI-o1思考替代法火了！焦剑涛高徒一作提出思考偏好

...，大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务，一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究，被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多

2024-10-29 09:58:00高徒,偏好,模型,过程,基线,偏好

9.11和9.9哪个大？实测12个大模型8个都答错，Chat

...模型的短板，此前行业也多次讨论过大模型的数学和复杂推理能力较差，即便是目前最好的大模型GPT-4也仍然有很大进步空间。最近的一次，第一财经曾在6月报道过，根据司南评测体系OpenCompass的高考全卷测试，包括GPT-4在内，7...……更多

2024-07-17 11:56:00实测,模型,模型,数学,小数,问题

Bengio团队提出多模态新基准，直指Claude 3.5和

...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。然而，可能很多人并没有意识到，很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

数学不太好的文科生

...大模型加入数学领域的解题算法。“OpenAI说GPT-4有强大的推理能力,我感觉主要指的是它的数学水平高。”赵海告诉记者,“其实,推理能力包含逻辑推理能力和数学抽象思维能力,这两种能力是有区别的,前者侧重寻找因果关系。相...……更多

2023-03-16 09:23:00文科生,文科,数学,赵海,模型,能力

AI发展变慢了？几位AI头部创业者并不赞同

...月份发布的GPT-4o（多模态语言大模型），9月份发布的o1（推理大模型），质量都可圈可点。与去年相比，他认为，今年AI行业的特色是，之前只有OpenAI一家独大，现在已经变成了群雄并起、你追我赶的状态，各家公司都在提速。...……更多

2024-09-21 13:52:00创业者,头部,创业,发展,模型,大昕

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...-preview和o1-mini模型已经可以使用。OpenAI宣布，“新模型在推理能力上代表了人工智能能力的新水平，因此，计数器将重置为1”。根据OpenAI的自测，o1在竞赛编程问题（Codeforces）中排名第89个百分点，在美国数学奥林匹克竞赛（AIM...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

智能体首达Kaggle Grandmaster,华为结构化推

...中的表现，研究者们提出了各种提示策略来提升大模型的推理和规划能力，比如思维链、思维树和思维图谱。这些进步与工具集成一起，推动着通用 AI 智能体的发展，让它们现在已经能够用 LLM 输出的决策策略来解决序列决策问...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

不止反击，谷歌在AI群隔空@所有人

...得罗夫（Slav Petrov）说。皮查伊具体称，“PaLM 2在逻辑和推理方面进行了广泛的训练，具有极强的逻辑和推理能力。”我们知道，ChatGPT-4作为其中知名的一个代表大模型，其功能的强大已无需赘言，尤其是在逻辑推理和数学表现...……更多

2023-05-11 23:00:00所有人,模型,语言,训练,能力,搜索

商汤科技与金山办公达成商业合作，“日日新”大模型补强办公软件

...直是大模型的痛点，理科领域需要高度的抽象思维和逻辑推理能力，并且要求非常精准的答案，作为计算机科学和信息技术领域的重要工具，代码能力被视作衡量大模型智慧的关键维度。事实上，在过去一年国产大模型如火如荼...……更多

2024-04-12 15:11:00商汤,办公,补强,金山,办公软件,理科

page 1/6667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

共享充电宝的故事，讲到头了？

作者：王璐“共享充电宝第一股”怪兽充电，可能要退市了。1月6日，怪兽充电发布公告称，接到中信资本旗下“信宸资本”及公司管理层提交的初步非约束性建议书

2025-01-13 04:54:00

特斯拉焕新版Model Y细节曝光：新增前保险杠摄像头支持

快科技1月12日消息，日前，特斯拉在中国及澳大利亚市场推出了焕新版Model Y。新车型不仅在外观设计上进行了更新，还升级了内饰配置

2025-01-12 16:22:00

何小鹏亲自官宣：小鹏X键自定义“Say Hi”功能下季度回归

快科技1月12日消息，1月12日，小鹏汽车董事长何小鹏在易车平台转发了用户因天玑新版本取消了X键自定义“Say Hi”功能而选择不升级车机系统的情况

2025-01-12 16:52:00

励志！脑瘫小伙戴脑起搏器健身房撸铁6年

快科技1月12日消息，据媒体报道，近日，云南红河一位脑瘫小伙的励志故事登上了热搜。这位小伙因出生时缺氧导致脑瘫，但他通过戴脑起搏器坚持健身六年

2025-01-12 16:52:00

雷蛇推出掌机扩展坞：带可调节支架、支持RGB灯效

快科技1月12日消息，雷蛇针对掌机用户推出了一款新的产品：Razer 雷蛇掌机拓展坞幻彩版。据悉，这款扩展坞也支持平板电脑

2025-01-12 16:52:00

小鹏汽车回应G9被盗事件：已排除数字钥匙被破解可能

快科技1月12日消息，小鹏汽车品牌公关负责人@XP-阿莱克氏Alex今日在微博回应湖北一位G9车主车辆被拉门盗窃事件。据悉

2025-01-12 17:52:00

市场大逆转！Puget：AMD CPU份额突破55% 三年来

快科技1月12日消息，根据Puget Systems的最统计数据，AMD处理器在2024年第四季度的总订单销量占比达到了55%

2025-01-12 17:52:00

曝小米汽车向中国移动采购25万张M2M USIM卡

快科技1月12日消息，据媒体报道，中国移动采购与招标网显示小米汽车向中国移动采购了25万张M2M USIM卡，供应商为捷德（江西）技术有限公司

2025-01-12 17:52:00

锐龙9 9000X3D性能提升！华硕首家发布X870/670

快科技1月12日消息，华硕发布了AGESA 1.2.0.3主板更新，适用于其X870和X670系列主板，主要提升AMD锐龙CPU的性能

2025-01-12 18:52:00

国内首条！穿越钱塘江高铁隧道盾构机顺利启动

快科技1月12日消息，据报道，新建铁路杭州萧山机场站枢纽及接线工程（以下简称“杭州机场高铁”）钱塘江隧道“钱塘号”盾构机顺利启动

2025-01-12 18:52:00

AMD高管：RX 9070系列显卡性能比泄露的更强！

快科技1月12日消息，在CES 2025展会期间，AMD的首席游戏解决方案和游戏市场架构师Frank Azor接受了PCWorld的采访

2025-01-12 19:22:00

迷你机用上AMD最强APU！极摩客全球首发锐龙AI Max+

快科技1月12日消息，极摩客官方表示，将联合AMD全球首发搭载锐龙AI Max+ 395这一最强APU的迷你PC，预计在今年一二季度上市

2025-01-12 20:52:00

扎克伯格火力全开！炮轰苹果缺乏创新、苹果税成遮羞布

快科技1月12日消息，Meta CEO扎克伯格近日参加了Joe Rogan Experience播客节目，在节目中扎克伯格指出

2025-01-12 21:22:00

20MW量级！中国中车“启航号”漂浮式风电机组成功吊装

快科技1月12日消息，据报道，全球最大功率等级漂浮式风电机组 —— 中国中车“启航号”在山东东营风电装备测试认证创新基地成功吊装

2025-01-12 21:22:00

数智技术赋能产业发展湘江实验室再发布10项科技创新产品

本文转自：人民网-湖南频道论坛现场。受访单位供图人民网长沙1月12日电 1月11日，湘江实验室产品发布暨“四算一体”高端论坛在湖南工商大学湘江楼举行

2025-01-12 21:22:00

头条订阅服务