推理,模型,内心,人类,世界,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...到，人类大脑生成和解析语言的神经网络并不负责形式化推理，而且提出推理并不需要语言作为媒介。这篇论文声称「语言主要是用于交流的工具，而不是思考的工具，对于任何经过测试的思维形式都不是必需的」，引发了科技...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

研究人员给了人工智能一个“内心独白”，结果大大提高了其性能

...工智能系统，让它在说话前先思考。内心独白提高了常识推理能力，并使其数学成绩翻了一番。一项新的研究表明，给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统，会在对提示做出...……更多

2024-03-21 16:13:00人工智能,研究人员,独白,人工,内心,性能

OpenAI发布最新技术研究，AI“黑盒”不再是难题！

...出了正确回答。大部分大模型都在给出答案的同时呈现了推理过程。智谱清言给出的推理过程显示，在比较13.11%和13.8%时，13.11%是更大的数值。这是因为当比较两个百分数时，我们首先比较整数部分，如果它们相同，则比较小数...……更多

2024-07-18 09:47:00最新技术,难题,研究,技术,模型,小数

从通用人工智能到科学智能，“AI爱因斯坦”还远吗？

...需要像AlphaGo Zero那样，从围棋本身出发，具备自我学习、推理和创新能力，这样才可以达到通用人工智能。要实现这一目标，一是需要结合快思考的“黑盒”预测和慢思考的“白盒”逻辑推理，打造“灰盒”可信大模型；二是融...……更多

2024-07-08 09:54:00爱因斯坦,智能,人工智能,人工,科学,人工智能

对话云天励飞董事长陈宁：2030年人类将实现AGI，推理芯片

...拥有一个AI Agent。“如果说2024年是大模型落地应用之年，推理就会越来越重要。此前在训练芯片市场上，英伟达一骑绝尘，占有绝对的市场占有率，那么今天，推理芯片市场没有垄断性的巨头。这不仅是万亿级、万亿颗芯片的蓝...……更多

2024-03-30 18:00:00陈宁,云天,推理,董事长,芯片,董事

科学家竞相破解大型语言模型背后的谜团

...复杂行为。面对复杂问题，人类在潜意识里会进行分步骤推理。受此启发，谷歌团队2022年引入了“思维链提示”，以描述一种让LLM展示其“思维”的方法。简单来说，思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多

2024-05-18 02:42:00谜团,科学家,模型,背后,语言,科学

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

... 3.5依旧答错了。LeCun在此嘲讽大模型一番，大模型竟可以推理...？问题在于，LLM没有常识，不理解现实世界，也不会规划和推理。LLM行不行，就看提示了一位网友分析总结了，以上LLM失败的原因。他表示，LLM本身就是个「哑巴」...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

OpenAI没有放弃的机器人梦想

...人团队，理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据，研发受到了阻碍。当时，在美国创业孵化器Y Combinator的论坛上，BuzzFeed数据科学家马克思·伍尔夫（Max Woolf）直言：“一种可能准确但带有讽刺意味的观...……更多

2024-03-18 10:00:00机器人,机器,梦想,机器人,机器,模型

语音克隆达到人类水平，微软全新VALL-E 2模型让Deep

...零样本TTS依旧是一个有挑战性的问题。「零样本」意味着推理过程中，模型只能参照一段简短的陌生语音样本，用相同的声音说出文本内容，就像一个能即时模仿的口技大师。听到这里，不知道你会不会突然警觉——有这种能力...……更多

2024-07-25 09:34:00堪比,微软,配音,语音,模型,人类

AI表现直逼国际奥数优秀选手，它要 “征服”数学了吗？

...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力，训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶，往往意味着人类智慧极限的突破。迄今为止，解决或协助解决高等级数...……更多

2024-06-14 11:54:00奥数,选手,数学,国际,数学,数学家

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...感知未来视觉感知的 “北极星” 是以具身为中心的视觉推理和社会智能。如下图所示，不同于仅仅识别图像中的物体，具有具身感知能力的智能体必须在物理世界中移动并与环境互动，这需要对三维空间和动态环境有更透彻的...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

当Sora能做真实的3D视频，离它能设计战舰也就不远了

...Gemini Advanced在第三方双盲测试中击败了GPT-4，拥有极强的推理能力和长期记忆。2月10日，OpenAI的CEO奥特曼欲将OpenAI、各路投资者、合同芯片制造商和电源供应商联系起来，筹集7万亿美元的资金，打造庞大的芯片制造厂网络，为Ope...……更多

2024-02-21 18:30:00战舰,设计,视频,视频,生成,世界

蚂蚁井贤栋：通过专业智能体的深度连接，AI会像互联网一样带来

...型的“专业教材〞，供大模型训练学习，也能让大模型在推理中随时“翻阅”。这些“专业教材〞，是蚂蚁提升大模型的领域专业性、打造专业智能体的核心能力。以医疗行业为例，蚂蚁即将发布的“百灵医疗领域大模型”，背...……更多

2024-07-04 18:07:00代际,蚂蚁,深度,升级,互联网,智能

知乎 AI 革命：智能搜索与实时问答的融合

...生成，将这些答案里的有价值信息提炼出来，进行有效的推理，就能为一个 " 新鲜出炉 " 的专业问题提供一个立等可取的答案，提问的用户就可以能为快，然后再等其它的专业答主陆续赶到，下场答题。在灰度测试这个功能的...……更多

2024-03-31 21:00:00实时,问答,革命,智能,搜索,语料

AI投资时间｜绿洲资本张津剑：相比GPT技术本身，创业者更应

...烈烈的工业革命。也许国内的大模型和OpenAI 还差很远，推理成本还太高，芯片算力有不足，但对于绝大多数AI创业者来说，当前的这一切困难都是只是噪声。当下摩尔定律仍未失效，这些问题可以留给专业人士，18个月后这些成...……更多

2024-03-01 10:56:00创业者,绿洲,资本,影响,时间,创业

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...务设定多个小模型，并提供不同的参数训练，端到端减少推理成本。另外，将专用小 GPU 芯片置入到机器人中，也可提高任务实时性，目前特斯拉已在自动驾驶中尝试了这种做法。硬氪：今年有哪些细分场景的模型值得关注？王...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...业基准测试中达到了 SOTA，并提供了新的功能，如改进的推理能力。最强开源 LLM 来了Meta 官方博客写道，“得益于预训练和后训练的改进，我们的预训练和指令微调模型是目前 8B 和 70B 参数尺度下最好的模型。”他们表示，后期...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

神仙打架！谷歌新款大模型Gemini 和GPT-4谁能笑到最

...。谷歌表示，现有的人工智能模型通常只处理一种类型的推理，如图片或文本，而 Gemini 的设计是“多模式”的。这意味着它接受包括多种媒体类型的输入，组合文本、图像、音频、视频和编程代码。未来，谷歌还计划将 Gemini添...……更多

2023-12-07 16:15:00神仙,模型,观察,科技,模型,任务

大语言模型如何宣告心理学的死亡？

...数据的相关性连接，以及作为表征数据内部相关性连接的推理规则和推理方法。当这些连接达到一定的密度和连通性时，LLM似乎展现出了推理的能力。但这种能力更多是因为它们处理大量相关性连接时所表现出的复杂性，而不是...……更多

2024-02-09 15:00:00心理学,模型,语言,心理,人类,心理

港中文团队提出大模型元推理范式，革新大模型的评价体系

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队