局限性,推理,人类,任务,研究,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

人类和AI在推理任务中的表现相似，Google DeepMi

...是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度的影响，表现出类似的...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...一般。他们表示，这一发现有助于理解 LLM 的实际能力和局限性，并为未来的模型优化提供新的方向。智能涌现：只是“即兴表演”？AI 大模型的“涌现能力”来自哪里？它是否真如听起来那样神秘，甚至令人担忧？为了破解...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...也有人表示经过实测可见，它仍然具有 Transformer 架构的局限性。对此，图灵奖获得者 Yann LeCun 表示，问题不在于 Transformer，而是因为 Claude 3.5 仍然是一个自回归大模型。无论架构细节如何，使用固定数量的计算步骤来计算每个 t...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

Bengio团队提出多模态新基准，直指Claude 3.5和

...的字幕恢复任务巧妙地揭开了现有模型图像 - 文本对齐的局限性，以及模型与人类在高级认知任务上的推理能力差异。相信这一任务可以启发未来更加有效的 VLM 训练、评测和推理方法，进一步拉近多模态模型和人类认知能力的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

...新生也会被误导，或许人类在推理方面具有和 LLM 类似的局限性。论文概述论文标题：GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models 论文地址……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...基准测试中，表现能够与博士生水平类似。该讲讲缺点和局限性了不难理解，会自己思考问题的AI模型，对于程序员、创意工作者，以及几乎所有的理科相关专业工作者而言是有益的升级，但这个新模型也有局限性。首先，OpenAI ...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...的具身机器人和具身仿真平台，深入分析了其研究重点和局限性。接着，透彻解析了四个主要研究内容：1)具身感知，2)具身交互，3)具身智能体和 4)虚拟到现实的迁移，这些研究内容涵盖了最先进的方法、基本范式和全面的数据...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...，这也意味着它在处理图像、视频等复杂数据时可能面临局限性。还有价格。首先要说明的是，在官方还未发布甚至官宣定价之前，实际「草莓」模型的价格是个未知数。但几乎可以肯定，「草莓」模型的训练和推理成本都会...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

对标o1，Kimi放出了最能打的国产模型

...LaTeX 格式难以描述的几何图形类问题。此外，它还有一些局限性需要突破，包括对于过于简单的数学问题。例如「1+1=？」，k0-math 模型可能会过度思考。「意图增强」等三大推理能力注入 Kimi 探索版新的强化学习技术范式带来的...……更多

2024-11-19 09:50:00模型,国产,模型,推理,能力,数学

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

...良好，但难以应对需要结构化多步推理的复杂任务。这种局限性在需要综合多个时间序列信息的复合问题中尤为突出，限制了模型在复杂应用场景中的适用性。为了应对这些挑战，南加州大学的研究人员提出了一种全新的时间序...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

智能体首达Kaggle Grandmaster,华为结构化推

...经验来实现更据适应性的学习。这能克服思维链等方法的局限性。如图 2 所示。左侧是基本思维链推理，其按顺序生成中间步骤，其中每个步骤都是下一步骤的直接条件，直到得到最终答案。右侧是新提出的结构化推理方法，...……更多

2024-11-09 09:53:00华为,结构化,推理,思维,结构,智能

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也会急剧下降。在...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...工智能在复杂逻辑推理、抽象概念理解上，还存在明显的局限性。数学、物理和围棋虽然都强调逻辑思维，但侧重点不同。围棋侧重于空间布局和策略选择。数学、物理的基本概念和公理构成了一个演绎系统，通过这些基本元素...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...在解决复杂环境感知、动作生成、灵巧操作等问题时存在局限性。尽管大模型增强了其学习、语义理解、推理及判断能力，但在从理解、推理、判断、执行到运动系列过程中，还涉及其他多种模型算法和软硬件协同的问题，包括...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...低的偏见，同时能够有效地识别代码生成的高质量响应。局限性和未来工作由于评估标准不断变化以及评估新的LLM功能的需要，评估LLM具有挑战性，通过开源贡献扩大我们的数据收集范围可以解决这个问题。此外，模型主要在上...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

李飞飞最新报告：美去年AI领域私人投资是中国近9倍，中国仍是

...这种做法使得系统比较和判断人工智能模型存在的风险和局限性的工作变得更加复杂。4.经济生成式AI领域投资激增。据统计，尽管去年人工智能领域的总体投资有所下降，但生成式AI领域的投资资金激增，比 2022 年增加了近八倍...……更多

2024-04-17 10:00:00中国,对手,私人,领域,竞争,报告

2023IDEA大会：让大模型更好应对复杂问题

...存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA研究院团队研发了思维图谱技术，让大模型和知...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...能够处理二元数据（如正向和负向反馈），但它同样有其局限性，无法统一处理不同类型的反馈数据，也无法有效利用已有的奖励模型。在这种背景下，来自 Salesforce、厦门大学的研究团队提出了一种名为 UNA 的新方法，它通过...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

5年后ai所需算力超100万倍

...定义限制在人工智能领域内，同时忽略了人工智能固有的局限性以及人类、机器和事物之间三元互动的重要作用。另一个学派将智能计算（intelligentcomputing）视为计算智能（computationalintelligence），模仿人类或生物智能来实现解决...……更多

2023-01-31 20:34:00智能,人工智能,人工,人类,能力,社会

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

支持1024帧、准确率近100％，英伟达「LongVILA」

...也不足以处理长上下文 VLM 工作负载。在确定现有系统的局限性之后，研究者得出结论，一个理想的多模态序列并行方法应该通过解决模态和网络异构性来优先实现效率和可扩展性，并且扩展性不应受到注意力头数量的限制。 MM...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

补齐Transformer规划短板又不放弃快速思考，Dual

...些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注，甚至让现在的 AI 行业开始放弃卷越来越大的模型，而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊栋团队的研究也是如此，其...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

...版本依旧存在幻觉问题、运行速度较慢及成本高昂等诸多局限性，限制了其应用范围。与之相比，更早提出“慢思考”概念的360通过其首创的CoE(Collaboration of Experts，专家协同)技术架构及混合大模型对“慢思考”进行落地实践，...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

新物种？联想Tech World 2024：AI的一切才刚刚

...在网络速度、云端效率、成本考量、数据隐私等方面存在局限性。而在混合式人工智能框架中，个人大模型和企业大模型，以及在其基础上开发出的个人智能体和企业智能体，将与公有大模型共存互补，提供更加个性化的服务并...……更多

2024-04-18 13:56:00物种,智能,人工智能,人工,杨元庆,联想集团

首个自主机器学习AI工程师，刚问世就秒了o1，Kaggle

...时通常会有几十种算法可用，每种算法都有自己的优势和局限性，选择正确的方法成为一个关键的决策点。仅神经网络就提供了无数的架构可能性，从简单的前馈网络到 Transformer，每个模型都需要仔细调整超参数。计算资源增加...……更多

2024-11-19 09:48:00机器,大师,工程师,工程,学习,学习

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

page 1/2334 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

三亚崖州区棉花育种基地：AI赋能让育种焕发新活力

南海网3月3日消息（记者利声富）智能设备的引入与应用，加速育种进程。3月3日，三亚崖州区棉花育种基地，一人拿着电脑，一人手持操控器

2025-03-03 20:36:00

卢伟冰：未来几年内小米汽车将进军全球市场

快科技3月3日消息，在西班牙巴塞罗那举办的小米15系列全球发布会上，小米集团合伙人兼总裁卢伟冰宣布了小米“人车家全生态”的最新进展

2025-03-03 20:40:00

恶意造谣“问界M9又又又起火三人无了”被抓：造谣者手持道歉

快科技3月3日消息，因恶意造谣“问界M9又又又起火了，三人无了。”武某某被公安处罚，而他本人也是被网友曝光。有网友发现

2025-03-03 20:40:00

荣耀宣布投入100亿美元发力AI！一图读懂荣耀阿尔法战略

快科技3月3日消息，近日，荣耀新任CEO李健在巴塞罗那世界移动通信大会上发布了荣耀阿尔法战略，正式宣告荣耀将从传统的智能手机制造商向全球AI终端生态公司进行全面转型

2025-03-03 20:40:00

这十个方面要注意！海口市发布“3·15”国际消费者权益日消费

南海网3月3日消息（记者蒙健）为提高消费者自我保护意识和能力，帮助消费者有效规避消费陷阱和消费风险，进一步提升消费体验

2025-03-03 20:50:00

“神探雷迪克”：揭秘《冈仁波齐之谜》的·故事

主持人：首先，恭喜您的《神探雷迪克》系列小说之“冈仁波齐之谜”荣获华夏长鸿颁发的“年度佳作”奖！能和我们分享一下您此刻的心情吗

2025-03-03 20:58:00

G2985次动车为救人破例临停网友点赞

3月3日消息，据媒体报道，近日在G2985次列车上，列车长巡视车厢时发现一名老人状态异常。原来老人刚做完胰腺癌手术，乘动车准备回家休养

2025-03-03 21:10:00

换装磷酸铁锂电池！全新大众ID.3聪明款上市：一口价11.9

快科技3月3日消息，大众ID.3 2025聪明款正式上市，推出3款车型，限时一口价区间为11.9888万至13.6888万元

2025-03-03 21:10:00

29.74亿元！国补+企业让利，青岛市民以旧换新热情高涨

齐鲁晚报•齐鲁壹点尚青龙“小补贴”撬动“大市场”！3月3日，记者从青岛市商务局获悉，截至3月1日，青岛市消费品以旧换新累计交易金额29

2025-03-03 21:38:00

男子上班3天被辞退：7天后公司没了

3月3日消息，据媒体报道，一男子于2024年8月14日入职，8月16日晚上被公司辞退。7天后该男子发现，他上班3天的公司已经注销

2025-03-03 21:40:00

全系标配“千里浩瀚”高阶智驾！2025款吉利银河E8正式上市

快科技3月3日消息，2025款吉利银河E8纯电轿车正式上市。官方指导价为14.98万元起，新款车型在配置上进行了显著调整

2025-03-03 21:40:00

小米外置镜头亮相：手机影像旗舰要变天了

刚发完影像旗舰15 Ultra，小米又开始搞新活儿：雷军在昨晚的直播中晒出了一个全新的手机配件——外置的磁吸镜头。这颗镜头拥有M43的CMOS

2025-03-03 21:40:00

AI浪潮下，银行审计人如何“破浪前行”

随着人工智能（AI）技术的迅猛发展，银行内部审计领域正迎来一场前所未有的变革。AI不仅带来了效率的飞跃，也对审计人员岗位提出了新的挑战

2025-03-03 21:47:00

注意！大模型工具Ollama存安全风险

中新经纬3月3日电 3日，国家网络与信息安全信息通报中心在官方微信公众号发布情况通报称，大模型工具Ollama存在安全风险

2025-03-03 21:59:00

合资油车的天快塌了！奥迪Q5L卖20多万电车在它面前还敢说

一觉醒来，合资油车的天都快塌了。最近，有海报图放出，奥迪Q5L quattro典藏版23.88万元起，活动时间是3月1日到10日

2025-03-03 22:40:00

头条订阅服务