局限性,推理,人类,任务,研究,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

人类和AI在推理任务中的表现相似，Google DeepMi

...是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度的影响，表现出类似的...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

打脸“AI灭绝伦”！研究反驳：大模型涌现能力不会威胁人类生存

...一般。他们表示，这一发现有助于理解 LLM 的实际能力和局限性，并为未来的模型优化提供新的方向。智能涌现：只是“即兴表演”？AI 大模型的“涌现能力”来自哪里？它是否真如听起来那样神秘，甚至令人担忧？为了破解...……更多

2024-08-19 09:31:00模型,威胁,人类,能力,研究,模型

语言≠思维，大模型学不了推理：一篇Nature让AI社区炸锅

...也有人表示经过实测可见，它仍然具有 Transformer 架构的局限性。对此，图灵奖获得者 Yann LeCun 表示，问题不在于 Transformer，而是因为 Claude 3.5 仍然是一个自回归大模型。无论架构细节如何，使用固定数量的计算步骤来计算每个 t...……更多

2024-06-25 09:45:00推理,模型,思维,语言,社区,语言

Bengio团队提出多模态新基准，直指Claude 3.5和

...的字幕恢复任务巧妙地揭开了现有模型图像 - 文本对齐的局限性，以及模型与人类在高级认知任务上的推理能力差异。相信这一任务可以启发未来更加有效的 VLM 训练、评测和推理方法，进一步拉近多模态模型和人类认知能力的...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

...新生也会被误导，或许人类在推理方面具有和 LLM 类似的局限性。论文概述论文标题：GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models 论文地址……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

AI新时代揭幕！会“思考解题逻辑”的OpenAI推理大模型登

...基准测试中，表现能够与博士生水平类似。该讲讲缺点和局限性了不难理解，会自己思考问题的AI模型，对于程序员、创意工作者，以及几乎所有的理科相关专业工作者而言是有益的升级，但这个新模型也有局限性。首先，OpenAI ...……更多

2024-09-13 13:34:00新时代,推理,逻辑,模型,模型,问题

全球首篇！调研近400篇文献，鹏城实验室&中大深度解析具身智

...的具身机器人和具身仿真平台，深入分析了其研究重点和局限性。接着，透彻解析了四个主要研究内容：1)具身感知，2)具身交互，3)具身智能体和 4)虚拟到现实的迁移，这些研究内容涵盖了最先进的方法、基本范式和全面的数据...……更多

2024-07-29 09:39:00中大,文献,调研,深度,实验室,实验

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...，这也意味着它在处理图像、视频等复杂数据时可能面临局限性。还有价格。首先要说明的是，在官方还未发布甚至官宣定价之前，实际「草莓」模型的价格是个未知数。但几乎可以肯定，「草莓」模型的训练和推理成本都会...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

苹果新论文证明LLM大模型存在缺陷！没有进行真正的逻辑推理

...论文，揭示了大型语言模型（LLM）在数学推理方面的显著局限性。尽管这些模型在生成人类水平的文本方面表现出色，但当处理简单的数学问题时，即使问题仅进行了微小的改动，如添加无关信息，模型的表现也会急剧下降。在...……更多

2024-10-13 14:15:00逻辑推理,新论,推理,缺陷,逻辑,模型

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...工智能在复杂逻辑推理、抽象概念理解上，还存在明显的局限性。数学、物理和围棋虽然都强调逻辑思维，但侧重点不同。围棋侧重于空间布局和策略选择。数学、物理的基本概念和公理构成了一个演绎系统，通过这些基本元素...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

对话王田苗：万亿市场之下，大模型 + 机器人还有四大问题未解

...在解决复杂环境感知、动作生成、灵巧操作等问题时存在局限性。尽管大模型增强了其学习、语义理解、推理及判断能力，但在从理解、推理、判断、执行到运动系列过程中，还涉及其他多种模型算法和软硬件协同的问题，包括...……更多

2024-04-26 23:00:00机器人,模型,对话,机器,问题,市场

87.8%准确率赶超GPT-4o登顶！谷歌DeepMind发

...低的偏见，同时能够有效地识别代码生成的高质量响应。局限性和未来工作由于评估标准不断变化以及评估新的LLM功能的需要，评估LLM具有挑战性，通过开源贡献扩大我们的数据收集范围可以解决这个问题。此外，模型主要在上...……更多

2024-08-05 09:37:00准确率,模型,评估,评估,模型,数据

李飞飞最新报告：美去年AI领域私人投资是中国近9倍，中国仍是

...这种做法使得系统比较和判断人工智能模型存在的风险和局限性的工作变得更加复杂。4.经济生成式AI领域投资激增。据统计，尽管去年人工智能领域的总体投资有所下降，但生成式AI领域的投资资金激增，比 2022 年增加了近八倍...……更多

2024-04-17 10:00:00中国,对手,私人,领域,竞争,报告

2023IDEA大会：让大模型更好应对复杂问题

...存在深度推理能力差、知识不可追溯、实时更新代价高等局限性，这也成为其在许多严肃领域落地的主要瓶颈。如何弥补大模型的这部分缺陷，是当下AI应用的重要课题。为此，IDEA研究院团队研发了思维图谱技术，让大模型和知...……更多

2023-11-24 10:53:00模型,大会,问题,模型,研究,能力

综合RLHF、DPO、KTO优势，统一对齐框架UNA来了

...能够处理二元数据（如正向和负向反馈），但它同样有其局限性，无法统一处理不同类型的反馈数据，也无法有效利用已有的奖励模型。在这种背景下，来自 Salesforce、厦门大学的研究团队提出了一种名为 UNA 的新方法，它通过...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

混合架构赋予AI人类推理能力

...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM)，根据人类输入“提示词”处理和生成文本。研究人员说，过去18个月，这些技...……更多

2024-06-12 18:15:00推理,架构,混合,人类,能力,语言

5年后ai所需算力超100万倍

...定义限制在人工智能领域内，同时忽略了人工智能固有的局限性以及人类、机器和事物之间三元互动的重要作用。另一个学派将智能计算（intelligentcomputing）视为计算智能（computationalintelligence），模仿人类或生物智能来实现解决...……更多

2023-01-31 20:34:00智能,人工智能,人工,人类,能力,社会

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

谷歌大模型推理范式，主要分为两个阶段

...新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。核心策略其实很简单：千人千面。...……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

支持1024帧、准确率近100％，英伟达「LongVILA」

...也不足以处理长上下文 VLM 工作负载。在确定现有系统的局限性之后，研究者得出结论，一个理想的多模态序列并行方法应该通过解决模态和网络异构性来优先实现效率和可扩展性，并且扩展性不应受到注意力头数量的限制。 MM...……更多

2024-08-22 09:51:00英伟,准确率,支持,视频,序列,训练

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

...版本依旧存在幻觉问题、运行速度较慢及成本高昂等诸多局限性，限制了其应用范围。与之相比，更早提出“慢思考”概念的360通过其首创的CoE(Collaboration of Experts，专家协同)技术架构及混合大模型对“慢思考”进行落地实践，...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

新物种？联想Tech World 2024：AI的一切才刚刚

...在网络速度、云端效率、成本考量、数据隐私等方面存在局限性。而在混合式人工智能框架中，个人大模型和企业大模型，以及在其基础上开发出的个人智能体和企业智能体，将与公有大模型共存互补，提供更加个性化的服务并...……更多

2024-04-18 13:56:00物种,智能,人工智能,人工,杨元庆,联想集团

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

OpenAI o1 模型 PlanBench 规划能力实测：

...结果表明 o1 模型取得了长足的进步，但仍然存在很大的局限性。PlanBench 基准简介PlanBench 开发于 2022 年，用于评估人工智能系统的规划能力，包括 600 个来自 Blocksworld 领域的任务，其中积木必须按照特定顺序堆叠。OpenAI o1 模型...……更多

2024-09-26 09:50:00准确率,实测,模型,能力,规划,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...“秋季发布”（9月至11月）要更早。上述报道称，专注于推理能力的人工智能“草莓”发布前后还有一些亟待解决的问题，但看似“仓促上马”似乎说明OpenAI感受到了大语言模型驱动产品领域的激烈竞争压力，希望通过近几个月...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

高考过后，看“AI+教育”发展方向

...限。对在教育领域应用AI而言，人们应该认识到依赖AI的局限性，培养发展人类的智慧和创造力仍是“AI+教育”阶段的重要目标。目前，AI 在教育中的应用已经取得了一定进展。不少国产AI教育应用或设备可以根据学生的学习情...……更多

2024-06-13 09:32:00发展方向,过后,方向,高考,发展,教育

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

page 1/2667 首页上一页 12 3 4 5 6 下一页末页

更多关于科技的资讯：

影视美术创作中人工智能技术的应用趋势研究

摘要：本文系统探究了人工智能技术在影视美术创作及戏剧影视美术设计专业教学中的应用模式、核心价值与发展前景。通过对Midjourney

2025-11-24 07:00:00

数据分析如何优化医保管理服务？

医保制度的完善与发展不仅直接影响人民的健康福祉，还关乎国家医疗资源的合理配置与利用效率。然而，随着医保覆盖范围不断扩大

2025-11-24 07:00:00

厦门三展联动显现整合资源拉动消费的集聚效应

境外客商参观2025厦门国际咖啡产业博览会。●ISPO亚洲运动用品与时尚展涵盖多领域户外装备展示，并设有行业分享论坛、新潮运动体验区

2025-11-24 07:53:00

居家养老“神器”毫米波雷达是个啥？

厦门网讯（厦门日报记者林露虹）独居老人在家中不慎跌倒，所幸家中安装的毫米波雷达设备迅速识别异常并触发警报，避免一场悲剧的发生……这一幕出现在今年热播剧《蛮好的人生》中

2025-11-24 07:54:00

AI仿冒名人带货坑人市民可使用"鉴真"平台规避风险

厦门网讯（厦门日报记者房舒）“你是温峥嵘，那我是谁？”近日，演员温峥嵘怒斥AI（人工智能）仿冒者的言论冲上热搜，揭开了AI技术被滥用的冰山一角

2025-11-23 08:11:00

网聚泉城丨政企协同“双轮驱动” 济南以数字技术重构电梯产业生

鲁网11月23日讯（记者张佳伟实习生寇晓菊）1天内完成立项、2天完成图纸审查、1个月实现场地平整、1年建成开园投产——广日电梯济南数字化产业园以“广日速度”刷新行业纪录

2025-11-23 15:19:00

网聚泉城丨数字技术重构电梯产业生态从“机器换人”到全流程变

责任编辑：张佳伟

2025-11-23 15:20:00

第十届安徽省全屋智能设计集成职业技能竞赛总决赛在合肥举办

大皖新闻讯 11月22日，第十届安徽省全屋智能设计集成职业技能竞赛总决赛在合肥落幕。本届竞赛由安徽省商务厅、安徽省总工会

2025-11-23 17:06:00

山东摩享乐构建起物联网智能生态体系 17万台共享设备覆盖全国

日前，山东摩享乐实业有限公司以17万台共享设备覆盖全国、10亿元级的市场投入，成为共享服务领域的“中华品牌”和标杆典范

2025-11-23 10:34:00

河东农商银行：“金融+健康”双向赋能解锁便民服务新体验

鲁网11月21日讯为回馈客户，赋能业务高质量发展，近日，河东农商银行桃源支行联合辖内某药业集团举办“金冬时节·健康相伴”客户养生见面会

2025-11-22 09:34:00

灵光4天下载破100万，扩容8轮，刷新Sora2五天纪录

11月22日消息，蚂蚁灵光上线4天下载量突破100万，冲上App Store中国区免费榜第六。灵光首个百万下载速度超过ChatGPT

2025-11-22 14:13:00

知识带货热度高，历史作家梅毅在抖音直播间发布新书

知识带货热度不减，越来越多作家走进直播间推荐新书、好书。11月20日，知名历史作家梅毅（网名“赫连勃勃大王”）携新作《天命无常

2025-11-22 15:35:00

齐绘未来发布“快上岸”智能求职小程序，多项自主知识产权技术为

北京齐绘未来教育科技有限公司近日正式推出“快上岸”微信小程序，以多项具备自主知识产权的AI系统为核心，为大学生提供精准

2025-11-22 15:36:00

以开源聚合力，以生态促创新，电鸿走出行业操作系统自主路径

“在过去，去一次现场要带一大堆终端，以应对现场不同设备的接入。现在，只需一部手机和一箱基础工具就行。”来自广州南沙示范区运维工作人员的分享

2025-11-22 15:37:00

河北建工省安装六分公司浙江八亿时空项目创新吊装体系赋能精细

河北新闻网讯（李力芳）2025年7月份以来，河北建工省安装六分公司浙江八亿时空项目创新引入平台吊装系统、蜘蛛吊、电动遥控坦克等专业技术装备

2025-11-22 18:08:00

头条订阅服务