推理,模型,直播,推理,模型,时间头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

人类和AI在推理任务中的表现相似，Google DeepMind研究揭示AI局限性

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

ICML2024演讲爆火!Meta朱泽园揭秘大模型内心世界:

...M) 是如何解数学题的？是通过模板记忆，还是真的学会了推理思维？模型的心算过程是怎样的？能学会怎样的推理技能？与人类相同，还是超越了人类？只学一种类型的数学题，是会对通用智能的发展产生帮助？LLM 为什么会犯...……更多

2024-08-06 09:27:00推理,模型,内心,人类,世界,模型

多模态LLM视觉推理能力堪忧，浙大领衔用GPT-4合成数据构

新智元报道编辑：乔杨【新智元导读】LLM的数学推理能力缺陷得到了很多研究的关注，但最近浙大、中科院等机构的学者们提出，先进模型在视觉推理方面同样不足。为此他们提出了一种多模态的视觉推理基准，并设计了一种...……更多

2024-08-08 16:23:00模态,领衔,基准,推理,视觉,能力

OpenAI新功能 “深度研究” 登场，人类终极考试的表现超

...过专门优化，适配网页浏览和数据分析场景。它能够运用推理能力，在互联网上搜索、解读和分析海量的文本、图像和PDF文件，并能根据所遇到的信息灵活调整研究方向。值得注意的是，在对这个智能体的能力评测中，OpenAI特...……更多

2025-02-04 04:25:00新功能,终极,深度,人类,考试,研究

又慢又贵？OpenAI推理模型“草莓”来了，GPT-5还有多

...9月12日，人工智能（AI）巨头OpenAI发布代号“草莓”的AI推理模型OpenAI o1系列，包括OpenAI o1-preview以及小版本的o1-mini。据OpenAI介绍， o1会花更多时间思考问题，然后再做出反应，就像人一样。通过训练学会了完善自己的思考过程...……更多

2024-09-13 15:28:00多远,推理,草莓,模型,模型,思维

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

... OpenAI 在大语言模型领域的新尝试，也可能是对人工智能推理能力一次新的革命性提升。根据目前流出的信息来看，相比以往的 GPT 模型，「草莓」在处理复杂问题、执行多步骤任务方面展现出前所未有的潜力，使其成为通用人...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

首发！优刻得云平台上新DeepSeek-V3-0324模型

... 不仅将模型参数量由原版的671B提升至685B，编程、数学等推理思考能力大幅提升，性能表现可以与Claude3.5/3.7Sonnet相媲美。同时，模型的开源协议升级为更宽松的MIT许可，进一步降低了商业应用门槛。优刻得云平台始终密切关注A...……更多

2025-03-25 18:45:00模型,平台,模型,推理,体验,可通

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o

快科技1月16日消息，今日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型。据了解，在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸超越了GPT-4o。同时...……更多

2025-01-16 14:56:00通义,阿里,推理,模型,尺寸,奖励

DeepSeek/o3的弱点找到了！三心二意明明对了又改错

DeepSeek和o1/o3一类推理大模型持续带来震撼之际，有人开始研究他们的弱点了。最新研究揭示：在遇到高难度问题时，推理大模型可能像“三心二意的学生”一样频繁切换解题思路，却因缺乏深入探索而失败——这种现象被研究...……更多

2025-02-04 19:41:00弱点,模型,推理,答案,思路,准确率

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开

...较长的小说了。更重要的是，LLM真的能在这个长度上进行推理吗？近日，有两篇独立研究分别表明：长上下文水分很大！LLM实际上并不能「理解」内容。读小说挑战首先是来自UMass、AI2和普林斯顿的研究人员，推出了一项针对性...……更多

2024-07-23 17:12:00正确率,长上,下文,模型,只是,能力

大语言模型逻辑推理“很糟糕”

...智能的旗舰产品GPT-4为代表的大语言模型在逻辑测试中的推理表现很糟糕：它们犯下前后不一致的错误，而且推理过程往往是荒谬的。近日发表在《皇家学会开放科学》杂志上的一项研究表明，大语言模型所依赖的语料库往往反...……更多

2024-06-12 18:15:00逻辑推理,推理,逻辑,模型,语言,模型

字节豆包团队推出稀疏模型架构UltraMem：推理成本可降8

...将计算和参数解耦，在保证模型效果的同时，有效解决了推理过程中的访存问题，为人工智能领域带来了新的突破。据了解，UltraMem架构巧妙地将计算与参数分离，不仅确保了模型的卓越性能，更针对推理过程中的访存瓶颈提出...……更多

2025-02-13 19:51:00豆包,字节,推理,架构,模型,团队

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

o1金牌团队揭秘AI超越人类惊人时刻！22分完整版视频全公开

...共有8点：1 强化学习加持的o1，比人类更善于发现新的CoT推理步骤2 自我批评的涌现，是o1最强有力的时刻3 让o1「超时」前完成回答，然后突然有了「啊哈」时刻 4 scaling参数规模的挑战，以及继续沿着强化学习算法进步之路5 许...……更多

2024-09-23 09:50:00整版,金牌,团队,人类,时刻,视频

DeepSeek开源周才第二天有些公司就已经坐不住了

...了。号称他们迄今为止最聪明的 Claude 3.7 Sonnet ，还是个推理模型和传统模型的 “ 混血 ” 。我估计今天那些专门做模型测评的博主，都快要忙不过来了吧。。。再加上 Grok 3 、 DeepSeek R1 、 o3 mini ，世超猜到了今年推理模型必有...……更多

2025-02-26 08:04:00二天,公司,模型,推理,阿里,通义

阿里云全面升级GPU云服务：AI大模型推理性能可提升100%

...云推出全面升级的GPU云服务，通过全新优化GPU套件，多GPU推理服务性能可最大提升100%。针对调用GPU算力最常用的容器技术，阿里云推出ACK云原生AI套件，帮助开发者及企业更高效地开发和部署AI应用，加速大模型应用落地。随着A...……更多

2024-07-19 17:21:00阿里,推理,模型,性能,升级,服务

京东率先推出行业首批高商业可用数字人，618向商家免费开放

...考”双通道能力，能满足各行业对“即时响应”和“深度推理”的双重需求。具体来说，750B超大规模模型在训练过程中，使用了动态分层蒸馏、跨领域数据治理等京东创新技术，降低大模型的训练和部署成本，同时兼顾大模型...……更多

2025-05-22 18:51:00京东,商家,开放,数字,商业,行业

香港金融科技周|度小满CEO朱光：推理大模型将深入到金融核心

...注的话题。度小满CEO朱光在科技周主论坛上表示，“以o1推理大模型为代表的新一波生成式AI技术在金融领域的应用，将从外围场景深入到核心业务，直接影响金融行业的核心决策质量，在为客户的产品和服务体验上带来巨大突...……更多

2024-11-21 13:55:00金融,香港,推理,模型,核心,业务

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理