推理,模型,内心,人类,世界,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...一定启示。日前，相关论文以《大型语言模型评价中的元推理革命》（MR-GSM8K: A Meta-Reasoning Revolution in Large Language Model Evaluation）为题发在 arXiv，曾忠燊是第一作者，香港中文大学教授贾佳亚担任通讯作者 [1]。图……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

只用 13 天，OpenAI 做出了能听、能说、能自主决策的

...破，由 OpenAI 与 Figure 共同做出。OpenAI 提供负责提供视觉推理和语言理解，而 Figure 的神经网络提供快速、低水平、灵巧的机器人动作。机器人所做出的所有行为都是出于已经学习过，内化了的能力，而不是来自远程操作。研究...……更多

2024-03-14 19:00:00模型,决策,机器,机器人,机器,模型

Bengio团队提出多模态新基准，直指Claude 3.5和

...型开发的关键指导之一便是如何让机器像人类一样思考和推理。诸如注意力机制和思维链（Chain-of-Thought）等技术正是由此产生的灵感。然而，可能很多人并没有意识到，很多对人类来说很简单的认知任务也往往伴随着非常复杂...……更多

2024-06-29 09:37:00模态,基准,弱点,团队,模型,任务

GPT-4下岗了，上海高校和企业用DeepSeek开发大模型

...相对低配的GPU和显卡内存，就能让办公智能体获得很好的推理效果。DeepSeek-V3发布后，这家上海人工智能企业立即成为它的用户。“这个大模型有6710亿参数，激活参数为370亿，在14.8万亿token（词元）上进行了预训练，生成速度比...……更多

2025-01-29 21:29:00上海,下岗,模型,智能,开发,企业

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

文生图参数量升至240亿！Playground v3发布：深

...像描述性能。实验结果表明，PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色；用户偏好研究表明，PGv3模型在常见的设计应用中，如表情包（stickers）、海报和logo设计，具有超越人类的图形设计能力，还能够精确...……更多

2024-10-08 09:48:00文生,图形设计,深度,图形,人类,参数

北大提出首个通用指令导航大模型系统 | CoRL 24

...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法，然而在真实应用中，人类可能向机器人下达不同形式的指令，甚至混合类型指令，现有的...……更多

2024-09-13 13:38:00指令,北大,模型,导航,系统,导航

疯狂一夜！美国AMD、谷歌纷纷亮出大杀器，人类迎来巨变前夜？

...1.0亮点主要包括五个方面：最先进的性能测试结果，新的推理以及创意功能，性能强大且高效的 AI 超算系统，责任与安全，以及可用性。首先，性能测试方面，在32个性能基准测试中的30个中，Gemini Ultra模型超越了现有最先进的G...……更多

2023-12-07 13:02:00美国,人类,疯狂,焦点,媒体,英伟

黄仁勋：我从不在乎市场份额、英伟达唯一目标是创造新市场

...英伟达，老黄还讨论了AGI的智能扩展、机器学习的加速、推理与训练的重要性……虽然时长感人（近1个半小时），但一大波网友已经看完并交起了作业（开始卷了是吧！）网友：学起来！学起来！黄仁勋：未来推理的增长将远...……更多

2024-10-23 12:25:00新市,英伟,份额,从不,目标,市场

数字员工、超级个体、具身智能，AI Agent未来发展十大研

...侧大模型加速部署，或将成为未来交互新入口。AI在数学推理、新药研发、材料发现、蛋白质合成等领域大显身手， "AI科学家"有望加速问世。这三个报告，一方面预测了AI Agent的未来发展趋势，另一方面也同时提及了多模态大模...……更多

2024-02-02 17:00:00研究方向,个体,方向,员工,数字,智能

黄仁勋对话Transformer七子：我们被困在原始模型里，

...其不断交互才能变得聪明，待在实验室里并不会造福世界推理是下一个重要的进步节点，能提升数据训练效率，产生更有价值的结果对话实录部分要点整理Transformer因何横空出世？Illia Polosukhin：如果要做出能真正读取搜索结果的...……更多

2024-03-22 00:03:00架构,模型,对话,模型,数据,资源

OpenAI未来猛料全曝光！奥特曼承认自己最大弱点是产品

...所删改。最后还有11个快问快答彩蛋～内容速览o1代表的推理模型这个方向对OpenAI非常重要。创业公司的主要业务不要对着现有模型打补丁。难道大家已经忘了几年前的模型表现多糟糕吗？其实才过去没几年。同样的价值下，...……更多

2024-11-06 09:42:00奥特,奥特曼,弱点,产品,模型,事情

对话商汤王晓刚：自动驾驶借助强化学习将超越人类，今年商业化迎

...合。搜狐科技：自动驾驶需要很快决策，跟强化学习的推理、长思考能力，看上去好像有些矛盾。王晓刚：强化学习是在训练阶段，实际部署的时候就没有世界模型的事了，直接是靠端到端来做。DeepSeek不是这样，它是在推理...……更多

2025-02-27 11:36:00商汤,驾驶,对话,人类,商业,学习

o3 压台登场：OpenAI 卷动推理 AI 模型风云，迈向

...enAI 的 o3 系列大模型压台登场，官方称在某些场景下，其推理能力非常接近通用人工智能（AGI）。名称最新的 AI 模型为何跳过 o2，叫做 o3 呢？OpenAI 公司首席执行官山姆・阿尔特曼（Sam Altman）在今天早上的直播活动，表示是为...……更多

2024-12-21 09:17:00巅峰,推理,模型,风云,模型,测试

马斯克突然发布Grok-2！数学推理能力突出，攻克“9.9与

...上一代模型，Grok-2和Grok-2 mini在阅读理解、数学、编码、推理等方面表现都有显著改进。值得一提的是，Grok-2在数学推理（MathVista）方面表现登顶测试榜首。但细心网友不难发现，即便是Grok-2，在其他方面与前沿模型GPT-4o或Claude ...……更多

2024-08-15 09:56:00马斯,马斯克,推理,难题,大小,能力

微软被曝未来3年花1000亿美金囤芯片；杨元庆：AI不是取代

...柱。开源大模型Llama3推出，百度智能云支持其全系列训练推理北京时间4月19日凌晨，Meta公布期待已久的多模态开源大模型Llama 3系列，目前包括80亿和700亿两个参数的调优版本。与此同时，Meta还推出了其首款基于Llama 3开源模型的...……更多

2024-04-30 11:00:00杨元庆,微软,美金,芯片,人类,智能

都可赋予大模型慢思考能力 360首创CoE架构媲美OpenA

9月13日，OpenAI发布具有推理能力的人工智能模型“o1”，备受行业瞩目。o1通过模仿人类的思维过程，强化学习和“思维链”技术，引导模型自主解决问题。这一特点在解决复杂问题，尤其是在科学、编码和数学等领域，展现出...……更多

2024-09-16 17:42:00架构,模型,思维,能力,模式,模型

背水一战狙击GPT-4，谷歌最强大模型Gemini终发布，听

...大模型——跨越文本、图像、视频、音频和代码的无缝推理。”谷歌官网上，这是介绍Gemini的第一句话。这是Gemini 1.0最重要的特点：一位更强大的“全科选手”。如果和OpenAI做对比，OpenAI的GPT-3.5一开始是纯文字的大语言模型...……更多

2023-12-07 08:18:00全能,选手,模型,焦点,分析,模型

o1核心作者分享：激励AI自我学习，比试图教会AI每一项任务

...绍下Hyung Won Chung，从公布的o1背后人员名单来看，他属于推理研究的基础贡献者。资料显示，他是MIT博士（方向为可再生能源和能源系统），去年2月加入OpenAI担任研究科学家。加入OpenAI之前，他在Google Brain负责大语言模型的预训...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

20多家车企接入DeepSeek：为啥没有“蔚小理华米特”

...上叫我给他们讲讲 AI 是怎么回事。由于同时具备强大的推理能力及开源模型两个特质，导致几乎所有科技公司都在研究怎样和 DeepSeek「深度融合」一下。华为、腾讯、百度、字节等互联网巨头，尽管都有各自自研的模型，但不...……更多

2025-02-14 12:52:00米特,接入,多家,模型,推理,智能

自我纠错如何使OpenAI o1推理能力大大加强?北大MIT

...的技术，使得模型能够在最终确定回复之前，先检测自身推理的错误并纠正。在实际的执行过程中，这会用到一种名为思考标签（thinking tag）的机制。模型会在这个标签内部进行反思，直到它得到正确答案或认为自己得到了正确...……更多

2024-11-19 09:48:00推理,北大,团队,解释,能力,理论

超越ChatGPT：人类特有的思维要强化

...据驱动学习机制不可避免存在不可解释、数据依赖和逻辑推理弱等不足。忽略这些不足，可能会给全面认识ChatGPT带来一定的困扰。虚假关联带来隐患尽管ChatGPT可以“写”出人机莫辨的论文、诗歌，但当你尝试问它类似这样的问...……更多

2023-02-14 06:05:00思维,人类,思维,关联,教育,学习

谷歌DeepMind推Imagen2；ChatGPT Plu

...成器。Mistral AI发布Mixtral 8x7B专家混合模型，表现优越且推理速度更快。由于获得更多GPU，ChatGPT Plus重新开放订阅，提供更好的用户体验。OpenAI首席科学家Ilya Sutskever入选Nature年度十大科学人物，表彰其在ChatGPT开发中的核心作用.……更多

2023-12-17 18:40:00模型,硅谷,订阅,监督,模型,融资