推理,模型,内心,人类,世界,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

唯一全国产算力训练！讯飞星火深度推理模型X1正式发布：多项指

...天的新品发布会上，科大讯飞正式发布了具备深度思考和推理能力的星火深度推理模型X1，这也是目前唯一一个全国产算力上训练的深度推理模型。据介绍，与通用大模型相比，X1的解题过程更接近人类的“慢思考”方式，并且...……更多

2025-01-15 10:24:00讯飞,星火,推理,深度,模型,指标

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶A

...以叫世界模型（world model），在「通用智能体规划」和「推理环境」中的关键组成部分，相比传统强化学习采样效率更高。但世界模型主要操作一系列离散潜在变量（discrete latent variables）以模拟环境动态，但这种压缩紧凑的离散...……更多

2024-11-19 09:49:00模型,训练,小时,学习,世界,模型

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...本质的不同。其不仅进入到复杂的领域，还表现出超强的推理能力。OpenAI 将 GPT-4o 和 o1 在国际数学奥林匹克竞赛资格考试方面进行对比测试。根据结果，二者差异显著，其中，前者正确解决问题的准确率是 13.4%，而 o1 的准确率...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

人工智能助推能源产业高“智”发展

...，其性能与世界顶尖模型GPT-4o不相上下；R1作为面向复杂推理任务的大模型，全球首次复现OpenAI o1模型且性能对比不分伯仲。两款模型是开源模型性能达到世界顶尖闭源模型的首例。简单来说，DeepSeek像是一个聪明又懂你的生活...……更多

2025-02-24 08:32:00人工智能,助推,人工,能源,智能,产业

GPT-4V暴露致命缺陷？JHU等发布首个多模态ToM 测试

...，在 MIT 完成博后，致力于构建能够在现实世界中理解、推理和与人类互动的社会智能系统，从而推进以人为中心的 AI。本文另外两位指导老师 Joshua B. Tenenbaum、Antonio Torralba 为 MIT 著名教授，google scholar 引用量均在 10 万以上。心.……更多

2024-09-12 09:45:00模态,缺陷,测试,模态,模型,心智

豆包再降价，字节“饱和式”进攻仍在继续

...视觉理解模型正式亮相，其具备更强的内容识别、理解和推理、视觉描述等能力；明年1月，豆包视频生成大模型也将面向企业开放服务。除了新成员的加入，豆包大模型多款产品也迎来更新迭代。比如，豆包通用模型pro已全面...……更多

2024-12-20 09:25:00豆包,饱和,字节,进攻,豆包,模型

国产模型指令跟随全球第一！来自LeCun亲推的最难作弊LLM

...训练。故而，Step-2总参数量达到万亿级别，每次训练或推理所激活的参数量也超过了市面上的大部分Dense模型。此外，Step-2的训练过程中，阶跃的系统团队突破了6D并行、极致显存管理、完全自动化运维等关键技术，支撑起了整...……更多

2024-11-22 09:54:00指令,模型,国产,全球,模型,模态

AI 的“心智理论”难题：Meta ExploreToM 探

...单的预定义场景，无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集，为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性，以及高质量训练数据对于...……更多

2024-12-21 09:27:00之路,心智,难题,突破,理论,模型

什么是AGI？人工智能的未来

...Artificial Intelligence）指的是能够像人类一样思考、学习和推理的机器或计算机程序 – 其能够具备人类的普遍智慧，即能够学习各领域知识，并能将知识输出在各个领域。当时，约翰·麦卡锡预计人工智能将在几个月内实现。约翰...……更多

2024-03-19 06:00:00人工智能,人工,智能,人工智能,智能,人工

“深思熟虑”的 AI：OpenAI 提出全新安全对齐方法

...方法直接教授模型安全规范，并训练它们在生成响应之前推理这些准则进，将安全原则融入推理过程中。整个过程分为两个阶段，第一阶段，监督微调（SFT）训练模型参考并推理安全规范，使用从基础模型生成的数据集。第二...……更多

2024-12-26 09:29:00深思,全新,方法,安全,模型,安全

三个大模型组队挑战o1，实测360多模型协作干掉提示词工程

...横空出世，开启了大模型演化的新范式——Inference law（推理定律）。正如英伟达AI科学家Jim Fan所说，o1的出现标志着大模型研发者开始把集中在训练阶段的投入，开始转移到了推理过程。Jim还引用了机器学习先驱Rich Sutton的经典...……更多

2024-09-21 09:45:00模型,实测,协作,三个,提示,工程

本周硅谷发生了什么？｜苹果Vision Pro正式开售；Ne

...推出数据分析工具“办公小浣熊”面壁智能发布2B模型，推理成本仅为GPT-4的1/360科大讯飞发布全民开放大模型星火V3.5百川智能发布Baichuan 3大模型，更好理解中文阿里巴巴开发的自主多模态AI代理MobileAgent上线苹果Vision Pro正式在...……更多

2024-02-05 11:37:00硅谷,字节,接口,人类,苹果,模型

比尔·盖茨对话OpenAI CEO奥特曼：AI如何监管？白领

...两人谈到了人工智能发展、趋势和监管等问题。多模态、推理和个性化是趋势，成本正在快速下降盖茨表示，最初对OpenAI快速发展充满疑问，称没想到ChatGPT变得这么好，并不理解背后的逻辑。奥特曼认为，目前在AI可解释性方面...……更多

2024-01-12 17:05:00奥特,奥特曼,盖茨,比尔,失业,监管

MMMU华人团队更新Pro版！多模态基准升至史诗级难度：过滤

...不断提升，例如GPT-4o在大学水平上的多学科多模态理解和推理（MMMU）基准测试中取得了69.1%的准确率。不过，基准测试结果是否真的能反映模型对多样化主题的深入理解，仍然有争议，或者说模型是否只是利用了统计模式，而非...……更多

2024-09-18 13:31:00模态,史诗,基准,难度,问答,文本

OpenAI正引爆一场全球AI安全热战，我们将如何应对？

...至超越人类的智能，简单而言就是能说会写，具备计算、推理、分析、预测、完成任务等各类人类行为。这样的AI曾经遥远，但在OpenAI推出第四代模型GPT-4且正训练第五代模型GPT-5时，AGI看似近在咫尺。今年以来，AI 安全问题持续...……更多

2024-06-24 09:18:00热战,安全,全球,安全,伊利亚,模型

大模型步入推理Scaling时代,SambaNova如何挑战

...震。o1 能像人类一样「思考」复杂问题，拥有优秀的通用推理能力。在未经专门训练的情况下，o1 能够直接拿下数学奥赛金牌，甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外，更重要的是，它揭示了大模型...……更多

2024-10-21 09:55:00英伟,霸主,推理,模型,地位,时代

马斯克的AI大模型登场

...够运行该模型，意味着特斯拉可能拥有地球上最大数量的推理算力。即便未来无人驾驶出租车的愿景成真，汽车每周的实际使用时间大致只有三分之一，剩下三分之二的时间可以用来做分布式推理，例如参与“寻找地外文明计划...……更多

2023-11-06 09:22:00马斯,马斯克,模型,人工智能,人工,智能

“女巴菲特”预期2030年人形机器人进入家庭，通用AI出现，

...幅下降。AI 训练性能正在迅速提高。研究人员正在训练和推理、硬件和模型设计方面进行创新，以提高性能并降低成本。随着生产用例的出现，AI 焦点正在转向推理成本。最初关注 LLM 训练成本优化之后，研究人员现在正在优先...……更多

2024-02-05 09:41:00马斯,马斯克,巴菲,巴菲特,人形,机器人

综述｜5月全球人工智能领域新看点

...版本升级，当前版本为DeepSeek-R1-0528，模型的思维深度与推理能力显著提升。更新后的R1模型针对议论文、小说、散文等文体进行了进一步优化，能够输出篇幅更长、结构内容更完整的长篇作品，同时呈现出更加贴近人类偏好的写...……更多

2025-06-02 13:09:00人工智能,看点,人工,领域,智能,全球

Meta祭出三篇最详尽Llama微调指南！千字长文，0基础小

...类型的信息：- 仅输入和输出文本，也就是少样本学习- 推理追踪：添加中间推理步骤，可参阅思维链（COT）提示- 计划和反思追踪：添加信息，教LLM计划和反思其解决问题的策略，可参阅ReACT 选择正确的适配方法要决定上述哪...……更多

2024-08-27 12:03:00小白,长文,千字,基础,指南,训练

科大讯飞联手华为首次攻克全国产算力下推理模型训练难关

...15日，科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一，并率先应用于教育、医疗等刚需场景。同时，讯飞星火4.0 Turbo底座能力再次迎来全新升级，图文、数学和长文...……更多

2025-01-15 15:07:00讯飞,华为,难关,模型,训练,全国

给小学数学题加句废话，OpenAI o1就翻车了，苹果论文质

苹果新论文：AI 大模型可能不会推理。AI 大模型（LLM）真的像我们理解的那样能「思考」或「推理」吗？最近，苹果的一篇论文探讨了这个问题，并且给出了一个倾向于「否」的答案。相关帖子被很多人围观。这篇题为「GSM-Symb...……更多

2024-10-14 09:55:00数学题,推理,废话,苹果,数学,小学

谷歌公司发布人工智能模型“双子座”

...的32项学术基准中，从自然图像、音频和视频理解到数学推理，“双子座”Ultra的性能有30项超过了当前先进水平。谷歌公司称，在图像识别领域的测试结果显示，“双子座”Ultra性能优于迄今最先进的人工智能模型，具有天然多...……更多

2023-12-08 07:31:00人工智能,双子座,双子,人工,模型,智能

不到半年，Figure AI发布第二代人形机器人，称为“地表

...视觉语言模型，通过机器人的摄像头实现快速常识性视觉推理。在CPU和GPU方面，Figure 02比上一代机器人的机载计算与AI推理能力提高了三倍，这使得机器人能够完全自主地在现实世界中执行任务。最新型号配备了六个RGB摄像头，...……更多

2024-08-07 09:30:00二代,地表,人形,最先,机器人,机器

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...达14.3%，显著高于DeepSeek-V3的3.9%，也远远超过行业的其他推理模型，比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符，或偏离用户指令的现象，会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

让OpenAI o1逆天的慢思考，360两月前就做出来了？周

...读】o1大火背后，最关键的技术是CoT。模型通过一步一步推理，恰恰是「慢思考」的核心要义。而这一观点，其实这家国内大厂早就率先实现了。OpenAI的理念，居然被国内公司抢先践行了？比起OpenAI，这家公司的idea提出得更早，...……更多

2024-09-21 09:50:00周鸿,前瞻,应用,模型,推理,协作

Llama成大模型顶流，扎克伯格掀论战：玩开源，时代变了

...这样的创新者已经为所有新模型构建了低延迟、低成本的推理服务。这些模型将在包括 AWS、Azure、Google、Oracle 等所有主要云平台上可用。Scale.AI、戴尔、德勤等公司已经准备好帮助企业采用 Llama 并使用他们自己的数据训练定制...……更多

2024-07-25 09:32:00伯格,扎克,模型,时代,模型,系统

WRC 2025开普勒K2大黄蜂实力吸睛，商业化进程继续加速

...分层架构的视觉-语言-动作（VLA）模型。在具身决策中，推理层凭借视觉 - 语言模型（VLM）进行深度推理与规划，执行层则基于扩散变换器（DiT）的动作模块快速生成动作指令。K2大黄蜂的\"决策 - 执行\"链路实现了毫秒级响应，...……更多

2025-08-19 10:52:00开普勒,开普,黄蜂,进程,实力,商业

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型