边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型推理与训练的边界之争

随着大模型的发展日新月异，其推理和训练的边界问题也引起了广泛讨论。近日，清程极智CEO汤雄超在一场行业活动中明确表示，尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限，但从技术角度来看，这两个阶段...……更多

2024-11-07 20:18:00边界,推理,模型,训练,推理,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...数亿用户。 “草莓”模型为何重要？或重新定义AI能力边界，为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼（Sam Altman）曾在今年早些时候表示，人工智能领域“最重要的进步方向将是推理能力”。而“草莓”项目被认...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

全球科研团队竞逐低成本AI模型研发新范式

...模型，仍需强化学习技术。刘知远说，就推动大模型能力边界而言，“知识蒸馏”技术意义不大，未来仍需探索大规模强化学习技术，以持续激发大模型在思考、反思、探索等方面的能力。AI模型未来如何进化在2025年美国消费电...……更多

2025-02-27 05:08:00范式,模型,科研,团队,成本,全球

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...出了解决思路，而且还在编写完代码之后针对整体逻辑和边界条件进行了检查：把这个代码直接提交了一下，结果真的通过了。国外网友也都称赞不已：中国公司的进步速度太快了！在推理中自我反思、纠正上海人工智能实验...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

东大发布深度推理法律垂域大模型

...关系；通过概念延伸、条件明确、后果探讨、实务应用、边界探讨五大追问维度，构建了包含150万条数据的多轮对话数据集；通过多轮对话内容借助DeepSeek-R1构建得到深度思考数据集，使模型具备类法律人的思维路径。经统计，...……更多

2025-03-19 08:25:00东大,推理,深度,模型,法律,法律

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...诊断皮肤癌可以达到专业医生水平，但都是在需求明确、边界清晰、逻辑简单的前提下，也就是概念模型较为简单的前提下，人工智能可以利用算力优势超过人类，但当时人工智能在复杂逻辑推理、抽象概念理解上，还存在明显...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...能力的KRE（知识-推理-执行）三层架构，突破大模型能力边界。”徐立表示，“日日新SenseNova 5.0”（以下简称“日日新5.0”）采用混合专家架构（MoE），超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。本次更...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...算法。create 子句将节点（由后续坐标表示）添加到搜索边界中，close 子句将节点添加到该闭集。每个子句（create 或 close）后面都跟着 token x、y、c0 和 c1—— 分别表示节点的坐标、自开始以来的成本值和启发值。结构化轨迹丢弃...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

DeepSeek发布最新NSA技术论文！创始人梁文锋参与引人

...语言模型在文档分析、代码生成、复杂推理等领域的应用边界。同时，NSA通过针对现代硬件的优化设计，在提高推理速度的同时、降低预训练成本，而不会牺牲性能。它在通用基准测试、长文本任务和基于指令的推理中均能达到...……更多

2025-02-19 12:26:00文锋,技术论文,创始人,论文,技术,推理

港中文团队提出大模型元推理范式，革新大模型的评价体系

...其实也在使用这两种学习方式？此外，当前大模型的能力边界到底在哪里？从推理和认知这两个能力维度出发，当一篇论文称大模型在一个评测指标上取得超出人类水平的结果时，我们是否应该感到恐慌？还是仔细审视在制定指...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...来两周内，OpenAI 是否能凭借「草莓」项目再次定义 AI 的边界，值得所有人拭目以待。9月6日-10日，IFA（柏林国际电子消费品展）2024 盛大开幕。联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...证据：o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。OpenAI 认为，使用思维链可以为安全和对齐带来重大进步，因为 1）它能够以清晰的方式观察模型思维，并且 2）关于安全规则...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...型进行了训练，并使用掩码来确保自注意力不会跨越文档边界。2）训练数据Meta 表示，要训练出最佳的语言模型，最重要的是策划一个大型、高质量的训练数据集。据介绍，Llama 3 在超过 15T 的 token 上进行了预训练，训练数据集...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...、领先的技术实力和创新的产品应用，不断拓展AI技术的边界，携手合作伙伴共同开启AGI时代的新篇章，开启AGI时代的辉煌未来！ ……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...a计划，会让更多人在最重要的任务上，推动o1模型能力的边界。直播最后，依然是OpenAI式的圣诞冷笑话一则——最近，圣诞老人在尝试制造一辆无人驾驶雪橇，但不知为何，他的模型总是无法识别树木，导致雪橇不停地撞上道路...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

DeepSeek的能力，到底从哪里来？

...测中，它的综合能力逼近当时的顶尖大模型，尤其在逻辑推理和数学题上展现出强劲性能，而且它的成本要远低于作比较的其他大模型。更令圈内研究者惊喜的，是它在训练方式上的简化。以往的模型在提升推理能力时，通常依...……更多

2025-05-27 10:23:00里来,能力,模型,训练,推理,能力

商汤科技sensetime推出“云端边”全栈大模型体系

...的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

小米开源首个推理大模型Xiaomi MiMo：7B参数就超越

...快科技4月30日消息，小米官方今天正式宣布，开源首个为推理（Reasoning）而生的大模型——Xiaomi MiMo。据介绍，Xiaomi MiMo在数学推理（AIME 24-25）和代码竞赛（LiveCodeBench v5）公开测评集上，MiMo仅用7B的参数规模，超越了OpenAI的闭……更多

2025-04-30 10:36:00小米,推理,模型,参数,训练,推理

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...于很难找到能击溃模型的合适prompt，进行性能比较并查看边界情况。比较模型的其中一个好办法就是进行多轮RLHF。每次上传新模型时，只需在所有带标注的prompt上进行采样，让新旧模型分别回答，再自动计算胜率。Llama 4与AgentMe...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

提质降价，国产大模型加速奔跑

...态统一，持续突破人工智能感知、理解和推理世界的能力边界。这些，拓展着大模型与各行各业融合的深度和广度。“如今，芯片制造商、数据供应商、模型研发企业、应用开发商等方面协同合作正日益增强，共同创造全新应用...……更多

2025-02-05 03:48:00模型,国产,模型,国产,能力,成本

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...-D扁平化tile标签： , , ..., ,3）2-D网格标签： , , ..., ,4）2-D边界框标签： (x0, y0), (x1, y1) , ..., (xW, yH), (xW+1, yH+1) ，其中两个坐标分别为(左, 顶部)，(右, 底部)。从消融实验结果中可以观察到：1）……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型