边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型推理与训练的边界之争

随着大模型的发展日新月异，其推理和训练的边界问题也引起了广泛讨论。近日，清程极智CEO汤雄超在一场行业活动中明确表示，尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限，但从技术角度来看，这两个阶段...……更多

2024-11-07 20:18:00边界,推理,模型,训练,推理,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...数亿用户。 “草莓”模型为何重要？或重新定义AI能力边界，为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼（Sam Altman）曾在今年早些时候表示，人工智能领域“最重要的进步方向将是推理能力”。而“草莓”项目被认...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...出了解决思路，而且还在编写完代码之后针对整体逻辑和边界条件进行了检查：把这个代码直接提交了一下，结果真的通过了。国外网友也都称赞不已：中国公司的进步速度太快了！在推理中自我反思、纠正上海人工智能实验...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...诊断皮肤癌可以达到专业医生水平，但都是在需求明确、边界清晰、逻辑简单的前提下，也就是概念模型较为简单的前提下，人工智能可以利用算力优势超过人类，但当时人工智能在复杂逻辑推理、抽象概念理解上，还存在明显...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...能力的KRE（知识-推理-执行）三层架构，突破大模型能力边界。”徐立表示，“日日新SenseNova 5.0”（以下简称“日日新5.0”）采用混合专家架构（MoE），超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。本次更...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...算法。create 子句将节点（由后续坐标表示）添加到搜索边界中，close 子句将节点添加到该闭集。每个子句（create 或 close）后面都跟着 token x、y、c0 和 c1—— 分别表示节点的坐标、自开始以来的成本值和启发值。结构化轨迹丢弃...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

港中文团队提出大模型元推理范式，革新大模型的评价体系

...其实也在使用这两种学习方式？此外，当前大模型的能力边界到底在哪里？从推理和认知这两个能力维度出发，当一篇论文称大模型在一个评测指标上取得超出人类水平的结果时，我们是否应该感到恐慌？还是仔细审视在制定指...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...来两周内，OpenAI 是否能凭借「草莓」项目再次定义 AI 的边界，值得所有人拭目以待。9月6日-10日，IFA（柏林国际电子消费品展）2024 盛大开幕。联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...证据：o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。OpenAI 认为，使用思维链可以为安全和对齐带来重大进步，因为 1）它能够以清晰的方式观察模型思维，并且 2）关于安全规则...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...型进行了训练，并使用掩码来确保自注意力不会跨越文档边界。2）训练数据Meta 表示，要训练出最佳的语言模型，最重要的是策划一个大型、高质量的训练数据集。据介绍，Llama 3 在超过 15T 的 token 上进行了预训练，训练数据集...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...、领先的技术实力和创新的产品应用，不断拓展AI技术的边界，携手合作伙伴共同开启AGI时代的新篇章，开启AGI时代的辉煌未来！ ……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？

...a计划，会让更多人在最重要的任务上，推动o1模型能力的边界。直播最后，依然是OpenAI式的圣诞冷笑话一则——最近，圣诞老人在尝试制造一辆无人驾驶雪橇，但不知为何，他的模型总是无法识别树木，导致雪橇不停地撞上道路...……更多

2024-12-09 09:53:00奥特,奥特曼,字节,直播,惊喜,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

商汤科技sensetime推出“云端边”全栈大模型体系

...的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...于很难找到能击溃模型的合适prompt，进行性能比较并查看边界情况。比较模型的其中一个好办法就是进行多轮RLHF。每次上传新模型时，只需在所有带标注的prompt上进行采样，让新旧模型分别回答，再自动计算胜率。Llama 4与AgentMe...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...-D扁平化tile标签： , , ..., ,3）2-D网格标签： , , ..., ,4）2-D边界框标签： (x0, y0), (x1, y1) , ..., (xW, yH), (xW+1, yH+1) ，其中两个坐标分别为(左, 顶部)，(右, 底部)。从消融实验结果中可以观察到：1）……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...工作——这些工作都需要复杂的运算，也依赖于模型能力边界的不断拓展。阿里云在会上也请了不少开发者、企业介绍已有的模型实践。比如华东理工大学的X-D Lab，及基于基于开源的通义千问开源模型开发了心理健康大模型MindC...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力