边界,推理,模型,训练,推理,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

大模型推理与训练的边界之争

随着大模型的发展日新月异，其推理和训练的边界问题也引起了广泛讨论。近日，清程极智CEO汤雄超在一场行业活动中明确表示，尽管外界有声音认为OpenAI发布的o1模型模糊了推理和训练的界限，但从技术角度来看，这两个阶段...……更多

2024-11-07 20:18:00边界,推理,模型,训练,推理,模型

专注于推理的OpenAI“草莓”模型两周内发布？是人工智能下

...数亿用户。 “草莓”模型为何重要？或重新定义AI能力边界，为GPT 5提供高质量合成训练数据OpenAI首席执行官奥特曼（Sam Altman）曾在今年早些时候表示，人工智能领域“最重要的进步方向将是推理能力”。而“草莓”项目被认...……更多

2024-09-11 09:55:00人工智能,推理,草莓,人工,模型,突破

重磅！OpenAI o1模型还没有实现真正的逻辑推理能力

...诊断皮肤癌可以达到专业医生水平，但都是在需求明确、边界清晰、逻辑简单的前提下，也就是概念模型较为简单的前提下，人工智能可以利用算力优势超过人类，但当时人工智能在复杂逻辑推理、抽象概念理解上，还存在明显...……更多

2024-09-18 15:01:00逻辑推理,重磅,推理,逻辑,模型,能力

商汤升级“日日新5.0”大模型，对标GPT-4Turbo

...能力的KRE（知识-推理-执行）三层架构，突破大模型能力边界。”徐立表示，“日日新SenseNova 5.0”（以下简称“日日新5.0”）采用混合专家架构（MoE），超10TB tokens训练，覆盖大量合成数据，推理时上下文窗口达200K左右。本次更...……更多

2024-04-24 09:32:00商汤,模型,升级,商汤,模型,推理

补齐Transformer规划短板又不放弃快速思考，Dual

...算法。create 子句将节点（由后续坐标表示）添加到搜索边界中，close 子句将节点添加到该闭集。每个子句（create 或 close）后面都跟着 token x、y、c0 和 c1—— 分别表示节点的坐标、自开始以来的成本值和启发值。结构化轨迹丢弃...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

港中文团队提出大模型元推理范式，革新大模型的评价体系

...其实也在使用这两种学习方式？此外，当前大模型的能力边界到底在哪里？从推理和认知这两个能力维度出发，当一篇论文称大模型在一个评测指标上取得超出人类水平的结果时，我们是否应该感到恐慌？还是仔细审视在制定指...……更多

2024-03-04 10:23:00革新,模型,范式,中文,推理,团队

GPT刚刚公开「草莓」项目：推理能力翻倍，定价200美元？

...来两周内，OpenAI 是否能凭借「草莓」项目再次定义 AI 的边界，值得所有人拭目以待。9月6日-10日，IFA（柏林国际电子消费品展）2024 盛大开幕。联想、荣耀、TCL、海信、长虹、江波龙、时空壶、云鲸、追觅、极米、当贝、倍思、...……更多

2024-09-12 09:49:00推理,草莓,定价,能力,项目,草莓

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...证据：o1-preview 在关键越狱评估和用于评估模型安全拒绝边界的最严格内部基准上取得了显著的改进。OpenAI 认为，使用思维链可以为安全和对齐带来重大进步，因为 1）它能够以清晰的方式观察模型思维，并且 2）关于安全规则...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

全球最强开源大模型Llama 3发布：使用15T数据预训练，

...型进行了训练，并使用掩码来确保自注意力不会跨越文档边界。2）训练数据Meta 表示，要训练出最佳的语言模型，最重要的是策划一个大型、高质量的训练数据集。据介绍，Llama 3 在超过 15T 的 token 上进行了预训练，训练数据集...……更多

2024-04-20 11:03:00模型,训练,参数,数据,全球,模型

“智算融合共创未来”——开普云AI战略暨新产品发布会召开

...、领先的技术实力和创新的产品应用，不断拓展AI技术的边界，携手合作伙伴共同开启AGI时代的新篇章，开启AGI时代的辉煌未来！ ……更多

2024-04-11 10:30:00新产,开普,共创,共创未来,发布会,新产品

大模型不会推理，为什么也能有思路？有人把原理搞明白了

大模型不会照搬训练数据中的数学推理，回答事实问题和推理问题的「思路」也不一样。大语言模型的「推理」能力应该不是推理，在今年 6 月，一篇 Nature 论文《Language is primarily a tool for communication rather than thought》曾引发……更多

2024-11-23 09:42:00推理,模型,思路,原理,推理,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

商汤科技sensetime推出“云端边”全栈大模型体系

...的KRE三层架构（知识-推理-执行），不断突破大模型能力边界。”“日日新SenseNova5.0”性能超越GPT-4 Turbo：文理双修能力大幅提升，新增多模态交互自去年4月首次发布，商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭...……更多

2024-04-25 01:02:00商汤,云端,模型,体系,科技,商汤

影响英伟达根本逻辑的大争论：OpenAI改变策略意味着什么？

大模型预训练“缩放定律”定律失效？模型推理成“解药”，英伟达一家独大格局要变天？“缩放定律”指导下，AI大模型预训练目前遭遇瓶颈。据路透12日报道，硅谷主要AI实验室的新模型训练计划目前普遍进展不顺，新模型...……更多

2024-11-13 14:09:00英伟,争论,逻辑,意味,根本,策略

Llama 4训练已开启！Meta科学家最新采访，揭秘Lla

...于很难找到能击溃模型的合适prompt，进行性能比较并查看边界情况。比较模型的其中一个好办法就是进行多轮RLHF。每次上传新模型时，只需在所有带标注的prompt上进行采样，让新旧模型分别回答，再自动计算胜率。Llama 4与AgentMe...……更多

2024-07-29 09:33:00科学家,训练,科学,模型,训练,基准

英伟达开源NVLM 1.0屠榜多模态！纯文本性能不降反升

...-D扁平化tile标签： , , ..., ,3）2-D网格标签： , , ..., ,4）2-D边界框标签： (x0, y0), (x1, y1) , ..., (xW, yH), (xW+1, yH+1) ，其中两个坐标分别为(左, 顶部)，(右, 底部)。从消融实验结果中可以观察到：1）……更多

2024-09-24 13:36:00英伟,模态,文本,性能,模态,模型

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...小尺寸版o1-mini。OpenAI官方发文称，新模型旨在解决复杂推理问题，训练模型在响应之前花更多时间思考，类似于人类的思考方式。“新模型在推理能力上代表了AI能力的新水平。”OpenAI称，该模型可以解决科学、编程和数学等更...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

通义千问再放大招：720亿大模型开源，全尺寸赶上LLaMA-

...工作——这些工作都需要复杂的运算，也依赖于模型能力边界的不断拓展。阿里云在会上也请了不少开发者、企业介绍已有的模型实践。比如华东理工大学的X-D Lab，及基于基于开源的通义千问开源模型开发了心理健康大模型MindC...……更多

2023-12-01 21:07:00通义,模型,尺寸,移动,模型,阿里

让大模型能听会说,国内机构开源首个端到端语音对话模型Mini

...交互能力的核心是模型能够直接在语音模态上进行理解和推理，这与传统的语音对话功能有本质的不同。现有的语音对话系统中主要包含 3 个过程：首先将输入语音内容转换为文本，其次利用大语言模型进行文本推理，最后利用...……更多

2024-09-07 09:44:00模型,语音,对话,机构,语音,文本

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力

菲尔兹奖得主亲测GPT-4o，经典过河难题破解失败！最强Cl

...出一个新的测试集，模型就能迅速达到人类水平（图中0.0边界）甚至超越，其中不乏非常有挑战性的逻辑推理任务，比如需要复杂多步骤推理的BBH（Big-Bench Hard）和数学应用题测试集GSK8k。其中的HellaSwag测试集，由华盛顿大学和Al...……更多

2024-07-01 08:58:00菲尔,得主,难题,经典,农夫,模型

人类和AI在推理任务中的表现相似，Google DeepMi

...人工智能（AI），特别是大型Transformer语言模型（LMs）在推理任务中的表现及其局限性。研究结果显示，尽管这些模型在处理自然语言方面表现卓越，但在复杂逻辑推理任务中，人类和语言模型都会受到语义内容合理性和可信度...……更多

2024-08-19 13:49:00局限性,推理,人类,任务,研究,模型

林达华谈大模型发展之路：未来会有更高效的模型结构出现

...的追求和对尺度定律（Scaling Law）的信仰，从而不断突破边界，寻求接近通用人工智能的道路。另一方面，产业界也看到了大模型带来产业革命的可能性，无数企业投入了巨大资源。两股力量交织，促成了人工智能行业的迅猛发...……更多

2024-03-25 10:53:00林达,模型,之路,结构,发展,模型

清华团队提出新型光计算架构，光训练速度提升1个数量级

...统的设计及开发提供了新思路，为光的计算能力开拓了新边界。审稿人对该研究评价称：“本文中提出的想法非常新颖，此类光学神经网络的训练过程是前所未有的。（作者们）所提出的方法不仅有效，而且容易实现。因此，有...……更多

2024-08-09 09:57:00量级,清华,架构,个数,团队,速度

大模型推理乘上RISC-V快车？国内AI芯片创企推大模型系列

...并发、技术自主可控方面具有优势的新选择。AI大模型在推理侧的新机遇与RISC-V创新架构具有的可扩展性、可编程性、超大规模等优势特点不谋而合。技术和场景应用的双重优势下，希姆计算的大模型一体机能支撑企业将基座模...……更多

2023-11-15 15:41:00模型,一体机,推理,快车,芯片,一体

Meta版慢思考来了！田渊栋团队整合快慢思考，能走迷宫推箱子

...本更低。能解决迷宫、推箱子等复杂问题。通过让模型在推理轨迹和最终答案上进行训练，再基于特定策略丢掉部分轨迹，Dualformer模型可以在模仿慢思考的同时，像快思考一样走捷径。由此能形成更简洁的思维链（CoT）。从结...……更多

2024-10-18 09:51:00推箱子,快慢,迷宫,整合,团队,推理

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...集）上，该团队对 Omne 框架进行了评估。为了探索 AI 的边界，他们在 Omne 框架中使用了当今最强大的 GPT-4o 和 o1-preview 模型，同时配备了 4 个工具：网络浏览、Bing 搜索引擎、基于 llamaparse 的文件读取器，一个使用 o1-preview 构建..……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型