推理,北大,团队,解释,能力,理论头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

自我纠错如何使OpenAI o1推理能力大大加强?北大MIT

...的技术，使得模型能够在最终确定回复之前，先检测自身推理的错误并纠正。在实际的执行过程中，这会用到一种名为思考标签（thinking tag）的机制。模型会在这个标签内部进行反思，直到它得到正确答案或认为自己得到了正确...……更多

2024-11-19 09:48:00推理,北大,团队,解释,能力,理论

“全球首个通用智能人”北大小女孩“通通”亮相

...模仿，是一种低级智能；乌鸦喝水看似简单，却属于自主推理行为，是由价值与因果驱动的高级智能，也是人工智能的未来发展趋势。他借鉴中国传统哲学思想建立起原创性的以“理”（能力体系 U）与“心”（价值体系 V）双...……更多

2024-09-14 09:48:00小女,小女孩,北大,智能,全球,智能

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超闭

...ion模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。新模型具体如何推理，直接上实例，比如问题是：减去所有的小亮球和紫...……更多

2024-11-20 09:42:00模态,推理,北大,视觉,模型,推理

对话北大赵东岩：为啥DeepSeek幻觉率这么高？用户如何避

...达14.3%，显著高于DeepSeek-V3的3.9%，也远远超过行业的其他推理模型，比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符，或偏离用户指令的现象，会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多

2025-03-05 15:54:00东岩,幻觉,北大,对话,用户,模型

揭示Transformer「周期建模」缺陷！北大提出新型神经

...中的商业周期、物理学中的电磁波，以及数学运算和逻辑推理等。因此，在许多任务和场景中，人们希望对周期进行建模，以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功，但是它...……更多

2024-11-27 13:34:00周期,缺陷,神经网络,周期性,北大,特征

5年投资超1000亿，北京公布一系列AI重磅成果，北大清华百

...计算具备高算力低功耗的特性，能够加速AI大模型训练与推理。戴琼海提到，清华大学提出光电混合全模拟智能计算架构，研制ACCEL芯片，突破光电模数转换瓶颈。相比A100，ACCEL系统级算力提升3个数量级，能效提升6个数量级（百...……更多

2024-04-28 11:00:00大佬,清华,微软,重磅,北京,蚂蚁

无一大模型及格！北大/通研院提出超难基准，评估长文本理解生

...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k，GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型，平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多

2024-08-08 09:39:00基准,北大,生成,模型,文本,评估

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

全模态对齐框架align-anything来啦：实现跨模态指

...-Vision-11B 既准确地识别出了餐厅，还提供了细致的思考与推理过程。在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下，北大对齐小组愿开源数据、训练、模型、评估的全流程，为全模态对齐研究贡献力量。对齐框架...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

Transformer推理天花板被谷歌打破？DeepMind

...科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？随着OpenAI o1的爆火，最近CoT也成了圈内热议的高频词。靠着CoT的强力加持，o1...……更多

2024-09-21 09:43:00天花,天花板,推理,首席,科学家,科学

o1 基石论文火爆传阅：Ilya 仍是关键先生，核心项目清北

...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理，在输出回答之前，会在产生一个很长的思维链，以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多

2024-09-18 09:51:00基石,闪光,校友,火爆,核心,先生

全球瞩目，又是杭州！这款视觉推理模型一夜起飞

...这个思路，我们开始思考：视觉模型是否也能实现类似的推理能力？”与传统大模型训练的 SFT（Supervised Fine-Tuning）方法不同，R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学，而R1方法则通过强化学习，...……更多

2025-02-26 07:07:00杭州,推理,模型,视觉,又是,全球

北大提出首个通用指令导航大模型系统 | CoRL 24

...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法，然而在真实应用中，人类可能向机器人下达不同形式的指令，甚至混合类型指令，现有的...……更多

2024-09-13 13:38:00指令,北大,模型,导航,系统,导航

Claude团队喜提清华物理学霸姚顺宇！两个Yao Shun

...力：思维树（Tree of Thoughts）：让LLM反复思考，大幅提高推理能力。 SWE-bench：一个大模型能力评估数据集。 SWE-agent：一个开源AI程序员。毫不夸张的说，几乎每项研究都在圈里产生了不小的涟漪；并且非常明显的一点是，它们...……更多

2024-10-29 09:54:00清华,物理学,模型,团队,物理,两个

Meta提出“可持续思维链”，让大模型在连续潜空间中推理

...ta 提出“可持续思维链”：让大语言模型在连续潜空间中推理GameArena：通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文？点击阅读原文，查看「2024必读大模型论文」合集，以及申请加入「大模型技术...……更多

2024-12-13 09:19:00推理,模型,思维,空间,模型,生成

ASC24超算大赛圆满结束，北大团队和中大团队分获冠亚军

...在3000瓦功耗约束下设计安装小型超算集群，比拼大模型推理优化、渗流数值模拟、火星大气模拟、地震波模拟、神秘应用以及国际通行基准测试HPL和HPCG等赛题，并参加英文答辩。图丨总决赛竞赛现场（来源：资料图）经过激烈...……更多

2024-04-16 14:26:00冠亚,中大,团队,冠亚军,北大,大赛

摆脱Transformer依赖？这家AI初创公司推出国内首个

...能效果——记忆能力提升3倍、速度提升7倍的同时，实现推理吞吐量的5倍提升。至于为何另辟蹊径，寻求非Transformer的大模型路径，岩芯数智CEO刘凡平指出，以大规模著称的Transformer，在实际应用中的高算力和高成本，让不少中...……更多

2024-01-29 06:31:00模型,机制,公司,模型,架构,岩芯

NeurIPS 2024 | 数学推理场景下，首个分布外检测

本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收，第一作者王一鸣是上海交通大学计算机系的二年级博士生，研究方向为语言模型生成、推理，以及可解释、可信大模型。该工作由上海交通...……更多

2024-12-03 13:33:00研究成果,推理,场景,成果,检测,数学

以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1

...，以原创的认知架构理论为顶层设计，由自研国产学习和推理框架（通用人工智能操作系统TongOS2.0和编程语言TongPL2.0）为底层支撑。她拥有类人价值观，能自主生成任务，具备物理和社会常识，可保障复杂任务高效执行，推理和...……更多

2024-01-23 15:58:00成果展,科技,人工智能,人工,将于,成果

数学不太好的文科生

...大模型加入数学领域的解题算法。“OpenAI说GPT-4有强大的推理能力,我感觉主要指的是它的数学水平高。”赵海告诉记者,“其实,推理能力包含逻辑推理能力和数学抽象思维能力,这两种能力是有区别的,前者侧重寻找因果关系。相...……更多

2023-03-16 09:23:00文科生,文科,数学,赵海,模型,能力

上海AI实验室版o1已上线！数学题、Leetcode全拿下，

...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker，刚刚正式开放试用！新模型不仅在长思维能力方面有了很大提升，而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下：比...……更多

2024-11-29 09:27:00数学题,上海,实验室,实验,数学,模型

北大推出全新机器人多模态大模型！面向通用和机器人场景的高效推

...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力，本文创新性地将视觉编码器与高效的状态空间语言模型集成，构建了全新的 RoboMamba 多模态大模型，使其具备视觉常识任务和机器人相关任务的推理能力，...……更多

2024-06-21 09:52:00机器,模态,人多,机器人,推理,北大

微软华人团队发布全新基准AGIEval，专为人类考试而生

...2.5%，表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练，文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来，大型基础模型如GPT-4...……更多

2023-05-13 21:28:00微软,基准,专为,团队,人类,全新

本周（4.8-4.14）AI界发生了什么？

...模型中，只需一次API调用，该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B，参数规模高达1760亿，仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑，搭载AI功能当地时间4月11...……更多

2024-04-14 20:33:00模型,特斯,马斯,芯片,融资,英特

奥林匹克竞赛里选最聪明的AI：Claude-3.5-Sonn

...异，近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论：Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“（Most Intelligent AI）了……更多

2024-06-25 09:45:00奥林,奥林匹克,竞赛,模型,推理,能力