• 我的订阅
  • 头条热搜
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
“全球首个通用智能人”北大小女孩“通通”亮相
...模仿,是一种低级智能;乌鸦喝水看似简单,却属于自主推理行为,是由价值与因果驱动的高级智能,也是人工智能的未来发展趋势。他借鉴中国传统哲学思想建立起原创性的以“理”(能力体系 U)与“心”(价值体系 V)双...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
对话北大赵东岩:为啥DeepSeek幻觉率这么高?用户如何避免被AI“欺骗”?
...达14.3%,显著高于DeepSeek-V3的3.9%,也远远超过行业的其他推理模型,比如OpenAI-o1的测试结果是2.4%。这种AI大模型生成内容与真实数据不符,或偏离用户指令的现象,会极大影响用户的使用体验。在医疗、法律、金融等对准确性要...……更多
揭示Transformer「周期建模」缺陷!北大提出新型神经网络FAN,填补周期性特征建模能力缺陷
...中的商业周期、物理学中的电磁波,以及数学运算和逻辑推理等。因此,在许多任务和场景中,人们希望对周期进行建模,以便根据以往的经验进行推理。尽管以 MLP 和 Transformer 为代表的基础模型已经取得了显著的成功,但是它...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
...这个思路,我们开始思考:视觉模型是否也能实现类似的推理能力?”与传统大模型训练的 SFT(Supervised Fine-Tuning)方法不同,R1方法的突破在于其路径创新。SFT依赖海量标注数据进行“填鸭式”教学,而R1方法则通过强化学习,...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
...力:思维树(Tree of Thoughts):让LLM反复思考,大幅提高推理能力。 SWE-bench:一个大模型能力评估数据集。 SWE-agent:一个开源AI程序员。毫不夸张的说,几乎每项研究都在圈里产生了不小的涟漪;并且非常明显的一点是,它们...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...ta 提出“可持续思维链”:让大语言模型在连续潜空间中推理GameArena:通过实时电脑游戏评估 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术...……更多
ASC24超算大赛圆满结束,北大团队和中大团队分获冠亚军
...在3000瓦功耗约束下设计安装小型超算集群,比拼大模型推理优化、渗流数值模拟、火星大气模拟、地震波模拟、神秘应用以及国际通行基准测试HPL和HPCG等赛题,并参加英文答辩。图丨总决赛竞赛现场(来源:资料图)经过激烈...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
NeurIPS 2024 | 数学推理场景下,首个分布外检测研究成果来了
本文将介绍数学推理场景下的首个分布外检测研究成果。该篇论文已被 NeurIPS 2024 接收,第一作者王一鸣是上海交通大学计算机系的二年级博士生,研究方向为语言模型生成、推理,以及可解释、可信大模型。该工作由上海交通...……更多
以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1月28日举办
...,以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑。她拥有类人价值观,能自主生成任务,具备物理和社会常识,可保障复杂任务高效执行,推理和...……更多
...大模型加入数学领域的解题算法。“OpenAI说GPT-4有强大的推理能力,我感觉主要指的是它的数学水平高。”赵海告诉记者,“其实,推理能力包含逻辑推理能力和数学抽象思维能力,这两种能力是有区别的,前者侧重寻找因果关系。相...……更多
上海AI实验室版o1已上线!数学题、Leetcode全拿下,还会玩24点
...编程、数字游戏等任务。这就是上海AI实验室版o1——强推理模型书生InternThinker,刚刚正式开放试用!新模型不仅在长思维能力方面有了很大提升,而且还能在推理过程中进行自我反思和纠正。先来一起看两个例子感受一下:比...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
微软华人团队发布全新基准AGIEval,专为人类考试而生
...2.5%,表明了目前基础模型的非凡表现。但GPT-4在需要复杂推理或特定领域知识的任务中不太熟练,文中对模型能力(理解、知识、推理和计算)的全面分析揭示了这些模型的优势和局限性。AGIEval数据集近年来,大型基础模型如GPT-4...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一种内容自适应的像机轨迹规划算法,以逐步扩展新视角覆盖的区域...……更多
北大第三医院团队深入基层开展技术帮扶
...讯 4月2日,北京大学第三医院马潞林教授带领团队走进北大医疗潞安医院,通过学术讲座、义诊、手术等形式,将最前沿的泌尿外科医疗技术和知识带到基层,让更多长治患者受益。活动中,专家们通过理论讲授、案例分析、...……更多
AI 的“心智理论”难题:Meta ExploreToM 探索突破之路
...单的预定义场景,无法复制人类用来推断心理状态的复杂推理。ExploreToM 框架ExploreToM 通过生成多样化、可扩展的对抗性数据集,为提升 AI 的 ToM 能力奠定了坚实基础。该研究强调了当前模型的局限性,以及高质量训练数据对于...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
更多关于科技的资讯:
潍坊市坊子区举行食品产业链路演对接会,推动资源共享,促进“互配互采”—— 政企同心绘就食品产业“新蓝图”
鲁网3月8日讯“这场对接会真是一场及时雨!”3月7日,刚刚走出对接会会场,山东同源水业有限公司负责人徐源就感慨道。据了解
2025-03-08 16:39:00
厦门中芯云大数据研究院发布HUB AI健康助手,开启智能健康新时代
2025年2月22日,厦门中芯云大数据研究院今日宣布,其自主研发的HUBAI健康助手正式发布,推出手机版和电视版两款产品
2025-03-08 17:08:00
全国人大代表尹双凤:完善科技评价标准化机制,激发创新驱动力
本文转自:人民网-湖南频道全国人大代表尹双凤。受访单位供图人民网长沙3月8日电 (记者林洛頫)在科技创新成为全球竞争焦点的当下
2025-03-08 17:44:00
本文转自:人民日报本报记者 耿 磊 葛 燊 杨翘楚3月8日上午,十四届全国人大三次会议第二场“代表通道”在人民大会堂举行
2025-03-09 06:25:00
本文转自:人民日报本报记者  蒋雨师作为一名参与全国两会报道的摄影记者,以往我主要根据个人经验选择拍摄点位和角度,这次人工智能(AI)助手成了我的报道“搭子”
2025-03-09 06:28:00
本文转自:人民日报中兴通讯高级副总裁  苗伟代表近年来,中兴通讯在5G、云计算、大数据、人工智能等核心技术领域持续创新
2025-03-09 06:29:00
饿了么定制升级“助老e餐”服务  政企合作共建数字化未来社区
本文转自:人民日报“小饭碗”关系着老龄事业的“大民生”。对很多老人而言,解决好每天的吃饭问题,居家养老的安全感和幸福感就能大幅提升
2025-03-09 06:30:00
本文转自:人民日报马新强代表谈科技自立自强——创新是一场没有终点的长跑(现场·代表通道)本报记者 耿 磊43秒,能做什么
2025-03-09 06:32:00
时速近200公里!小米SU7 Ultra深夜狂飙严重超速 官方通报:车主已抓获
快科技3月9日消息,日前,山东潍坊公安就一起“司机驾驶小米SU7 Ultra飙车”事件发布情况通报。根据潍坊交警抖音账号公布的视频画面显示
2025-03-09 06:46:00
你会扶吗!00后小伙遇大爷摔倒毫不犹豫扶:觉得讹人的应该挺少的
3月9日消息,一位00后小伙的善举引起了网友的热议,不少人纷纷为他点赞。近日,山东潍坊00后小伙张先生偶遇大爷摔倒。当时大爷骑的三轮倒在马路边上
2025-03-09 06:46:00
专家称0补课、0月考孩子成绩都是A:国内教育应停止“掐尖”急功近利
3月9日消息,全国人大代表、重庆市九龙坡区谢家湾学校党委书记刘希娅近日公开表示,学校0补课0月考,9成孩子成绩是A。刘希娅建议革新人才培养机制
2025-03-09 06:46:00
小米终结特斯拉销量神话
外媒惊呼,特斯拉神话已经被小米终结了。在中国市场,特斯拉Model 3的销量已经被小米SU7超越。连外国网友也不由惊叹小米SU7的实力
2025-03-08 13:45:00
“实习生也月入过万”,这一行业严重缺人
作者: 张旦珺市场对寻求AI人才的渴望,到了按图索骥的程度。晚点latepost曾在报道中记录过这样一个细节:当一位投资人循着AI论文上的名字一个个去拜访时
2025-03-09 03:32:00
英特尔酷睿Ultra 9 285H性能实测:50W超越前代90W性能
年初英特尔正式发布了英特尔酷睿Ultra 200H标压处理器,该系列对应上一代酷睿Ultra 100H系列处理器,最高规格为16核CPU+8核GPU的配置
2025-03-08 22:45:00
直屏回归!小米16 Pro采用全新设计
近期,知名数码博主数码闲聊站带来了一则消息:即将在10月左右发布的迭代旗舰手机,将普遍转向直屏设计,并引入LIPO这一前沿技术
2025-03-08 23:15:00