• 我的订阅
  • 头条热搜
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
“全球首个通用智能人”北大小女孩“通通”亮相
...模仿,是一种低级智能;乌鸦喝水看似简单,却属于自主推理行为,是由价值与因果驱动的高级智能,也是人工智能的未来发展趋势。他借鉴中国传统哲学思想建立起原创性的以“理”(能力体系 U)与“心”(价值体系 V)双...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
...力:思维树(Tree of Thoughts):让LLM反复思考,大幅提高推理能力。 SWE-bench:一个大模型能力评估数据集。 SWE-agent:一个开源AI程序员。毫不夸张的说,几乎每项研究都在圈里产生了不小的涟漪;并且非常明显的一点是,它们...……更多
ASC24超算大赛圆满结束,北大团队和中大团队分获冠亚军
...在3000瓦功耗约束下设计安装小型超算集群,比拼大模型推理优化、渗流数值模拟、火星大气模拟、地震波模拟、神秘应用以及国际通行基准测试HPL和HPCG等赛题,并参加英文答辩。图丨总决赛竞赛现场(来源:资料图)经过激烈...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1月28日举办
...,以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑。她拥有类人价值观,能自主生成任务,具备物理和社会常识,可保障复杂任务高效执行,推理和...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一种内容自适应的像机轨迹规划算法,以逐步扩展新视角覆盖的区域...……更多
北大第三医院团队深入基层开展技术帮扶
...讯 4月2日,北京大学第三医院马潞林教授带领团队走进北大医疗潞安医院,通过学术讲座、义诊、手术等形式,将最前沿的泌尿外科医疗技术和知识带到基层,让更多长治患者受益。活动中,专家们通过理论讲授、案例分析、...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...: 这项名为 TokenFormer 的新工作,由谷歌,马普计算所和北大的研究者提出,在 Twitter,HackerNews, Reddit 上得到广泛的讨论和关注 (Twitter 上有 150K + 的浏览量)。目前代码、模型和项目主页均已放出:论文链接:https://arxiv.o……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
清华、北大等发布Self-Play强化学习最新综述
...标注数据的依赖,自博弈方法被利用到微调LLM来增强LLM的推理性能。自博弈方法还在构建具有强大战略能力的基于 LLM 的代理方面做出了贡献,在”外交“游戏中达到了人类水平的表现。尽管近期取得了一些进展,将自博弈应用...……更多
更多关于科技的资讯:
舞侠online,双旦活动已经开启
随着2024年步入尾声,2025年的钟声即将敲响,《舞侠online》盛大开启了一系列精彩纷呈的双旦活动,从2024年12月20日-2025年1月5日
2024-12-26 14:45:00
“智7未来 开启智能时代”渤海银行手机银行7.0版焕新发布
2024年12月26日,渤海银行股份有限公司(以下简称“渤海银行”)在“智7未来,开启智能时代”主题发布会上正式推出手机银行7
2024-12-26 15:05:00
海外媒体发稿:解锁环球邮报发稿密码|提升国际公信力
环球邮报:国际传播的有力杠杆《环球邮报》作为加拿大最具影响力的全国性报纸之一,有着深厚的历史底蕴和广泛的受众基础。其创刊于1844年
2024-12-26 15:13:00
政企补贴钜惠来袭,净水器十大品牌之一的立升领跑净水升级潮
近些年,随着国家大力推行“以旧换新”政策,消费者在升级家电产品时得以享受到更多的补贴与优惠,而此举也带动了绿色消费和家电更新换代的浪潮
2024-12-26 15:15:00
《诛仙世界》:2024游戏行业技术革新的一个样本
2024年,中国游戏产业实际销售收入达到3257.83亿元,同比增长7.53%,再创新高。再次逆势而上的中国游戏产业,总值超过三千亿的市场蛋糕
2024-12-26 15:39:00
山东移动临沂分公司完成2024临沂冬季汽车博览会通信保障
鲁网12月26日讯近日,临沂国际会展中心成功举办了2024临沂冬季汽车博览会,此次盛会不仅为汽车行业搭建了展示最新科技与产品的平台
2024-12-26 15:43:00
国风硬核新武侠 《斗笠江湖》让人无法拒绝的N个理由
近日,肖战版的《射雕英雄传》即将在新年档上映引发热议,作为近年来鲜有的纯正武侠电影作品,而且还是由新生代明星扮演“郭靖”这一重磅级角色
2024-12-26 15:45:00
本文转自:人民网12月26日,我国首个国家级海上风电研究与试验检测基地(以下简称“海上风电试验基地”)传动链平台在福建建成投运
2024-12-26 15:51:00
本文转自:人民网-广西频道近日,广西交投科技有限公司党委(以下简称“广西交投科技党委”)在开展领导干部集体谈话时,强调要持续提升廉洁监督信息化水平
2024-12-26 15:56:00
通讯员:杨红亚、闫鹏近日,第二届能源电子产业创新大赛之重点终端应用赛道的颁奖仪式在广州黄埔隆重举办。平高集团提交的三个项目在参与决赛的126个作品中表现卓越
2024-12-26 16:09:00
在当下,跨境电商行业呈现出一片蓬勃发展、日益繁荣的景象,而VAT(增值税)申报已然成为每一家跨境企业都无法回避且必须妥善应对的关键问题
2024-12-26 16:15:00
新质币专家交流研讨会圆满举行:探索数字货币新机遇与技术挑战
近日,新质币专家交流研讨会吸引了来自金融、科技、区块链等多个领域的专家学者和行业代表,共同探讨新质币时代的技术创新与行业前景
2024-12-26 16:22:00
在数字化转型的浪潮中,5G技术与工业的深度融合正为工业领域带来前所未有的变革。泰安联通基于5G网络和边缘计算技术的创新产品——5G智慧监管平台
2024-12-26 16:38:00
加装电梯攻略:避开这些“坑”,省心又省钱
随着老旧小区改造的推进,加装电梯成为了许多居民改善居住条件的热门选择。然而,加装电梯过程中隐藏着不少“坑”,稍不留神就可能造成不必要的经济损失
2024-12-26 16:38:00
加装电梯,细节决定成败——你不可忽视的五大细节
在老旧小区加装电梯的热潮中,许多居民对于如何顺利推进项目感到困惑。加装电梯不仅仅是添置一部机器那么简单,其中的细节决定着整个项目的成败
2024-12-26 16:39:00