• 我的订阅
  • 头条热搜
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
“全球首个通用智能人”北大小女孩“通通”亮相
...模仿,是一种低级智能;乌鸦喝水看似简单,却属于自主推理行为,是由价值与因果驱动的高级智能,也是人工智能的未来发展趋势。他借鉴中国传统哲学思想建立起原创性的以“理”(能力体系 U)与“心”(价值体系 V)双...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
...力:思维树(Tree of Thoughts):让LLM反复思考,大幅提高推理能力。 SWE-bench:一个大模型能力评估数据集。 SWE-agent:一个开源AI程序员。毫不夸张的说,几乎每项研究都在圈里产生了不小的涟漪;并且非常明显的一点是,它们...……更多
ASC24超算大赛圆满结束,北大团队和中大团队分获冠亚军
...在3000瓦功耗约束下设计安装小型超算集群,比拼大模型推理优化、渗流数值模拟、火星大气模拟、地震波模拟、神秘应用以及国际通行基准测试HPL和HPCG等赛题,并参加英文答辩。图丨总决赛竞赛现场(来源:资料图)经过激烈...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1月28日举办
...,以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑。她拥有类人价值观,能自主生成任务,具备物理和社会常识,可保障复杂任务高效执行,推理和...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一种内容自适应的像机轨迹规划算法,以逐步扩展新视角覆盖的区域...……更多
北大第三医院团队深入基层开展技术帮扶
...讯 4月2日,北京大学第三医院马潞林教授带领团队走进北大医疗潞安医院,通过学术讲座、义诊、手术等形式,将最前沿的泌尿外科医疗技术和知识带到基层,让更多长治患者受益。活动中,专家们通过理论讲授、案例分析、...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...: 这项名为 TokenFormer 的新工作,由谷歌,马普计算所和北大的研究者提出,在 Twitter,HackerNews, Reddit 上得到广泛的讨论和关注 (Twitter 上有 150K + 的浏览量)。目前代码、模型和项目主页均已放出:论文链接:https://arxiv.o……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
清华、北大等发布Self-Play强化学习最新综述
...标注数据的依赖,自博弈方法被利用到微调LLM来增强LLM的推理性能。自博弈方法还在构建具有强大战略能力的基于 LLM 的代理方面做出了贡献,在”外交“游戏中达到了人类水平的表现。尽管近期取得了一些进展,将自博弈应用...……更多
更多关于科技的资讯:
涉及两起命案:福特被深度调查!
快科技1月23日消息,近日,美国家公路交通安全管理局(NHTSA)宣称,已对福特BlueCruise驾驶辅助系统展开工程分析(EA)
2025-01-23 18:33:00
当前设计塞不进电池:纯电版路虎卫士将推迟至2030年
快科技1月23日消息,捷豹路虎首席商务官Lennard Hoornik在接受采访时透露,电动版路虎卫士预计要到2030年前后才会问世
2025-01-23 18:33:00
国人骄傲!阿里云、华为首席技术官双双入选美国计算机协会
快科技1月23日消息,据媒体综合报道,今日凌晨,美国计算机协会 ACM(Association for Computing Machinery)公布了最新一届会士名单
2025-01-23 18:33:00
中韩独享!三星Galaxy S25 Ultra 16GB版本无缘欧美市场
快科技1月23日消息,三星Galaxy 25系列已面向全球发布,所有型号其实内存均为12GB。其中,三星Galaxy S25 Ultra独享16GB大内存
2025-01-23 18:33:00
奇瑞2025王炸开局!要做中国大G 新车秒变船 排水量4吨
中国的豪华越野市场,又闯进一位新选手。昨晚,奇瑞正式发布全新产品序列——捷途纵横,这是奇瑞品牌向上战略的关键一步,起点很高
2025-01-23 18:33:00
599元起!玄派玄熊猫PD75M V2机械键盘开售:彩屏+旋钮、索尼克轴
快科技1月23日消息,玄派科技正式上架了玄熊猫PD75M V2机械键盘,其特点是内置彩屏和金属旋转按钮,首发价格分别为599元和629元
2025-01-23 18:33:00
小米SU7最贵配色!雷军晒璀璨洋红实车:明天开始陆续进店
快科技1月23日消息,雷军最新发文称,小米SU7璀璨洋红明天开始陆续进店,届时大家就能去店里看到实车了。他还晒出了几张在小米汽车工厂拍摄的实车照片
2025-01-23 18:33:00
Intel前CEO基辛格新动向公布!成初创AI芯片公司种子投资人
快科技1月23日消息,在离开英特尔后,前CEO帕特·基辛格(Pat Gelsinger)在社交媒体上公布了新动向,成为英国AI芯片初创公司Fractile
2025-01-23 18:33:00
RTX 5090缺货不可思议!英国顶级零售商只有几块
快科技1月23日消息,由于AIC沟通问题、中国春节放假、BIOS调试等种种原因,RTX 5090/5090D、RTX 5080上市初期的供货将非常紧张
2025-01-23 18:33:00
上半年最值得关注的5款新车盘点:看完你会买吗
说实话,25年上半年并不是购车的较好时机,因为英伟达下一代最强算力平台Thor有望会从6月开始上市,部分车企的明星产品也推迟到了对应时间点
2025-01-23 18:33:00
3C数码国家补贴至高省2000元 手机补贴15%
京东货节大促将在今晚 24 点正式结束,年前最后一波福利不要错过。京东红包每天抽 3 次 面额至高 9999 元:点此抽红包(1 月 23 日 24 点结束)手机
2025-01-23 18:33:00
被五步蛇咬了 只走四步还会死吗
提示:本集内容涉及大量蛇,对蛇敏感人士建议不要打开,想“知己知彼”对付毒蛇的建议收看,怕被毒蛇咬的建议收藏。责任编辑:上方文Q文章内容举报
2025-01-23 18:33:00
又一家国产新势力爆雷!员工工资数月未发 强制放假
快科技1月23日消息,据博主爆料称,又一家国产造车新势力爆雷,员工已被拖欠数月工资,且被安排强制放假。被传爆雷的新势力是智行盒子
2025-01-23 18:33:00
“天关”卫星探测到宇宙早期爆发的软X射线信号
本文转自:人民日报客户端基于天关卫星的观测数据,中国科学院国家天文台等单位的科研人员,发现1例来自宇宙早期的伽马射线暴
2025-01-23 18:35:00
“我们食品厂生产的银丝面久煮不烂、晶莹剔透,入口香软滑嫩,在市场上的销售一直很好。感谢咱农商银行提供的50万元的信贷资金
2025-01-23 19:03:00