• 我的订阅
  • 头条热搜
自我纠错如何使OpenAI o1推理能力大大加强?北大MIT团队理论解释
...的技术,使得模型能够在最终确定回复之前,先检测自身推理的错误并纠正。在实际的执行过程中,这会用到一种名为思考标签(thinking tag)的机制。模型会在这个标签内部进行反思,直到它得到正确答案或认为自己得到了正确...……更多
“全球首个通用智能人”北大小女孩“通通”亮相
...模仿,是一种低级智能;乌鸦喝水看似简单,却属于自主推理行为,是由价值与因果驱动的高级智能,也是人工智能的未来发展趋势。他借鉴中国传统哲学思想建立起原创性的以“理”(能力体系 U)与“心”(价值体系 V)双...……更多
北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超闭源
...ion模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。新模型具体如何推理,直接上实例,比如问题是:减去所有的小亮球和紫...……更多
5年投资超1000亿,北京公布一系列AI重磅成果,北大清华百度蚂蚁微软大佬齐谈AI未来|钛媒体AGI
...计算具备高算力低功耗的特性,能够加速AI大模型训练与推理。戴琼海提到,清华大学提出光电混合全模拟智能计算架构,研制ACCEL芯片,突破光电模数转换瓶颈。相比A100,ACCEL系统级算力提升3个数量级,能效提升6个数量级(百...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
...的长依赖任务中的多信息检索、时间重排序、计算、理解推理能力表现均不乐观。比如像Claude3-200k,GPT4-32k、GPT4-8k、GPT3.5-turbo-6k、LlamaIndex这种商业模型,平均只有40%的准确率。而像开源模型表现就更不理想了…ChatGLM2-6B、LongLL……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...-Vision-11B 既准确地识别出了餐厅,还提供了细致的思考与推理过程。 在 Meta 并未披露 Llama-3.2-11B-Vision-Instruct 对齐技术细节情况下,北大对齐小组愿开源数据、训练、模型、评估的全流程,为全模态对齐研究贡献力量。对齐框架...……更多
Transformer推理天花板被谷歌打破?DeepMind首席科学家亮出84页PPT,却遭LeCun反对
...科学家Denny Zhou拿出一篇ICLR 2024论文称:CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终,CoT会是通往AGI的正确路径吗?随着OpenAI o1的爆火,最近CoT也成了圈内热议的高频词。靠着CoT的强力加持,o1...……更多
o1 基石论文火爆传阅:Ilya 仍是关键先生,核心项目清北校友闪光
...后的贡献者。Ilya 在 o1 的作用 OpenAI o1 主打进行通用复杂推理,在输出回答之前,会在产生一个很长的思维链,以此增强模型能力。而 Ilya 此前合著的这篇论文主要就是探讨了提高大语言模型多步推理能力的方法。他们主要比较...……更多
北大提出首个通用指令导航大模型系统 | CoRL 24
...兴的需求驱动的导航任务要求根据人类抽象需求进行语义推理。先前研究工作都围绕某一种特定类型的指令设计一个特定类型的导航方法,然而在真实应用中,人类可能向机器人下达不同形式的指令,甚至混合类型指令,现有的...……更多
Claude团队喜提清华物理学霸姚顺宇!两个Yao Shunyu都投身大模型
...力:思维树(Tree of Thoughts):让LLM反复思考,大幅提高推理能力。 SWE-bench:一个大模型能力评估数据集。 SWE-agent:一个开源AI程序员。毫不夸张的说,几乎每项研究都在圈里产生了不小的涟漪;并且非常明显的一点是,它们...……更多
ASC24超算大赛圆满结束,北大团队和中大团队分获冠亚军
...在3000瓦功耗约束下设计安装小型超算集群,比拼大模型推理优化、渗流数值模拟、火星大气模拟、地震波模拟、神秘应用以及国际通行基准测试HPL和HPCG等赛题,并参加英文答辩。图丨总决赛竞赛现场(来源:资料图)经过激烈...……更多
摆脱Transformer依赖?这家AI初创公司推出国内首个非Attention机制大模型
...能效果——记忆能力提升3倍、速度提升7倍的同时,实现推理吞吐量的5倍提升。 至于为何另辟蹊径,寻求非Transformer的大模型路径,岩芯数智CEO刘凡平指出,以大规模著称的Transformer,在实际应用中的高算力和高成本,让不少中...……更多
以原创科技驱动发展 “迈向通用人工智能前沿科技成果展”将于1月28日举办
...,以原创的认知架构理论为顶层设计,由自研国产学习和推理框架(通用人工智能操作系统TongOS2.0和编程语言TongPL2.0)为底层支撑。她拥有类人价值观,能自主生成任务,具备物理和社会常识,可保障复杂任务高效执行,推理和...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...码仓库 Trending Research 第一位。为了赋予机器人端到端的推理和操纵能力,本文创新性地将视觉编码器与高效的状态空间语言模型集成,构建了全新的 RoboMamba 多模态大模型,使其具备视觉常识任务和机器人相关任务的推理能力,...……更多
本周(4.8-4.14)AI界发生了什么?
...模型中,只需一次API调用,该模型就可以分析图像并应用推理。“欧洲版OpenAI”Mistral AI也正式开源了大模型Mixtral8x22B,参数规模高达1760亿,仅次于马斯克AI公司的Grok-1大模型。苹果或在9月发布新电脑,搭载AI功能当地时间4月11...……更多
奥林匹克竞赛里选最聪明的AI:Claude-3.5-Sonnet vs. GPT-4o?
...异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论:Claude-3.5-Sonnet 已经取代OpenAI的GPT4o成为世界上”最聪明的AI“(Most Intelligent AI)了……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...此外,现有的视频扩散模型难以生成长视频,因为长视频推理会造成巨大的计算开销。为了解决这一问题,研究采用了一种迭代式的新视角生成策略,并提出了一种内容自适应的像机轨迹规划算法,以逐步扩展新视角覆盖的区域...……更多
北大第三医院团队深入基层开展技术帮扶
...讯 4月2日,北京大学第三医院马潞林教授带领团队走进北大医疗潞安医院,通过学术讲座、义诊、手术等形式,将最前沿的泌尿外科医疗技术和知识带到基层,让更多长治患者受益。活动中,专家们通过理论讲授、案例分析、...……更多
清华团队提出新型光计算架构,光训练速度提升1个数量级
...智能计算的“潜力股”,为后摩尔时代带来新的希望。 推理和训练是 AI 大模型核心能力的两个重要阶段,正是看到了这一点,该团队在推理和训练方面进行了同期的并行研究。今年 4 月,他们在 Science 报道了通用智能光计算芯...……更多
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
...,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文一作为华人学者Tian...……更多
AI表现直逼国际奥数优秀选手, 它要 “征服”数学了吗?
...同步揭晓。这项赛事的目的是推动发展大语言模型的数学推理能力,训练出更高数学水平的新AI模型。纯数学领域中的重大发现是推理和创造力的灵感结晶,往往意味着人类智慧极限的突破。迄今为止,解决或协助解决高等级数...……更多
小模型越级挑战14倍参数大模型,谷歌Test-Time端新的Scaling Law
...发布的新模型草莓所用的方法。研究团队探究了在大模型推理时进行计算优化的方法,根据给定的prompt难度,动态地分配测试时(Test-Time)的计算资源。结果发现这种方法在一些情况下比单纯扩展模型参数更经济有效。换句话说...……更多
OpenAI没有放弃的机器人梦想
...人团队,理由是缺乏训练机器人使用人工智能进行移动和推理所需的数据,研发受到了阻碍。当时,在美国创业孵化器Y Combinator的论坛上,BuzzFeed数据科学家马克思·伍尔夫(Max Woolf)直言 :“一种可能准确但带有讽刺意味的观...……更多
Token化一切,甚至网络!北大&谷歌&马普所提出TokenFormer
...: 这项名为 TokenFormer 的新工作,由谷歌,马普计算所和北大的研究者提出,在 Twitter,HackerNews, Reddit 上得到广泛的讨论和关注 (Twitter 上有 150K + 的浏览量)。目前代码、模型和项目主页均已放出:论文链接:https://arxiv.o……更多
让OpenAI o1逆天的慢思考,360两月前就做出来了?周鸿祎CoE媲美CoT,应用太前瞻
...读】o1大火背后,最关键的技术是CoT。模型通过一步一步推理,恰恰是「慢思考」的核心要义。而这一观点,其实这家国内大厂早就率先实现了。OpenAI的理念,居然被国内公司抢先践行了?比起OpenAI,这家公司的idea提出得更早,...……更多
清华、北大等发布Self-Play强化学习最新综述
...标注数据的依赖,自博弈方法被利用到微调LLM来增强LLM的推理性能。自博弈方法还在构建具有强大战略能力的基于 LLM 的代理方面做出了贡献,在”外交“游戏中达到了人类水平的表现。尽管近期取得了一些进展,将自博弈应用...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
全国唯一!重庆一初三学生入选“物理卓越计划” 提前锁定北大
近日,北京大学2024年“物理学科卓越人才培养计划”入选结果公布,重庆八中宏帆中学初三年级学生刘家亦成功入选,他是本年度全国唯一一位入选北京大学物理卓越计划的初三学生。北京大学2024年“物理学科卓越人才培养计...……更多
更多关于科技的资讯:
Kimi公司大语言推理系统专利获授权
月之暗面大语言推理系统专利获授权天眼查财产线索信息显示,近日,Kimi关联公司北京月之暗面科技有限公司申请的“一种大语言推理系统及方法”专利获授权
2025-03-04 10:42:00
共话AI前沿,奥哲2025低代码数智化峰会3月13日开启!
近日,奥哲宣布将于3月13日至21日在上海、北京、广州举办数智新程·2025奥哲低代码数智化峰会暨云枢新品发布会。奥哲创始人兼CEO徐平俊
2025-03-04 10:45:00
比发丝细千倍!苏大维格用“纳米画笔”改写光刻技术格局
在苏州工业园区企业苏大维格的无尘实验室里,一台名为"iGrapher3000"的巨型设备正挥动着无形画笔——它以0.1微米的超精度(相当于头发丝的千分之一)
2025-03-04 10:52:00
退出硬件市场造成相关服务下线 搜狗AI录音笔智能变无能
图一:搜狗录音笔电商页面宣称“终身免费录音转写文字的会员功能”。 图二:“搜狗AI黑科技”的客服给邵女士提出了补偿方案
2025-03-04 11:08:00
2025全国两会天津北方网讯:2025年全国两会期间,津云记者探访脑机交互与人机共融海河实验室,天津大学神经工程团队为记者介绍了最新科研成果——全球首个片上脑机接口智能交互系统
2025-03-04 11:11:00
3月3日,雀巢集团(以下简称“雀巢”)公告称,已与徐氏家族达成协议,收购徐福记国际集团(以下简称“徐福记”)剩余40%的股份
2025-03-04 11:14:00
豆包语音大模型优化小说演播,大咖音色媲美真人
近日,字节跳动的豆包语音大模型在小说演播场景取得突破,无需对话旁白、情感、角色等额外标签,也能实现高表现力、高自然度、高语义理解的小说演播效果
2025-03-04 11:14:00
网易游戏几乎全系崩了:玩家登不上!官方发文致歉
3月3日晚,据大量玩家反馈和对应官微公告,网易旗下的《逆水寒手游》《燕云十六声》《蛋仔派对》《光遇》《第五人格》《阴阳师》等多款游戏同时出现服务器异常
2025-03-04 11:14:00
鲁网3月4日讯近日,山东省地质测绘院完成国产人工智能大模型DeepSeek的本地化部署,并启动内部测试,将其应用于院内办公场景
2025-03-04 11:37:00
画里有话|全国爱耳日:关注耳部健康,聚焦搏动性耳鸣
文案:威海市立医院耳科副主任 韩丽设计:张芮策划:丛溦
2025-03-04 11:38:00
冯擎峰微博言论引风波,莲花味精无辜躺枪,回应:我们不卖跑车
近日,“莲花LIANHUA官方旗舰店”抖音账号发布了一则澄清视频:清汤大老爷们,莲花控股是卖调料的,是莲花味精啊,俺不卖跑车
2025-03-04 11:46:00
本文转自:人民网人民网北京3月4日电 (高清扬)3月4日,十四届全国人大三次会议在人民大会堂举行新闻发布会。大会发言人娄勤俭在回答记者提问时表示
2025-03-04 13:17:00
随着元宇宙技术的快速迭代与教育数字化转型的深入推进,虚拟现实(VR)、区块链、人工智能(AI)等技术正重构教育生态。作为数字原住民的大学生群体
2025-03-04 11:47:00
海外网3月4日电 新加坡《联合早报》3月3日刊发两会特稿表示,中国科技发展等经济议题预计将贯穿今年两会。报道说,宇树科技人形机器人等中国人工智能项目崭露头角
2025-03-04 11:48:00
宁波银行深圳分行以金融活水赋能智驾领域民营企业高质量发展
2024年深圳新能源汽车产量超293万辆,卫冕中国新能源汽车第一城。智能网联汽车产业亦是深圳20个战略性新兴产业重点发展领域和8个未来产业重点发展方向之一
2025-03-04 11:51:00