• 我的订阅
  • 头条热搜
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...没有任何阻碍。——但其实还是有的,那就是新东西通常太贵。o1-preview的每百万输入token为15美元,每百万输出token为60美元,而对位的GPT-4o分别是5美元和15美元。本来GPT-4o就不便宜,现在想体验更强大的推理能力则需要再付出几...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...我进化的方式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监……更多
3天把Llama训成Mamba,性能不降,推理更快!
...为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关的研究每天都有,但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba(进化到了1.5版本,最大398B,MoE),以及NVIDIA的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...judge提示模板。除了给出评价结果,meta-judge还需要生成CoT推理过程。为减少meta-judge可能存在的位置偏好(可能倾向于选择最先出现的Judgment A),对同一对数据(jm, jn)会交换顺序让meta-judge进行两次评价,得到单次结果rmn: 引入...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可以分析并规划系统策略,自动...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...CodeAlign在整个数据生成过程中,使用相同的基础模型进行推理,分为三步:首先,从高质量的种子片段中提取不同的编码概念,以生成新任务。 然后,对每个任务的多个响应进行采样,将每个响应与测试用例配对,并在沙盒环...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...出的巨大潜力,而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同,大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类:虽然不是每个人都需要具备...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...方法直接教授模型安全规范,并训练它们在生成响应之前推理这些准则进,将安全原则融入推理过程中。 整个过程分为两个阶段,第一阶段,监督微调(SFT)训练模型参考并推理安全规范,使用从基础模型生成的数据集。第二...……更多
今日(7月12日),芒果TV全网首档实境博弈游戏推理综艺《森林进化论》官宣定档7月15日,节目将于7月15日、16日惊喜播出,7月25日起每周二中午12点更新。节目阵容同步官宣,火树、文韬、齐思钧、蒲熠星等16名青年玩家将对四...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
权威榜单 | 网易易盾入选中国信通院生成式 AI 技术和应用优秀案例
...容信息,即过往内容风控是感知层面识别,而非认知层面推理。·同时,对于有害类型的定义往往存在很多主观、边界、细节上的差异,频繁 地根据标准的多样更替适配模型,无法真正做到差异化分级分层精准防护。因此,如何...……更多
关于LLM-as-a-judge范式,终于有综述讲明白了
...的帮助性,无害性,可靠性,生成 / 检索文档的相关性,推理过程中每一步的可行性,以及生成文本的综合质量。Methodology:如何评判 表 1:LLM-as-a-judge 训练方法(1)微调:最近许多工作开始探索如何使用微调技术来训练一个...……更多
ChatGPT大流行的思考-解析篇
...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢?我们不妨从人类学习思路入手,我们学习一般可分为获取知识-存储知识-推理知识-更新知识,而这也是GPT发展及学习的...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...交视觉-语言-动作建模框架RevThink:使用逆向思维增强 LLM 推理想要第一时间获取每日最新大模型热门论文? 点击阅读原文,查看「2024必读大模型论文」合集,以及申请加入「大模型技术分享群」。SwiftEdit:50 倍速文本引导图像...……更多
一键解锁ChatGPT原理与应用
...的语言理解能力;②极为广泛的知识储备;③学习能力与推理能力等等。这些能力让人们感觉人工智能真正拥有了“脑子”,想象着使用GPT解决一切问题。然而,若真的要深入应用该技术,有必要了解其局限性,以便在实际应用...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
国泰君安证券:具身智能,人工智能的下一个浪潮
...量来达到的。将行为认知问题分解为感知到知识、知识到推理融合的两个较为简单的阶段,是一个较优的科学路径。离散语义符号是被不同行为所共享的,比如吃饭、读书和打扫都有着“手-握-某物”的标签,通过对这些共享标...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
成本不到150元!26分钟训出个推理模型 媲美o1和R1
成本不到150元,训练出一个媲美DeepSeek-R1和OpenAI o1的推理模型?!这不是洋葱新闻,而是AI教母李飞飞、斯坦福大学、华盛顿大学、艾伦人工智能实验室等携手推出的最新杰作:s1。在数学和编程能力的评测集上,s1的表现比肩Dee...……更多
更多关于科技的资讯:
AMD Ryzen 9 9950X3D跑分出炉:单核提升明显
近日,AMD的Ryzen 9 9950X3D和9900X3D处理器终于在Geekbench上亮相,相比上一代,新处理器在单核分数上有着明显提升
2025-02-19 22:57:00
中国香港人民爱买的车TOP20出炉:比亚迪第一 超特斯拉3倍
快科技2月19日消息,近日,易车公布了2025年1月中国香港人民最爱买的20款汽车品牌榜单,引发了广泛关注。在这份榜单中
2025-02-19 22:57:00
宇树科技老股转让遭“疯抢” 原始股东坚决不卖
快科技2月19日消息,据《科创板日报》报道,宇树科技的老股转让在一级市场中引发了一轮抢购热潮。有知情人士透露,近期众多投资者纷纷联系宇树科技的原始股股东
2025-02-19 22:57:00
网购电动车“续航神器”拆开似空壳 谨慎掉入“黑科技”骗局
近年来,随着电动自行车的普及,部分商家瞄准消费者对“长续航”的需求,推出所谓的电动车“续航增程器”,宣称可大幅提升续航里程
2025-02-18 19:32:00
美术院校校考,画风如何?
潮新闻讯 今天,中国美院本科招生(复试)开考。来自全国各地的考生涌向国美象山校区,转塘也一下子热闹起来。“今年会考什么
2025-02-19 20:18:00
OPPO Find X8 Ultra爆料汇总:双潜望机皇 影像巅峰
据可靠消息,下个月OPPO Find X8 Ultra有望登场,目前网上已经流出了诸多关于它的爆料。今天我们就来汇总这些曝光消息
2025-02-19 20:27:00
249元 影驰推出金属大师暗卫海景房机箱:270°无立柱海景房设计
快科技2月19日消息,影驰推出了金属大师暗卫机箱,采用270°无立柱海景房设计,首发到手249元。据悉,金属大师暗卫机箱采用了双面钢化玻璃
2025-02-19 20:27:00
虚幻5打造!腾讯《三角洲行动》官宣黑鹰坠落模式免费:2月21日全球上线
快科技2月19日消息,今晚,腾讯战术射击大作《三角洲行动》举行黑鹰坠落线下影院前瞻直播,公布黑鹰坠落战役模式部分关卡设计以及首次关卡实机试玩
2025-02-19 20:27:00
中新经纬2月19日电 市场监管总局网站19日消息,市场监管总局等五部门近日印发《优化消费环境三年行动方案(2025—2027年)》(简称“《方案》”)的通知
2025-02-19 20:29:00
二手平台买CPU收到一包沙子 卖家拒退款:这是CPU原材料
快科技2月19日消息,在网络购物日益普及的今天,消费者们需要格外谨慎,因为稍有不慎,就可能遇到一些令人哭笑不得、甚至离谱至极的事儿
2025-02-19 20:57:00
江南时报讯 为拓宽零售金融业务新渠道,延伸金融服务触角,推进医疗场景数字化运营,溧水农商银行积极响应民生需求,着力解决“一老一小”医保支付便捷度问题
2025-02-19 20:57:00
本文转自:人民网人民网北京2月19日电 (记者杜燕飞)当前,人工智能(AI)作为引领新一轮科技革命和产业变革的技术,具有很强的“头雁”效应
2025-02-19 21:00:00
如何量身打造新市民与灵活就业人群保险产品?泰康在线模式参考
有这样一个群体,他们勤勤恳恳、任劳任怨,引人关注,又默默无闻;他们早出晚归、披星戴月,远离故土,建设“第二故乡”。他们
2025-02-19 21:12:00
免费不限量!腾讯:混元T1模型面向所有用户开放
快科技2月19日消息,据腾讯介绍,前几天深度思考模型混元T1开启灰度后,用户反响强烈。经过产品紧急部署,现在,所有用户都可以无限量使用混元T1了
2025-02-19 21:27:00
网传小米全系车型规划:共8个版本 SU7猎装版很帅!
自从小米推出首款新车SU7以来,该车便获得了巨大的关注度和订单量,可以说为小米造车奠定了非常好的开局。近日,网传图片则曝光了小米汽车可能的全系车型
2025-02-19 21:27:00