• 我的订阅
  • 头条热搜
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...没有任何阻碍。——但其实还是有的,那就是新东西通常太贵。o1-preview的每百万输入token为15美元,每百万输出token为60美元,而对位的GPT-4o分别是5美元和15美元。本来GPT-4o就不便宜,现在想体验更强大的推理能力则需要再付出几...……更多
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...为什么要把Llama变成Mamba?因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了,相关的研究每天都有,但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba(进化到了1.5版本,最大398B,MoE),以及NVIDIA的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力,使其能够自我进化在传统 LLM 中,更新模型通常需要调整所有参数,而如果目的是处理个体数据,那这种操作明显不切实际。...……更多
苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型
...复适配器进行微调,它们不会产生任何额外的内存使用或推理成本。关于适配器的大小,团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而,为了提供更多的灵活性,苹果提供了一套不同秩的精度恢复适...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...judge提示模板。除了给出评价结果,meta-judge还需要生成CoT推理过程。为减少meta-judge可能存在的位置偏好(可能倾向于选择最先出现的Judgment A),对同一对数据(jm, jn)会交换顺序让meta-judge进行两次评价,得到单次结果rmn: 引入...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...概念,提高了大语言模型(LLM,large language models)在复杂推理任务上的性能,例如算术推理、常识推理和符号推理等。图 | 金明宇(来源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...泛应用,尤其是大型语言模型(LLMs)在语言理解和逻辑推理方面表现突出,为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合,能够显著增强系统的自适应能力。例如,GenAI 可以分析并规划系统策略,自动...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...专门解决难题。这是一个重大突破,新模型可以实现复杂推理,一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称,今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型,而且还只是预览...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...的连续提示学习新方法,可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识,同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...认知,数学最考验元认知,原本是指,人类对自己思维、推理过程的直观认识。那么,大模型也具备「元认知」的能力吗?研究人员对此,提出了一种假设,并设想是否可以通过知识引导,进一步提高LLM的能力。 其实,此前的...……更多
代码模型自我进化超越GPT-4o蒸馏!UIUC伯克利等提出自对齐方法 | NIPS 2024
...CodeAlign在整个数据生成过程中,使用相同的基础模型进行推理,分为三步:首先,从高质量的种子片段中提取不同的编码概念,以生成新任务。 然后,对每个任务的多个响应进行采样,将每个响应与测试用例配对,并在沙盒环...……更多
o1带火的CoT到底行不行?新论文引发了论战
...To CoT or not to CoT?OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链(CoT)的兴趣。一时之间,似乎思维链很快就会成为所有 LLM 的标配,但思维链并非万能,就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多
研究人员给了人工智能一个“内心独白”,结果大大提高了其性能
...工智能系统,让它在说话前先思考。内心独白提高了常识推理能力,并使其数学成绩翻了一番。一项新的研究表明,给人工智能系统一个“内心独白”会大大提高它们的推理能力。这种方法训练的人工智能系统,会在对提示做出...……更多
ChatGPT大流行的思考-解析篇
...器人的本质区别。2. ChatGPT如何实现知识的获取、存储、推理及实时更新那究竟GPT如何有如此优秀的表现呢?我们不妨从人类学习思路入手,我们学习一般可分为获取知识-存储知识-推理知识-更新知识,而这也是GPT发展及学习的...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...震。o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。在性能跃升之外,更重要的是,它揭示了大模型...……更多
科学家推出大模型数据集,涵盖奥赛数学题,有望让AI辅导数学课程
...解决复杂数学问题的能力。通过此,他们不仅提高了算法推理速度,还提高了算法搜索中间结果的质量。所新推出的数据集 TriMaster100,也更加符合算法在复杂数学问题下的评价场景。目前,赵子龙的合作者正在基于本次成果开...……更多
一键解锁ChatGPT原理与应用
...的语言理解能力;②极为广泛的知识储备;③学习能力与推理能力等等。这些能力让人们感觉人工智能真正拥有了“脑子”,想象着使用GPT解决一切问题。然而,若真的要深入应用该技术,有必要了解其局限性,以便在实际应用...……更多
...AI)系统在编码、战略规划和机器人科学三个领域执行复杂推理任务。聊天生成预训练转换器(ChatGPT)和“克劳德3-奥普斯”(Claude 3 Opus)等大语言模型(LLM),根据人类输入“提示词”处理和生成文本。研究人员说,过去18个月,这些技...……更多
谷歌大模型推理范式,主要分为两个阶段
...新研究“自我发现”(Self-Discover),重新定义了大模型推理范式。与已成行业标准的思维链(CoT)相比,新方法不仅让模型在面对复杂任务时表现更佳,还把同等效果下的推理成本压缩至1/40。核心策略其实很简单:千人千面。...……更多
科学家竞相破解大型语言模型背后的谜团
...复杂行为。面对复杂问题,人类在潜意识里会进行分步骤推理。受此启发,谷歌团队2022年引入了“思维链提示”,以描述一种让LLM展示其“思维”的方法。简单来说,思维链提示是一种特殊的上下文学习。不同于标准提示只给...……更多
高德宣布逐步开放AI能力 助力打造时空智能城市
...‘升维’成了必然趋势。”为此,高德云图将在感知层、推理层、决策层推动三大升级,助力智慧城市向时空智能城市进化。在感知层,云境AI三维重建平台将推动城市从二维还原向三维升级,真实还原城市静态世界;在推理层...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...考虑到大模型和异构多芯发展趋势,为了保障大模型训练推理性能、简化大模型开发调优过程以及更好地适配各种芯片,飞桨与文心联合,在训练、推理两个方面定向优化。▲飞桨框架设计理念具体来说,动静统一的自动并行能...……更多
清华提出CharacterGLM;DeepMind联创发全新一代大模型;大模型版“5年高考3年模拟”来了丨AI新零售早报
...|微软&UCLA&UW联合出品》MathVista是一个多模态数学推理基准数据集,由微软、UCLA和UW联合开发,包含6141个数学问题,涵盖丰富的任务类型、推理能力和图像类型。特点:旨在提供一个全面、多样、复杂的视觉数学推理挑战...……更多
...理陈宁介绍,DeepEdge10是国内首创的国产14nm Chiplet大模型推理芯片,采用自主可控的国产工艺,内含国产RISC-V核,支持大模型推理部署。依托自研芯片DeepEdge10创新的D2D chiplet架构打造的X5000推理卡,已适配并可承载SAM CV大模型、Lla...……更多
RAG没有银弹!四级难度,最新综述覆盖数据集、解决方案,教你「LLM+外部数据」的正确使用姿势
...成到LLMs中的三种主要方式。从简单的事实检索到复杂的推理任务,每个级别都有其独特的难点和解决方案,需要不同的技术和方法来优化性能。受参数量和知识更新的限制,大模型在执行很多真实场景下的任务时,都需要连接...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...著提升,而背后的成功离不开后训练阶段强化学习训练和推理阶段思考计算量的增大。基于此,有人认为,新的扩展律 —— 后训练扩展律(Post-Training Scaling Laws) 已经出现,并可能引发社区对于算力分配、后训练能力的重新思...……更多
刚刚,Llama 3.2 来了!支持图像推理,还有可在手机上运行的版本
... Meta 对 Llama 模型来了一波大更新:不仅推出了支持图像推理任务的新一代 Llama 11B 和 90B 模型,还发布了可在边缘和移动设备上的运行的轻量级模型 Llama 3.2 1B 和 3B。不仅如此,Meta 还正式发布了 Llama Stack Distribution,其可……更多
紫东.太初再进化,揭秘全模态大模型的想象力
...会出现一些意想不到的复杂能力,譬如类似人类的思维和推理能力。正如前面所提到的,紫东.太初2.0首次提出了全模态多任务统一生成式学习框架,即全模态分组对齐、分组解码和联合解码的学习方式,形成了全模态逻辑推理...……更多
文生图参数量升至240亿!Playground v3发布:深度融合LLM,图形设计能力超越人类
...像描述性能。实验结果表明,PGv3在文本提示遵循、复杂推理和文本渲染准确率方面表现出色;用户偏好研究表明,PGv3模型在常见的设计应用中,如表情包(stickers)、海报和logo设计,具有超越人类的图形设计能力,还能够精确...……更多
更多关于科技的资讯:
错过高速出口突然减速压实线变道 被撞后女司机还嘴硬:我没有!
快科技12月3日消息,自己犯了错不想承担后果直接甩锅,那肯定是不能如愿。据“公安部交通管理局”最新披露的案例显示,今年10月19日
2024-12-03 19:07:00
3档功率分流+两档减速器+59度大电池!车圈大V吴佩详解坦克Hi4-Z是何方神圣
快科技12月3日消息,今晚,长城坦克500Hi4-Z正式召开了预售发布会。随后,车圈大V吴佩发文对坦克Hi4-Z的技术进行了详细的解答
2024-12-03 19:07:00
11月新能源汽车销量146万辆创新高:比亚迪真断层式领先
快科技12月3日消息,乘联会综合预估,11月全国新能源乘用车厂商批发销量达146万辆,同比增长51%,环比增长6%。其中
2024-12-03 19:07:00
网友票选最可爱的粉发妹子:一个比一个强
在二次元动漫的世界里面,其实头发颜色可以很自由,金发黑发那种都还算普通,有些角色天生就是蓝发、紫发、红发甚至是可爱的粉红色发色都有
2024-12-03 19:07:00
锐龙7 8700G VS. i7-14700:AI大潮下 谁是更出色的商用台式机处理器!
一、前言:看起来完全不对等的对比测试相对于面对玩家的DIY市场而言,其实商用OEM的量级更大一些!大战商用机在DIY领域
2024-12-03 19:37:00
日本一黑熊闯入超市被捕将处死:不少市民求情“太可怜”
快科技12月3日消息,据日媒报道,近日在日本秋田县,一头体长约1米,体重约70公斤黑母熊闯入超市,一名现年47岁的男性店员在卖场熟食区附近遭袭
2024-12-03 19:37:00
携程客服春节居家办公两个月:可提前返乡
快科技12月3日消息,据媒体报道,携程集团正式开启客服申请提前返乡办公的政策,时间段为2025年1月1日至2025年2月28日
2024-12-03 19:37:00
四味小鱼仔40包13.9元:去头去尾去内脏 肉质紧实有嚼劲
抓鱼的猫四味小鱼仔280g(40包)原价18.9元,领券立减,到手价13.9元。购买链接:天猫(40包13.9元)工厂直发
2024-12-03 20:07:00
因瓦斯罐取暖使用不当 苏州一露营者在帐篷内身亡
12月3日消息,据媒体报道,有网友称苏州金鸡湖畔一位露营者疑似一氧化碳中毒身亡。对此,官方表示,系露营人员瓦斯罐取暖使用不当发生意外
2024-12-03 20:07:00
西伯利亚极寒之地:美的探索家空调真暖咖啡屋温暖雅库茨克的冬天
北极圈附近有许多闻名于世的“寒都”。如冰岛首都雷克雅未克、俄罗斯最大的军港摩尔曼斯克、挪威的“北极之门”特罗姆瑟、阿拉斯加的航空枢纽安克雷奇
2024-12-03 20:07:00
iPhone 16禁令延续!印尼认为一周内可获苹果10亿美元投资承诺
快科技12月3日消息,印尼投资部长今天表示,在因不符合当地内容规定而禁止销售iPhone 16后,印尼预计将在一周内获得苹果10亿美元的投资承诺
2024-12-03 20:07:00
微星新款Claw 8 AI+游戏掌机发布:顶配Ultra 7-258V
快科技12月3日消息,微星Claw 8 AI+游戏掌机目前已经在海外上市,起售价格为799美元(约5815元人民币)。据悉
2024-12-03 20:07:00
火蝠电商可靠吗?靠谱的代运营公司还有哪些?真心求告知
火蝠电商的名字相信不少人都听说过,各大搜索网站也都有它的信息,那么,火蝠电商到底可靠吗?首先,火蝠电商是一家专注于代运营行业的品牌服务商
2024-12-03 20:33:00
4499元起涨价也好卖!曝小米15系列激活量超130万:唯一破百万的新旗舰
快科技12月3日消息,今日,数码博主“数码闲聊站”透露,截止W27(2024年第47周11.18-11.24),小米15系列是第一波母系新旗舰中唯一激活量过百万的新机
2024-12-03 20:37:00
车速10码:男子租车过减速带气囊弹出赔了1000元 走保险更悲催
快科技12月3日消息,今日,广东深圳一男子开租的车过减速带安全气囊突然爆炸弹出,这也引发了网友的围观。随后,当事人肖先生接受采访时表示
2024-12-03 20:37:00