太贵,推理,进化,提示,能力,方法头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

OpenAI o1太贵？那就自己做一个！纯提示方法让普通LLM进化出复杂推理能力

...没有任何阻碍。——但其实还是有的，那就是新东西通常太贵。o1-preview的每百万输入token为15美元，每百万输出token为60美元，而对位的GPT-4o分别是5美元和15美元。本来GPT-4o就不便宜，现在想体验更强大的推理能力则需要再付出几...……更多

2024-11-08 09:43:00太贵,推理,进化,提示,能力,方法

模拟5亿年自然进化史，全新蛋白质大模型ESM3诞生！前Met

...白质语言模型ESM3。不仅支持序列、结构、功能的all-to-all推理，团队还在实验中发现，它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后，我们又看到了一个生命科学领域的大模型ESM3。模型开发团队来自于名为...……更多

2024-06-27 09:31:00进化史,力作,老将,蛋白质,进化,蛋白

推动大模型自我进化，北理工推出「流星雨计划」

...我进化的方式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

3天把Llama训成Mamba，性能不降，推理更快！

...为什么要把Llama变成Mamba？因为从头开始训练一个大模型太贵了。Mamba也火了这么长时间了，相关的研究每天都有，但自己训练大尺寸Mamba模型的却很少。目前比较有名的是AI21的Jamba（进化到了1.5版本，最大398B，MoE），以及NVIDIA的...……更多

2024-09-06 10:01:00推理,更快,性能,模型,输出,训练

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...也能让模型在处理长期、分散和个性化的数据时逐步提升推理和学习能力。用 LTM 数据提升模型能力，使其能够自我进化在传统 LLM 中，更新模型通常需要调整所有参数，而如果目的是处理个体数据，那这种操作明显不切实际。...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

苹果AI震撼上线iPhone，进化版Siri却没有ChatG

...复适配器进行微调，它们不会产生任何额外的内存使用或推理成本。关于适配器的大小，团队发现秩为16的适配器在模型容量和推理性能之间提供了最佳平衡。然而，为了提供更多的灵活性，苹果提供了一套不同秩的精度恢复适...……更多

2024-08-01 09:40:00进化,模型,苹果,报告,技术,苹果

4轮暴训，Llama 7B击败GPT-4！Meta等让LLM

...judge提示模板。除了给出评价结果，meta-judge还需要生成CoT推理过程。为减少meta-judge可能存在的位置偏好（可能倾向于选择最先出现的Judgment A），对同一对数据(jm, jn)会交换顺序让meta-judge进行两次评价，得到单次结果rmn：引入...……更多

2024-08-01 09:40:00三角,进化,模型,奖励,训练,迭代

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...概念，提高了大语言模型（LLM，large language models）在复杂推理任务上的性能，例如算术推理、常识推理和符号推理等。图 | 金明宇（来源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

调研219篇文献，全面了解GenAI在自适应系统中的现状与研

...泛应用，尤其是大型语言模型（LLMs）在语言理解和逻辑推理方面表现突出，为自适应系统提供了新的可能性。GenAI 与自适应系统的核心功能相结合，能够显著增强系统的自适应能力。例如，GenAI 可以分析并规划系统策略，自动...……更多

2024-09-27 13:42:00路线图,文献,调研,路线,现状,研究

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...专门解决难题。这是一个重大突破，新模型可以实现复杂推理，一个通用模型解决比此前的科学、代码和数学模型能做到的更难的问题。OpenAI 称，今天在 ChatGPT 和大模型 API 中新发布的是该系列中的第一款模型，而且还只是预览...……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...的连续提示学习新方法，可以提高知识终身学习的编辑和推理效率。模型编辑旨在纠正大语言模型中过时或错误的知识，同时不需要昂贵的代价进行再训练。终身模型编辑是满足LLM持续编辑要求的最具挑战性的任务。之前的工作...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自

...CodeAlign在整个数据生成过程中，使用相同的基础模型进行推理，分为三步：首先，从高质量的种子片段中提取不同的编码概念，以生成新任务。然后，对每个任务的多个响应进行采样，将每个响应与测试用例配对，并在沙盒环...……更多

2024-11-29 09:26:00伯克,伯克利,进化,模型,代码,方法

LLM群体智能崛起，数学性能暴增11.6%！谷歌DeepMi

...认知，数学最考验元认知，原本是指，人类对自己思维、推理过程的直观认识。那么，大模型也具备「元认知」的能力吗？研究人员对此，提出了一种假设，并设想是否可以通过知识引导，进一步提高LLM的能力。其实，此前的...……更多

2024-09-23 09:50:00新作,群体,性能,数学,机构,智能

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...出的巨大潜力，而这种潜力的核心基石正是智能体的复杂推理能力。与当下广受关注的 OpenAI-o1 及其追随者略有不同，大多数实用的 AI Agent 往往需要在特定场景下发挥作用。这种情况类似于普通人类：虽然不是每个人都需要具备...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

o1带火的CoT到底行不行？新论文引发了论战

...To CoT or not to CoT？OpenAI ο1 的诞生极大地提升了人们对 LLM 推理能力和思维链（CoT）的兴趣。一时之间，似乎思维链很快就会成为所有 LLM 的标配，但思维链并非万能，就连 OpenAI 自己也提到 o1 在某些任务上的表现并不比 GPT-4o 强...……更多

2024-09-21 09:37:00新论,推理,符号,性能,任务,数据