• 我的订阅
  • 头条热搜
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva,即 Evolving Alignment via Asymmetric Self-Play,也就是「通过非对称自博弈实现的演进式对齐」。论文标题:Evolving Alignment via Asymmetric Self-Play 论文地址……更多
...算成本太高,难以大规模应用。科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。编码更加智能大...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...成、输出数据生成和质量优化。输入数据生成在 SELF-GUIDE 框架的设计和实现过程中,研究者首先根据任务类型(生成型任务或分类型任务)指定不同的提示模板。对于生成型任务, SELF-GUIDE 框架使用一个相对简单的提示模板。而...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...进进行压力测试, OpenAI 在部署之前根据自己的安全准备框架进行了一系列安全测试和红队测试。结果发现,思维链推理有助于在整个评估过程中提高能力。尤其值得注意的是,OpenAI 观察到了有趣的奖励黑客攻击实例。安全准备...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...究团队也想发问:构建通用智能体时,在铺设复杂的系统框架前,是否已经优化了行动 / 观测空间,让这些功能模块达到了最优状态?论文链接:https://arxiv.org/abs/2410.13825 论文名:AgentOccam: A Simple Yet Strong Baseline for……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...述出研究论文「方法」部分的内容。虽然 AI 生成的代码框架,模拟了 Kabasares 实际代码功能,但它使用的是「合成数据」,并非真实的天文数据。论文地址: https://iopscience.iop.org/article / 10.3847/1538-4357 / ac7a38 / m……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...决这些挑战,他们提出了一个利用随机化推理轨迹的训练框架。该方法的灵感来自两个研究方向: 该团队注意到,即便 Searchformer 是在完整的 A* 搜索轨迹上训练的,但它也会生成更短的勾勒搜索过程的轨迹。 研究表明,人类在...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
...规则来判断这些命题的真值组合是否符合需求。基于这一框架,就可以使用这些分类规则来对完成结果进行准确地排名。为了将基于安全规则的排名与仅帮助式(helpful-only,是指仅考虑结果的有用性,不考虑安全性)奖励模型组...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...back)以及基于评分的反馈(score-based feedback)。监督学习框架的统一性:UNA 通过最小化隐式奖励和显式奖励之间的差异,统一了对策略模型的优化。UNA 的理论基础UNA 的理论基础源于对 RLHF 目标函数的重新推导。研究人员证明,...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...作原理,从而更好地利用能帮助我们使用那些实现 APE 的框架。本教程的代码已经发布在 GitHub。地址:https://github.com/marshmellow77/automated-prompt-engineering-from-scratch APE 为什么很重要?要为给定任务找……更多
谷歌大模型推理范式,主要分为两个阶段
...waroopMishra是谷歌DeepMind的研究科学家,它参与的Self-Instruct框架在GitHub上星标3.5k、被引用次数超过600,并被ACL2023接收。此外QuocLe、DennyZhou等大模型提示微调、推理方向的老面孔也参与其中。虽然官方暂未开源,但已经有迫不及待..……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...与用户明确的交互来理解用户的隐式意图。以 Mistral-7B 为框架,基于 IN3 训练的 Mistral-Interact 能主动评估任务的模糊性,询问用户意图,并在启动下游智能体任务执行之前将其细化为可操作的目标。将该模型嵌入 XAgent 框架后,...……更多
基于MetaGPT,DeepWisdom希望构建多智能体社区
...MetaGPT便是为了解决这个问题。MetaGPT是一个多智能体开源框架,主要用于解决大模型落地应用问题,它可以通过模拟软件公司多角色,输出产品设计、架构图、代码repo等内容。它将会完成编程的自动化,完整利用AgentOS能力,完...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 4000000 多个分子之中,MolT……更多
AI写的小说,能打败网文大神吗?
...团队分析研究了网络小说的情节结构,设定了初步的情节框架后,陆续在6个国内大语言模型上进行试验,并最终确定其中一个大语言模型完成整个创作。“基于目前的AI技术,并不是每一个大语言模型都能完成这样一部百万字小...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...对 AI 自我进化的重要性,并且他们还提出了自己的实现框架 —— 基于多智能体的 Omne,其在 GAIA 基准上取得了第一名的成绩。论文标题:Long Term Memory : The Foundation of AI Self-Evolution 论文地址:https://arxiv.o……更多
...大数据的覆盖)相结合、兼具研究深度与广度的量化投资框架。量化策略加持下的股债混合策略,能够细分资产来对组合精耕细作。在大类资产方面,信澳鑫悦智选拟采用多资产、多策略的量化体系为基础,运用风险预算模型为...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...任务。下图展示了具身智能体的典型架构。 具身智能体框架在本综述中,我们对具身智能的当前进展进行了全面概述,包括:(1)具身机器人—— 具身智能在物理世界中的硬件方案;(2)具身仿真平台—— 高效且安全地训练...……更多
大语言模型如何宣告心理学的死亡?
...的现象,而未能构建一个脱离简单相关性的更全面的理解框架。 如果不妥善对待行为主义的幽灵,人工智能心理学家们很可能会重走人类心理学的弯路,甚至会因为缺乏演化的动力学框架而偏离的更远。反过来说,我们即将在...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...d score. 深入细节动态CoT、反思和语言强化学习的组合框架创建了一个高度自适应和响应迅速的问题解决AI系统。这个过程从Dynamic CoT生成初始推理路径开始,然后通过Reflection机制对其进行评估和完善。在每个反思阶段之后,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。 我们介绍了 OpenR,首...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...提示设计的标准化方法。 借助 CoT,人们现在拥有了一个框架来创建更有效的提示,从而可以完成复杂的推理任务。而这种增强解数学题的能力,能帮助用户更好地解数学题。此外,CoT 还可以通过搜索引擎理解和处理多步骤查...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的特点,应该尝试一种方法,或者两种方法。根据本文的框架,你可以提出以下问题,以确定微调或 RAG(或两者)是否适用:- 你的应用程序需要外部知识吗?微调通常对注入新知识没什么帮助 - 你的应用程序是否需要自定义...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...练过程英伟达含量为0模型的训练通过自家基于JAX的AXLearn框架进行,并采用了张量并行、流水并行等策略。硬件则采用的是谷歌TPU,其中云侧用了8192颗TPUv4芯片,端侧用了2048颗TPUv5p芯片,总之英伟达含量为0。数据则主要来源于...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...为「Prover-Verifier Games(证明者 - 验证者博弈)」的博弈论框架。该框架由两个相互竞争的学习者组成:一个可信的验证者(Verifier)网络试图选择正确的答案,另一个更强大但不可信的证明者(Prover)网络试图说服验证者接受特...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...京大学一支团队迅速跟进,用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调,表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。 为进一步促进社区的多模态对齐研究,日前,该...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...种称作SURE(Saliency-Based Unlearning with a Large Learning Rate)的框架作为改进方案。该框架通过构建模块级显著性图来指导遗忘过程,选择性地对与遗忘数据最相关的组件使用较大的学习率,同时最小化对其它功能的影响。通过实验,...……更多
openai推出最新o1模型引发业界关注
...,o1模型的测试和管理已纳入“PreparednessFramework”(准备框架),该框架旨在处理与AI模型进步相关的风险。据OpenAI的风险评估,o1模型被归为中等风险,相关问题属于“适度”范围。尽管如此,专家们仍对当前的监管力度表示担...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...现了最高准确率。总之,作者提出一个LLM提取元认知知识框架,其形式是根据解决问题所需的概念,对数学数据集中的问题进行分类的技能。目前,新框架依赖于GPT-4等高级模型的可用性。然而,技能发现过程改进了GPT-4的情境...……更多
2023 的人工智能之年
...EvoDiff 是一个用于高速且节省成本的蛋白质设计的开源 AI 框架,承诺将在治疗学和工业应用方面取得进展。Stable Audio:Stability AI 发布了 Stable Audio,这是一款能够根据简单的文本提示生成短时高质量的音频片段的工具。GPT 商店、...……更多
更多关于科技的资讯:
哪吒汽车再被列为被执行人:执行标的超545万元
快科技1月20日消息,近日,据企查查信息显示,哪吒汽车(合众新能源汽车股份有限公司)被浙江省嘉兴市桐乡市人民法院强制执行约545
2025-01-21 00:30:00
华为国补双重优惠上线:nova 13系列最高直降600元 到手2544元起
1月20日起,全国各地的手机等数码产品国补正式上线,华为nova系列也开启了对应活动。值得注意的是,国补标准只是15%
2025-01-21 00:30:00
中国移动5G旗舰手机评测:小米15 Pro综合体验第一!六边形战士
快科技1月20日消息,中国移动最新发布了《2024年智能硬件质量报告》,对iPhone 16 Pro Max、荣耀 Magic7 Pro
2025-01-21 00:30:00
中国生物科技何以“圈粉”海外?(环球热点)
本文转自:人民日报海外版本报记者 高 乔《人民日报海外版》(2025年01月21日第 10 版)位于四川省成都市双流区永安镇的成都天府国际生物城
2025-01-21 04:01:00
本文转自:人民日报海外版刘景芝《人民日报海外版》(2025年01月21日第 09 版)日前,中共中央、国务院发布了《关于深化养老服务改革发展的意见》
2025-01-21 04:01:00
你放心买,大润发M会员店贴心补!新春运费不涨价
随着春节即将到来,大润发M会员店新春系列商品火爆热卖,并宣布新春运费不涨价、线上线下不打烊,配送员春节加班补贴由公司承担
2025-01-21 05:27:00
北京订货会落下帷幕,中信出版多本新书受读者欢迎
冬日北京,书香飘溢。1月9日至11日,为期3天的第37届北京图书订货会在中国国际展览中心(朝阳馆)落下帷幕。中信出版集团在此次盛会中表现亮眼
2025-01-21 05:46:00
春节后的第一款Ultra旗舰!华硕Zenfone 12 Ultra来了
快科技1月21日消息,华硕宣布将于2月6日发布年度旗舰Zenfone 12 Ultra,这是春节后推出的第一款Ultra机型
2025-01-21 07:00:00
通信强的飞起!华为Mate 70 Pro+北斗短信/定位获中国移动评测五星 排名第一
快科技1月21日消息,在华为的引领下,主流手机厂商目前纷纷加入卫星通信赛道,各家体验到底如何?日前,中国移动2024年智能硬件质量报告发布
2025-01-21 07:00:00
“白娘子”赵雅芝晒71岁美照:状态超好 烈焰红唇娇嫩无比
1月21日消息,近期,多家卫视官宣了自家春晚的阵容。其中,北京卫视、江苏卫视、湖南卫视等都邀请了赵雅芝 。对此,赵雅芝工作室表示
2025-01-21 07:00:00
手机国补第一单买家:定零点闹钟抢购 凌晨便收到了商品
快科技1月21日消息,1月20日,手机国补上线。据了解,个人消费者购买手机、平板、智能手表(手环)等3类数码产品的补贴标准为
2025-01-21 07:30:00
2124元起!王腾:REDMI K80系列销量垂直起飞 国补最强机
快科技1月21日消息,1月20日起,手机、平板、智能手表(手环)3大品类的国家补贴正式上线,购买6000元以下产品立减15%
2025-01-21 07:30:00
物流是实体经济的“筋脉”,连接生产和消费、内贸和外贸。2月26日-28日,2025(第十届)物流技术大会将在湖州举行,来自全国的物流企业
2025-01-21 07:34:00
你听说过六足机器人吗?近段时间,人形机器人、四足机器人等“新物种”持续“刷屏”。如果机器人做成六足的,又有哪些企业可以用上
2025-01-21 07:34:00
伴随蛇年春节临近,互联网节庆氛围越来越浓厚,每年春节必备的“数字新年俗”集福也如约而至。昨日,支付宝“2025集福”正式开启
2025-01-21 07:34:00