• 我的订阅
  • 头条热搜
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva,即 Evolving Alignment via Asymmetric Self-Play,也就是「通过非对称自博弈实现的演进式对齐」。论文标题:Evolving Alignment via Asymmetric Self-Play 论文地址……更多
...算成本太高,难以大规模应用。科学家们说,三个资料库框架都使用神经符号方法——一种结合神经网络的人工智能结构。神经网络就是采用经典的类似程序的逻辑方法,模仿人类大脑结构的机器学习算法集合。编码更加智能大...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...成、输出数据生成和质量优化。输入数据生成在 SELF-GUIDE 框架的设计和实现过程中,研究者首先根据任务类型(生成型任务或分类型任务)指定不同的提示模板。对于生成型任务, SELF-GUIDE 框架使用一个相对简单的提示模板。而...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...进进行压力测试, OpenAI 在部署之前根据自己的安全准备框架进行了一系列安全测试和红队测试。结果发现,思维链推理有助于在整个评估过程中提高能力。尤其值得注意的是,OpenAI 观察到了有趣的奖励黑客攻击实例。安全准备...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...究团队也想发问:构建通用智能体时,在铺设复杂的系统框架前,是否已经优化了行动 / 观测空间,让这些功能模块达到了最优状态?论文链接:https://arxiv.org/abs/2410.13825 论文名:AgentOccam: A Simple Yet Strong Baseline for……更多
OpenAI 超强 o1 智商超 120 遥遥领先于其他模型:1 小时写出 NASA 博士 1 年代码,最新编程赛超越 99.8% 选手
...述出研究论文「方法」部分的内容。虽然 AI 生成的代码框架,模拟了 Kabasares 实际代码功能,但它使用的是「合成数据」,并非真实的天文数据。论文地址: https://iopscience.iop.org/article / 10.3847/1538-4357 / ac7a38 / m……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...决这些挑战,他们提出了一个利用随机化推理轨迹的训练框架。该方法的灵感来自两个研究方向: 该团队注意到,即便 Searchformer 是在完整的 A* 搜索轨迹上训练的,但它也会生成更短的勾勒搜索过程的轨迹。 研究表明,人类在...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...back)以及基于评分的反馈(score-based feedback)。监督学习框架的统一性:UNA 通过最小化隐式奖励和显式奖励之间的差异,统一了对策略模型的优化。UNA 的理论基础UNA 的理论基础源于对 RLHF 目标函数的重新推导。研究人员证明,...……更多
OpenAI重拾规则系统,用「AI版机器人定律」守护大模型安全
...规则来判断这些命题的真值组合是否符合需求。基于这一框架,就可以使用这些分类规则来对完成结果进行准确地排名。为了将基于安全规则的排名与仅帮助式(helpful-only,是指仅考虑结果的有用性,不考虑安全性)奖励模型组...……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...作原理,从而更好地利用能帮助我们使用那些实现 APE 的框架。本教程的代码已经发布在 GitHub。地址:https://github.com/marshmellow77/automated-prompt-engineering-from-scratch APE 为什么很重要?要为给定任务找……更多
谷歌大模型推理范式,主要分为两个阶段
...waroopMishra是谷歌DeepMind的研究科学家,它参与的Self-Instruct框架在GitHub上星标3.5k、被引用次数超过600,并被ACL2023接收。此外QuocLe、DennyZhou等大模型提示微调、推理方向的老面孔也参与其中。虽然官方暂未开源,但已经有迫不及待..……更多
开闭源模型「大乱斗」:看看哪个智能体最能窥见人类真实意图
...与用户明确的交互来理解用户的隐式意图。以 Mistral-7B 为框架,基于 IN3 训练的 Mistral-Interact 能主动评估任务的模糊性,询问用户意图,并在启动下游智能体任务执行之前将其细化为可操作的目标。将该模型嵌入 XAgent 框架后,...……更多
基于MetaGPT,DeepWisdom希望构建多智能体社区
...MetaGPT便是为了解决这个问题。MetaGPT是一个多智能体开源框架,主要用于解决大模型落地应用问题,它可以通过模拟软件公司多角色,输出产品设计、架构图、代码repo等内容。它将会完成编程的自动化,完整利用AgentOS能力,完...……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 4000000 多个分子之中,MolT……更多
AI写的小说,能打败网文大神吗?
...团队分析研究了网络小说的情节结构,设定了初步的情节框架后,陆续在6个国内大语言模型上进行试验,并最终确定其中一个大语言模型完成整个创作。“基于目前的AI技术,并不是每一个大语言模型都能完成这样一部百万字小...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...对 AI 自我进化的重要性,并且他们还提出了自己的实现框架 —— 基于多智能体的 Omne,其在 GAIA 基准上取得了第一名的成绩。论文标题:Long Term Memory : The Foundation of AI Self-Evolution 论文地址:https://arxiv.o……更多
...大数据的覆盖)相结合、兼具研究深度与广度的量化投资框架。量化策略加持下的股债混合策略,能够细分资产来对组合精耕细作。在大类资产方面,信澳鑫悦智选拟采用多资产、多策略的量化体系为基础,运用风险预算模型为...……更多
全球首篇!调研近400篇文献,鹏城实验室&中大深度解析具身智能
...任务。下图展示了具身智能体的典型架构。 具身智能体框架在本综述中,我们对具身智能的当前进展进行了全面概述,包括:(1)具身机器人—— 具身智能在物理世界中的硬件方案;(2)具身仿真平台—— 高效且安全地训练...……更多
大语言模型如何宣告心理学的死亡?
...的现象,而未能构建一个脱离简单相关性的更全面的理解框架。 如果不妥善对待行为主义的幽灵,人工智能心理学家们很可能会重走人类心理学的弯路,甚至会因为缺乏演化的动力学框架而偏离的更远。反过来说,我们即将在...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...d score. 深入细节动态CoT、反思和语言强化学习的组合框架创建了一个高度自适应和响应迅速的问题解决AI系统。这个过程从Dynamic CoT生成初始推理路径开始,然后通过Reflection机制对其进行评估和完善。在每个反思阶段之后,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。 我们介绍了 OpenR,首...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...提示设计的标准化方法。 借助 CoT,人们现在拥有了一个框架来创建更有效的提示,从而可以完成复杂的推理任务。而这种增强解数学题的能力,能帮助用户更好地解数学题。此外,CoT 还可以通过搜索引擎理解和处理多步骤查...……更多
Meta祭出三篇最详尽Llama微调指南!千字长文,0基础小白必备
...的特点,应该尝试一种方法,或者两种方法。根据本文的框架,你可以提出以下问题,以确定微调或 RAG(或两者)是否适用:- 你的应用程序需要外部知识吗?微调通常对注入新知识没什么帮助 - 你的应用程序是否需要自定义...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...练过程英伟达含量为0模型的训练通过自家基于JAX的AXLearn框架进行,并采用了张量并行、流水并行等策略。硬件则采用的是谷歌TPU,其中云侧用了8192颗TPUv4芯片,端侧用了2048颗TPUv5p芯片,总之英伟达含量为0。数据则主要来源于...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...为「Prover-Verifier Games(证明者 - 验证者博弈)」的博弈论框架。该框架由两个相互竞争的学习者组成:一个可信的验证者(Verifier)网络试图选择正确的答案,另一个更强大但不可信的证明者(Prover)网络试图说服验证者接受特...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...京大学一支团队迅速跟进,用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调,表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。 为进一步促进社区的多模态对齐研究,日前,该...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...种称作SURE(Saliency-Based Unlearning with a Large Learning Rate)的框架作为改进方案。该框架通过构建模块级显著性图来指导遗忘过程,选择性地对与遗忘数据最相关的组件使用较大的学习率,同时最小化对其它功能的影响。通过实验,...……更多
openai推出最新o1模型引发业界关注
...,o1模型的测试和管理已纳入“PreparednessFramework”(准备框架),该框架旨在处理与AI模型进步相关的风险。据OpenAI的风险评估,o1模型被归为中等风险,相关问题属于“适度”范围。尽管如此,专家们仍对当前的监管力度表示担...……更多
LLM群体智能崛起,数学性能暴增11.6%!谷歌DeepMind四大机构联手新作
...现了最高准确率。总之,作者提出一个LLM提取元认知知识框架,其形式是根据解决问题所需的概念,对数学数据集中的问题进行分类的技能。目前,新框架依赖于GPT-4等高级模型的可用性。然而,技能发现过程改进了GPT-4的情境...……更多
AI药物化学家登Nature子刊:重现职业化学家专业知识,有望加速药物研发
...的模型不仅限于当前研究的应用范围。具体来说,讨论的框架可以扩展到药物发现领域的其他可量化但却昂贵的可观测值。此外,它可以为化学空间中尚未被探索的领域提供见解。 鉴于这一点,研究团队相信一些流行的基于规...……更多
更多关于科技的资讯:
让“诗与远方” 触手可及 “AI+文旅”主题赛获奖名单出炉
12月13日,2024明月湖·π国际创新创业大赛暨第二届“兴智杯”全国人工智能创新应用大赛“AI+文旅”主题赛决赛发布会举行
2024-12-14 14:20:00
本文转自:人民网-湖南频道12月14日,由中国文化娱乐行业协会游戏分会、湖南省游乐园协会主办、鸿威会展集团、宝点数字、中一游乐联合承办的2024中国室内乐园产业发展大会暨博览会在长沙·万家丽国际会展中心(万家丽国际购物广场9楼)盛大开幕
2024-12-14 14:50:00
反复评论“机票太贵,不去了”,就能让机票骤降2000多元?据北京青年报报道,兔兔在初次搜索机票时,发现直飞的最便宜价格也要4309元
2024-12-14 14:51:00
永清:直播带货助力产品上“云端”
河北新闻网讯(刘杰、庞趁友)“我们这款毛巾在直播间三条仅需9.9元,今天这款货架也破价销售了……”近日,走进位于永清县的京津冀淘宝直播运营服务中心
2024-12-14 15:30:00
喜报!廊坊银行员工全国竞赛中斩获佳绩
河北新闻网讯(孙泽恒)近日,第十三届杰出财富管理师技能竞赛结果发布会在深圳举办,廊坊银行石家庄分行员工谷磊表现出色,从1300余名来自全国各地的选手中脱颖而出
2024-12-14 15:37:00
越南16岁少年无证驾驶摩托车逆行 不减速与汽车迎面相撞:当场撞飞太惨
12月14日消息,近日越南清化省一辆摩托车逆行与一辆汽车相撞。从现场视频可以看到,这辆摩托车当时与汽车相撞时完全没有减速的行为
2024-12-14 10:47:00
忘了小机器人吧!《黑神话:悟空》Steam首个重大更新上线:吐槽的都改了
快科技12月14日消息,今天上午10点,《黑神话:悟空》的首个重大更新上线Steam,改进了大量此前玩家们吐槽的问题,备受好评
2024-12-14 10:47:00
撼讯推alphynah10无线耳机,将于近期在海外上市
12月13日消息,撼讯PowerColor现已推出一款ALPHYNAH10无线游戏耳机,其主打“50mm动圈、独立AMP功放”
2024-12-14 10:55:00
法伴云数智化新篇章,助力中小企业法务低成本突围
截至2024年,中国中小企业总数已经超过6000万家,日均新设企业更是高达2.7万家,中小企业在创业浪潮中面临的空前机遇与剧烈竞争并存
2024-12-14 11:00:00
近日,豆包概念十分火热,已成为市场新的热点。豆包是字节跳动公司基于云雀模型开发的AI工具。11月,豆包的日活跃用户接近900万
2024-12-14 11:40:00
安徽淮南:智慧应用有新意 文旅发展添新力
本文转自:人民网-安徽频道人民网记者 韩震震 王锐 陈曦安徽移动淮南分公司淮南工业互联网展示厅内,一块大屏幕上,显示着寿县古城宾阳门的实时画面
2024-12-14 11:48:00
理想汽车首个高强韧不锈钢钢卷在青拓集团下线
12月13日消息,理想汽车首个高强韧不锈钢钢卷于12月12日在青拓集团下线,理想汽车-青拓集团-尼威动力-宏旺集团联合举行了自研高强韧不锈钢材料UFHS的首发仪式
2024-12-14 11:58:00
在信息时代,个人隐私安全和自身利益保障成为人们选择贷款机构时的关键考量。而森强金融,以其严格的隐私保护政策、先进的技术手段以及专业的服务
2024-12-14 12:21:00
英特尔锐炫b580“公版”显卡金手指曝光
12月13日消息,日媒 ASCII.jp在对英特尔锐炫B580LimitedEdition“公版”显卡评测时指出,这张仅支持PCIe4
2024-12-14 01:26:00
纯血鸿蒙版微信app开启测试版升级
12月12日消息,纯血鸿蒙版微信App今日在华为应用市场(AppGallery)开启测试版 1.0.2.39(1049127)邀测升级
2024-12-14 01:34:00