• 我的订阅
  • 头条热搜
OpenAI-o1思考替代法火了!焦剑涛高徒一作提出思考偏好优化
OpenAI-o1替代品来了,大模型能根据任务复杂度进行不同时间的思考。不限于推理性的逻辑或数学任务,一般问答也能思考的那种。最近畅销书《Python机器学习》作者Sebastian Raschka推荐了一项新研究,被网友们齐刷刷码住了。论文...……更多
首届大模型顶会COLM高分论文:偏好搜索算法让大模型评估更高效
...。在 RLHF 训练范式中,奖励模型根据排名比较数据与人类偏好对齐。这增强了 LLMs 与人类价值观的对齐,从而生成更好地帮助人类并遵守人类价值观的回应。近日,第一届大模型顶会 COLM 刚刚公布接收结果,其中一项高分工作分...……更多
4轮暴训,Llama 7B击败GPT-4!Meta等让LLM「分饰三角」自评自进化
...应,由再让M_t对自己进行评价,由此得到用于训练actor的偏好数据。 之后,给定同一个响应内容y,让M_t生成各种不同评价的变体,由meta-judge进行打分和排名,由此得到用于训练judge的偏好数据。结合上述的两类偏好数据,通过D...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好和兴趣,从而生成个性化、贴合用户需求的推荐内容。具体而言,该框架采用隐空间扩散机制,有效清除用户表示中的噪声,无论是压缩还是密集的嵌入空间。RecDiff...……更多
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
...器。一方面,为了使LLM自动评分更加合理、准确并与人类偏好保持一致,对人类判断的数据收集极其重要。 然而,获得这些判断数据既昂贵又耗时。从以前的研究中收集现有的人类评估貌似可行,但面临着缺乏标准、文档数据...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...对齐不同模态时面临幻觉和细粒度感知不足等问题,传统偏好学习方法依赖可能不适配的外源数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...模态上扩展新的对齐算法;3)同时发布首个全模态人类偏好数据集 Align-Anything,提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,在增强模型的多模态理解能力的同时,从而实现跨模态的全面评估和改进。全模态...……更多
解密OneEntity体系
...教、地理位置、价值观等。人的向往与需求,可分为兴趣偏好、行为消费偏好。兴趣偏好:是人堆非物化对象的内在心理向往与外在行为表达,是一种法子内心的本能喜好,与物质无必然关系。例如渴望爱情、需要安全感、讨厌...……更多
RLHF不够用了,OpenAI设计出了新的奖励机制
...对齐变得越来越重要。最近的许多工作都集中在使用人类偏好数据来调整模型上,例如基于人类反馈的强化学习(RLHF)。然而,仅使用人类反馈来实现目标安全规范还面临许多挑战。为模型安全性收集和维护人类数据通常既费...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...文中,研究人员结合渐进式蒸馏、监督微调(SFT)和定向偏好优化(DPO)等方法达成了这一目标。光是变大还不够,在性能匹配Transformer的前提下,速度也要够快才行。 Mamba凭借固定的推理开销,在长序列中的优势明显,但Transf...……更多
...)、短视频App(33%)等线上渠道了解保险品牌,年轻人更偏好社交媒体和内容类平台,老年人更偏好短视频App。从购险渠道来看,传统保司线下网点/代理人渠道(70%)仍是当前购险首选。但相较于2022年,2023年各年龄段消费者的...……更多
MSRA:视觉生成六大技术问题
...,可以得到下面的结果。然而,该指标不能确保与人类的偏好完全一致。2、利用已有的生成模型衡量指标,如FID等。这类方法有两个问题,第一,FID等指标自身的bias,比如FID假设图像抽取特征后的分布满足高斯分布,这会带来...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...通过多轮迭代优化模型的性能。其核心思想是结合不同的偏好优化算法,包括拒绝采样、直接偏好优化(DPO),使得模型能够从多种优化策略中受益,从而提高其对特定任务的适应性和性能。在每次迭代中,iTeC会从最新的模型...……更多
华商基金邓默:市场风格向盈利确定性较高行业扩散
...中国经济网北京2月19日讯今年以来,市场对于核心风格的偏好已经逐渐转向价值,以红利风格为代表的防御型资产持续走强。华商基金邓默表示,在这个过程中,我们也在选股模型中加大了对估值因子的考虑,投资组合整体呈现...……更多
超越扩散模型!自回归新范式仅需2.9秒就生成高质量图像
...模型的性能。此外在生成图像真实度、图文一致性和人类偏好上均表现优秀。来看看具体是如何做到的?自回归通用文生图模型STAR扩散模由于其高质量和多元的生成,一度在文生图领域占有主导地位。它通过逐步的去噪过程,...……更多
报告:iPad用户更倾向保留旧设备 iPhone用户偏好交易
【CNMO科技消息】根据Consumer Intelligence Research Partners(CIRP)的最新研究报告,iPad用户在处理旧设备时,相较于iPhone用户,更倾向于保留或再利用它们。这份覆盖至2024年3月过去12个月的数据揭示了一个显著的现象:在iPad的重复购...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
... 3 同样有着更好的表现。人类标注者根据该评估集进行的偏好排名,凸显了 Llama 3 70B 指令跟随模型与真实世界中同等规模的竞争模型相比的强大性能。Llama 3 的预训练模型还为这类规模的 LLM 模型建立了新的 SOTA。 Llama 3 是如何...……更多
A股风险偏好或将提高,高弹性、高成长的科技成长占据反弹第一线
...、经济持续复苏提振,A股市场吹响反攻号角,市场风险偏好或将提高,高弹性、高成长的科技成长占据反弹第一线。流动性方面,消息面再传来利好,美国劳工部报告显示,因能源价格大幅放缓,美国10月CPI同比升3.2%,为今年7...……更多
关系改善可能提升市场风险偏好
...及国内经济底部企稳大方向没有变化,此前压制市场风险偏好的主要因素已经得到缓和。另外中美关系出现明显转暖迹象,本周APEC峰会举行,中美领导人会晤可能会成为市场关注的焦点,若出现双边关系改善,特别是在经贸领...……更多
线上购险接受度将反超线下?互联网保险如何乘势而上
...各年龄段消费者的线上购险率普遍提高,老年人对线上的偏好度显著提升;各年龄段消费者的线下购险率均有降低,越年轻对线下的偏好度越低。2023年,以51—60岁这一年龄段为例,线上购险率由上一年的63%增长至72%。20—30岁这...……更多
Mamba作者新作:将Llama3蒸馏成混合线性 RNN
...一种多级蒸馏方法,结合了渐进式蒸馏、监督微调和定向偏好优化。与普通蒸馏相比,这种方法可以获得更好的困惑度和下游评估结果。该研究假设来自 Transformer 的大部分知识都保留在从原始模型迁移而来的 MLP 层中,并专注于...……更多
...库。分析这些数据能够帮助企业了解消费者的购买模式、偏好变化及市场趋势。在分析过程中,描述性统计学提供了对消费者行为数据的初步理解。例如,通过计算消费者购买频率、平均消费额等指标,可对消费者群体的基本特...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...期,为了确保生成的图像能够符合下游任务目标以及用户偏好,许多研究者开始探索如何对预训练扩散模型进行奖励或偏好驱动的微调训练 —— 这就是所谓的扩散模型对齐(Diffusion Model Alignment)。目前,最流行的对齐方法之一...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
一个 token 就能控制模型快些解答或慢点思考。OpenAI ο1 模型的发布掀起了人们对 AI 推理过程的关注,甚至让现在的 AI 行业开始放弃卷越来越大的模型,而是开始针对推理过程进行优化了。今天我们介绍的这项来自 Meta FAIR 田渊...……更多
击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B都写在论文里
...善 Chat 模型,其中包括监督微调(SFT)、拒绝采样和直接偏好优化。大多数 SFT 样本由合成数据生成。研究者在设计中做出了一些选择,以最大化模型开发过程的可扩展性。例如,选择标准的密集 Transformer 模型架构,只进行了少...……更多
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图
...入人类决策可以提高系统的可信度和效率。重点关注用户偏好获取、系统透明度和人机协作,以提升用户满意度、系统解释性和效率。图:GenAI 在自适应系统中的应用潜力概览监控功能:GenAI,特别是 LLMs,在上下文理解和预测...……更多
为啥会有左撇子?左右利手可能会是你在娘胎吃手手的习惯真的假的
...好奇和关注。他们在使用手部动作时,与大多数人相反,偏好使用左手。这种现象不仅令人着迷,还蕴含着生物学和心理学的深层次秘密。1.左撇子的定义左撇子指的是那些在日常生活中,如写作、抓握物品时主要使用左手的人...……更多
路演报名!携手11个创新项目,引领新质生产力发展丨36氪 × 华映资本
...融资轮次:B轮计划融资金额:约3亿元对投资机构类型的偏好:财务投资、战略投资均可资金主要用途:研发投入、运营资金作为主,以及新产品产线购置等项目介绍比博斯特聚焦汽车智能底盘核心零部件和系统的国产化,产品...……更多
大模型成私人导游,一键规划Citywalk,港大MIT联合出品
...地点集中在两个空间聚类中。而右图中GPT选择的POI(个人偏好的兴趣点)则与用户要求的桥和渡轮不太相符,还出现了绕路、POI距离过远的情况。除了这个例子外,GPT有时还会出现幻觉,生成不存在的POI。 概括而言,ITINERA具有...……更多
OpenAI、微软、智谱AI等全球16家公司共同签署前沿人工智能安全承诺
...接:https://arxiv.org/abs/2404.00604在三个数据集上进行的直接偏好优化(DPO)实验表明,Self-Contrast 可以持续大幅超越 SFT 和标准 DPO 训练。而且,随着自生成的负样本数量增加,Self-Contrast 的表现也在不断提高。 总的来说,这……更多
更多关于科技的资讯:
2025年01月10日环洋市场咨询机构出版了一份详细的、综合性的调研分析报告【全球ARM工控板行业总体规模、主要厂商及IPO上市调研报告
2025-01-10 13:52:00
鲜沐商业化AI正式上线,实现履约全链路100%覆盖
2025年1月8日,杭州鲜沐科技有限公司宣布其自主研发的商业化AI技术正式上线。这一创新技术已在城配及出仓等核心环节完成部署
2025-01-10 14:00:00
小屏幕,大变化!看海亮科技平板教学如何打造高效课堂
在教育的新时代,“以学生为中心”的教育教学模式正引领着一场深刻的变革。这一模式强调将“学生发展”“学生学习”和“学习效果”置于教学的核心位置
2025-01-10 14:00:00
宝宝树携手“两大生态联盟”亮相樱桃大赏荣获“年度创新力企业大奖”
近日,由母婴行业观察主办的2024第十届未来母婴大会暨樱桃大赏年度盛典落幕上海,宝宝树凭借“AI+母婴”系列产品、女性和中大童商业IP
2025-01-10 14:06:00
添可闪耀CES 2025,FLOOR ONE S9 Artist Steam洗地机全球首发
美国时间1月7日,高端智能生活电器品牌添可(TINECO)携旗下多款创新技术产品正式亮相2025年美国国际消费电子展(CES)
2025-01-10 14:06:00
移动云自研云原生数据库入围国采!
近日,中央国家机关2024年度事务型数据库软件框架协议联合征集采购项目产品名单正式公布,移动云自主研发的云原生数据库产品顺利入围
2025-01-10 14:12:00
喜讯|太太乐入选首批市级\
太太乐入选上海品牌培育试点,助力地方文化味走全国近日,上海市市场监管局组织开展了首批"上海品牌"培育试点企业(产品/服务)申报评审工作
2025-01-10 14:20:00
推动企业的转型升级 友乐邦商学院赋能会成功举办
日前,由山东友乐邦建材科技有限公司主办的友乐邦商学院赋能会在江北水城台儿庄成功举办。赋能会由友乐邦商学院院长、极简模式创始人蔡佩辰主讲
2025-01-10 14:21:00
湖南博长控股集团内部应用“钢之梦”原生鸿蒙版上架,内部协作更高效
湖南博长控股集团有限公司内部办公应用“钢之梦”原生鸿蒙版上架,借助HarmonyOS NEXT原生安全、原生互联等创新特性
2025-01-10 14:21:00
舒提啦推出新一代出国专用旅行箱
春节临近,出国旅行的热潮已经掀起。根据1月6日飞猪发布的《2025年春节出游风向标》显示,截至1月30日,春节假期出游需求将集中爆发
2025-01-10 14:22:00
学而思学习机亮相CES 2025获奖 “AI+教育”探索获国际认可
全球瞩目的2025国际消费电子展(CES2025)于美国当地时间1月7日在拉斯维加斯开幕,作为汇聚顶尖创新、前沿产品与先锋理念的科技盛会
2025-01-10 14:22:00
邮储银行北京分行首家鸿蒙生态银行盛大开业
2025年1月9日,中国邮政储蓄银行北京通州区运河商务区支行盛大开业。作为邮储银行北京分行首家鸿蒙生态银行(以下简称“鸿蒙生态银行”)
2025-01-10 14:22:00
香港小主荣膺家庭医生“海外膳食营养补充剂类目”上榜品牌
2024年11月19日,家庭健康保健的权威指南-家庭医生在线主办的“2023-2024家庭常备药、家庭常备营养保健品上榜品牌”颁奖典礼在武汉盛大开幕
2025-01-10 14:23:00
沐松文化严苡华:艺术歌吟未来,设计给予关怀
让艺术跃然纸上,从设计提笔出发。这家企业她们深谙设计不仅仅是色彩的堆砌、线条的勾勒,更是情感的传递、文化的传承。运用视觉语言
2025-01-10 14:34:00
2024环球趋势案例揭晓,及象教育斩获“年度文化赋能优秀案例”,科技融艺,文化创新
近日,备受瞩目的2024环球趋势案例评选结果正式揭晓,及象教育凭借其在中老年兴趣教育领域的卓越贡献与创新实践,荣获“年度文化赋能优秀案例”
2025-01-10 14:37:00