• 我的订阅
  • 头条热搜
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...作,在模型训练过程中引入偏好学习,提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上,相比于单独使用SFT,CodeDPO能够将模型的HumanEval得分再多提升10个百分点,最高增幅接近1/3。监督微调(SFT)等现有训练方法...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...模态上扩展新的对齐算法;3)同时发布首个全模态人类偏好数据集 Align-Anything,提供详细的人类偏好注释以及用于批评和改进的精细语言反馈,在增强模型的多模态理解能力的同时,从而实现跨模态的全面评估和改进。全模态...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...训练的新方法,以及使用模型自己的生成结果创建高性能偏好数据的新方法。加上更多优化细节,得到的 Tülu 3 系列模型明显优于同等规模的其它模型。8B 模型在各基准上的表现70B 模型在各基准上的表现 Tülu 3 是如何炼成的?A...……更多
Meta提出“可持续思维链”,让大模型在连续潜空间中推理
...关注的大模型前沿论文北大团队提出「自定义漫画生成」框架UniReal:通过学习真实世界动态实现通用图像生成和编辑苹果团队提出「可扩展视频生成」方法利用扩散 Transformer 进行视频运动迁移ObjCtrl-2.5D:无需训练的「图生视频...……更多
生成模型真实物理引擎Genesis来了!由全球AI顶尖高校团队开发
...其核心特点是将多种物理求解器及其耦合集成到了统一的框架中。课题组领导者淦创教授称:“我们的方法核心是逆向工程人类心智模型,并构建由生成物理引擎驱动的机器人大脑!”借助 GPU 加速的并行计算技术,以及优化的...……更多
2023 的人工智能之年
...量数据集训练,其在对象分割方面的性能表现卓越。直接偏好优化 (DPO):直接偏好优化 (DPO) 是一种稳定高效的方法,可用于微调大规模无监督语言模型和教授文本到图像模型。它通过利用人类反馈实现精确的控制,而无需依赖...……更多
本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere
...了多项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对Op...……更多
单图解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
...双视角,看起来衔接也非常丝滑。以上来自ViewCrafter,由北大、港中文、腾讯等机构的研究人员提出,可以从单张或稀疏输入图像生成精确相机可控的新视角视频。还支持场景级文生3D、图生3D、以及稀疏视角重建等应用。目前论...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好和兴趣,从而生成个性化、贴合用户需求的推荐内容。具体而言,该框架采用隐空间扩散机制,有效清除用户表示中的噪声,无论是压缩还是密集的嵌入空间。RecDiff...……更多
幻觉不一定有害,新框架用AI的「幻觉」优化图像分割技术
...存在伪装的狮子,即使图中实际上没有狮子。这种假设的偏好在伪装动物分割任务中尤其问题严重,因为它可能导致模型错误地识别出不存在的伪装动物。图 1. co-occurrence prior 导致的 hallucination但是这样的现象就一定是坏事吗?...……更多
高通aihub正式发布:支持75个ai模型
...型的行为。例如在演示中,模型能够根据不同个人或艺术偏好创建高质量自定义图像。高通表示这一技术不仅能够运用于图像生成,也可以应用于大语言模型等多种生成式AI模型,是实现个性化生成式AI的高效方式。 ……更多
田渊栋团队新作祭出Agent-as-a-Judge!AI智能体自我审判,成本暴跌97%
...为评判者的示意图。 DevAI:自动化AI开发数据集另外,在代码生成领域,基准测试的发展也落后于智能体系统的快速进步。比如,HumanEval仅关注算法问题,而MBPP则处理简单的编程任务,但这两者都没有反映出开发者面临的最实...……更多
无一大模型及格! 北大/通研院提出超难基准,评估长文本理解生成
在长文本理解能力这块,竟然没有一个大模型及格!北大联合北京通用人工智能研究院提出了一个新基准数据集:LooGLE,专门用于测试和评估大语言模型(LLMs)长上下文理解能力。该数据集既能够评估LLMs对长文本的处理和检索...……更多
用AI当导演,一个人就能拍电影?
...容。影片最终呈现的视觉画面是由人工智能算法根据观众偏好,从新闻和其它互联网内容中选择并捕获的相关视频片段中创建并编辑生成的。在2021年的平遥国际电影节上,徐冰与团队首次向观众发布了可与观众交互的AI电影版本...……更多
CMU&清华:让LLM自己合成数据来学习,特定任务性能同样大幅提升
...成、输出数据生成和质量优化。输入数据生成在 SELF-GUIDE 框架的设计和实现过程中,研究者首先根据任务类型(生成型任务或分类型任务)指定不同的提示模板。对于生成型任务, SELF-GUIDE 框架使用一个相对简单的提示模板。而...……更多
...助于拓展艺术创作的想象力。创作者受自身习惯、风格与偏好影响,其想象力易拘泥于某一子空间;而人工智能没有桎梏与约束,能更好地激发艺术创造力。健康发展需要跨学科跨领域深度合作该如何看待AIGC及其未来前景?有...……更多
MSRA:视觉生成六大技术问题
...,可以得到下面的结果。然而,该指标不能确保与人类的偏好完全一致。2、利用已有的生成模型衡量指标,如FID等。这类方法有两个问题,第一,FID等指标自身的bias,比如FID假设图像抽取特征后的分布满足高斯分布,这会带来...……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...码的覆盖率已达到80%,其生成代码的采用率达到46%,新增代码生成占比29%。陈洋还分享了标杆客户喜马拉雅的落地案例,其只用1个季度,就实现了工程师中90%的覆盖率,代码采纳率达到44%,新增代码生成占比33%。▲文心快码企...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...决呢?近年来,大语言模型在自然语言处理及各类任务的代码生成方面不断取得重大进展。同样,LLM 已经应用于机器人的多个方面,包括用户界面、任务和运动规划、机器人日志总结、成本和奖励设计,揭示了在物理基础和代...……更多
DeepMind用语言游戏让大模型学AlphaGo自我博弈,数据限制不存在
...习反馈必须来自系统内部的智能体,如损失、奖励函数、偏好数据或批评者。在这里,最简单的性能指标是一个标量分数,可以在有限的时间内测量,也就是在(一系列)偶发任务中测量。从机制上讲,观察者可以通过两种方式...……更多
苹果AI版iOS首日火爆:聊天秒变高情商,大模型成最强嘴替
...通过多轮迭代优化模型的性能。其核心思想是结合不同的偏好优化算法,包括拒绝采样、直接偏好优化(DPO),使得模型能够从多种优化策略中受益,从而提高其对特定任务的适应性和性能。在每次迭代中,iTeC会从最新的模型...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...包括三个阶段:研究思路生成、实验实现和实验执行。该框架在多项机器学习任务中有效促进了研究进展。源代码链接:https://github.com/du-nlp-lab/MLR-Copilot 论文链接:https://arxiv.org/pdf/2408.14033 Demo 链接……更多
百度文心大模型4.0技术进展
...分释放数据价值,大幅提升模型效果。基于有监督精调、偏好学习、强化学习等技术进行多阶段对齐,保证模型更好地与人类的判断和选择对齐。可再生训练技术通过增量式的参数调优,有效节省了训练资源和时间,加快了模型...……更多
世界模型突破!极佳科技首次利用世界模型增强4D驾驶场景重建效果
... 4D 重建算法的效果,在 user study 实验中获得了超过 80% 的偏好投票,为走向空间智能和 4D 世界模型迈出了坚实的一步。论文链接:https://arxiv.org/abs/2410.13571 项目主页:https://drivedreamer4d……更多
腾讯开源最大MoE大语言模型!3D大模型同时支持文/图生成,晒混元模型及应用全家桶
...习平台。其中,针对MoE模型通信效率问题,Angel训练加速框架AngelPTM实现了多项技术优化,性能是主流开源框架DeepSpeed的2.6倍;针对模型推理加速,腾讯Angel机器学习平台和腾讯云智能联合研发AngelHCF-vLLM框架,在最大限度保障精...……更多
复杂组合3D场景生成,LLMs对话式3D可控生成编辑框架来了
...景生成,该工作提出了 LLM 引导的复杂三维场景可控生成框架 GALA3D,能够生成高质量、高一致性、具有多物体和复杂交互关系的 3D 场景,支持对话式交互的可控编辑,论文已被 ICML 2024 录用。 论文标题:GALA3D: Towards Text-to-3D Comp...……更多
阿里发“神笔马良版Sora”,轻轻一抹让猫咪转向,20个演示视频+10页技术报告解读
...c2d2b_66acd09cbf165_66acd09cbf141_开篇.mp4Tora是首个面向轨迹的DiT框架模型,利用DiT的可扩展性,Tora生成的物体运动不仅能精确地遵循轨迹,而且可以有效地模拟物理世界动态,相关论文已于8月1日发布在arXiv上。▲Tora论文Tora目前仅提...……更多
...,结合最新眼科指南和文献资料,通过华为基础 AI 计算框架和多种先进技术,实现数据的多维度处理和模型学习。腾讯联合中山大学、港科大推出图生视频模型“Follow-Your-Pose-v2”:只需要输入一张人物图片和一段动作视频,就可...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了!具体来说,Data Science Assistant(以下称DS Assistant)是基于Modelscope-Agent框架开发的数据科学助手。有了它,我们只需给需求,这个助手就能自己跑完探索性数据分析(ED...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。 我们介绍了 OpenR,首...……更多
更多关于科技的资讯:
近来,“包挂热”在年轻消费者群体中持续升温。社交平台上,有关“包挂”“包搭子”等相关话题的浏览量超过亿次。数据显示,今年上半年
2025-11-25 08:41:00
摘要:在全球市场飞速发展、竞争日趋激烈的当下,企业获得并保持核心竞争力是长远发展的动力源泉。企业的静态核心竞争力易随着技术的进步与市场的变换而失去光彩
2025-11-25 07:04:00
摘要:随着大数据技术的快速发展,传统中小企业的管理模式面临前所未有的挑战与机遇。大数据的应用使得中小企业能够通过数据分析
2025-11-25 07:04:00
外卖大战在不久前刚刚告一段落,市场就又有了新的动作:京东上线了独立App京东外卖,同时还发布了京东点评。而11月以来,也多次传出阿里的外卖平台“饿了么”要更名为淘宝闪购的消息
2025-11-25 07:22:00
在高度媒介化的社会环境中,社交媒体作为关键基础设施,其算法推荐机制催生的“信息茧房”现象日益凸显。本研究聚焦大学生群体
2025-11-25 07:04:00
猛犸世纪AI智能体训练营开课,引爆“一人公司”新范式
AI时代,企业的核心竞争力是什么?在2025年11月19日至20日于深圳南山成功举办的“猛犸AI智能体增长训练营”上,答案被清晰地指向了同一个方向
2025-11-24 14:18:00
澳柯玛多款产品获市长杯工业设计大赛金、银、铜奖
鲁网11月24日讯近日,青岛市2025年第八届“市长杯”工业设计大赛获奖名单正式公布,澳柯玛生活电器凭借卓越的设计实力
2025-11-24 14:44:00
嘉必优捷报频传,瞄定中国生物制造踏新阶
近日,《中共中央关于制定国民经济和社会发展第十五个五年规划的建议》正式发布,明确提出,推动生物制造、量子科技、氢能和核聚变能等成为新的经济增长点
2025-11-24 15:18:00
为规范大型网络平台个人信息处理活动,保护个人信息合法权益,促进平台经济健康发展,国家互联网信息办公室、公安部起草了《大型网络平台个人信息保护规定(征求意见稿)》
2025-11-24 15:29:00
为强化员工合规意识,切实保障SPACC+营销模式下老年客户的服务安全,富德生命人寿保险有限公司张家口中心支公司于11月12日至13日
2025-11-24 15:32:00
10月29日至31日,百年人寿银行保险渠道在深圳大学举办“金鹏启梦,领行新程”主题研学班。本次活动聚焦专业能力跃升与价值成长路径
2025-11-24 15:33:00
多维促消费,畅享“双十一”——邮储银行三明市分行携手商圈平台打造银客商共赢典范东南网11月24日讯 为紧抓“双十一”消费机遇
2025-11-24 15:44:00
王嘉琳女士受邀出席睿海希尔顿花园酒店开业盛典,共贺新章
日前,重庆渝北中央公园睿海希尔顿花园酒店(以下简称“睿海希尔顿花园酒店”)在渝北区中央公园片区盛大开业。作为全国首家开业的4
2025-11-24 16:30:00
11月21日,2025北京零售商品博览会在北京展览馆启幕,展会以“品质零售·融聚共生”为主题,联动生产商、品牌商、渠道商
2025-11-24 17:41:00
“这个锅的厂家还在吗?”一则寻锅视频在全网爆火,这口“用了三十年仍旧不锈不粘、耐用如初”的锅也被网友称为“传家锅”。感动之余
2025-11-24 18:26:00