• 我的订阅
  • 头条热搜
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本基于 LLM 的网络智能体新 Sota。 这正呼应了奥卡姆剃刀原则:「若无必要,勿增实体」。然而换个思考的角度,AgentOccam 的研究团队也想发问:构建通用智能体时,在...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Bailing-TTS 河南话的合成效果: 再给大家听一下普通话零样本克隆的效果:我们采取了多项创新技术来实现这一目标:1.统一的方言 Token 规范:我们将各方言的 token 规范统一,并使普通话与各方言的 token 有部分重叠,以利用普...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...过程中逐步逼近最优策略,同时确保系统满足安全约束。样本复杂度与安全违反分析在安全强化学习中,另一个关键的理论问题是样本复杂度。样本复杂度衡量的是在给定约束条件下,算法需要多少交互样本才能找到一个足够好...……更多
...立足实际需求,历时六年,针对人工智能三要素“数据(样本)、算法、算力”逐个突破,形成高性能人工智能技术体系,并通过输电巡检图像智能识别比赛等形式,优选高性能算法进行培育,迭代创新,不断提升算法性能。为...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...他域外奖励函数(即不同于优化目标的奖励标准)对生成样本进行评分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...助模型更好地学习和改进。MATH-APS.我们通过自动生成合成样本来增强数据。与依赖昂贵且难以扩展的人工标注的 PRM800k 数据集不同,我们引入了一个新数据集 MATH-APS。这个数据集基于 MATH 数据集,并使用 OmegaPRM 等自动化方法来...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。图 | 学习魔法书的小孩(来源:DALL-E ...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质设计的效率——以往需要 2~5 年...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...部性的特性。基于输入的编辑数据,对应于这三个属性的样本损失定义如下: 模型编辑的批量损失函数推导如下:prompt损失训练:prompt学习的训练损失是基于对比学习,并与可靠性、通用性和局部性的特性相一致。对于一批样...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...者表示,该策略足够稳健,在他们的测试场景中可以将零样本转换为真实世界的色彩观察。下面我们来看一段视频展示:机器之心,赞91LucidSim:利用物理引导生成多样化视觉数据研究者考虑了这样一种 sim-to-real 设置,机器人在...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。然而,这些方法中的大多数独立地评估不同的数据样本,忽略了样本之间复杂的...……更多
...综合化改革。比如在真实场景中,很多时候金融机构建模样本并不充足,需要用模型算法开发实现客户的冷启动。针对一些银行的局部需求,要去搭建各类平台,如决策引擎、智能营销平台等。面对一些数字化基础不足的机构,...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...LM 提示词,我常常使用一些老旧的技巧,比如思维链和少样本提示。当然,这样做没什么问题 —— 这些技巧的效果往往还不错。但我总是忍不住想我是不是已经榨取了模型的全部潜力。另一方面,LLM 却可以探索更宽广的提示词...……更多
百度智能云重磅发布开元智慧金融解决方案
...例,开元2.0能够将专业知识的问答采纳率提升至90%以上,大样本初始意图识别准确率提升至90%。目前,在银行领域,百度智能云开元助力苏州银行打造智慧合规系统,实现内外合规知识结构化抽取、标签体系与关联图谱构建,并提供制度...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
浪潮信息推出as13000g7-n系列
...过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
大模型到了该「验收」的时候
...极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能客服、研发提效、智能营销、内容生成……首先是智能客服与知识管理场景,由于...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...练集与测试集的基础数值统计信息;图 b 揭示了 MMedBench 样本在不同主题上的分布情况。MMedBench 模型测评研究团队对主流医疗语言模型在 MMedBench 基准上,对三种不同的测试策略进行了评估:Zero-shot:适用于没有开源的模型,通...……更多
...的难题——输电领域缺陷隐患超过100类,而30%的缺陷隐患样本极少,传统小模型难以识别;且平均识别准确率低于80%,无法做到智能辅助、精确分析。南方电网广西电网公司机巡与不停电作业中心有关负责人介绍,以往依靠小模...……更多
中企通信“信息安全威胁识别平台”闪耀BPAA大赛勇夺榜眼
...专用大模型,为流量异常识别小模型提供异常识别与标识样本数据,并且能够通过text2sql的方式,将系统后台数据按照用户的自然语言指示快速检索和生成个性化图文报表,还可以通过对话交互的方式,为用户提供更有针对性的...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...房间中端茶倒水...变换任务对象和环境都难不倒它。4. 少样本学习:一点就通的高材生更厉害的是,RDT 有很强的领悟力,是机器人模型中的“学霸”。 教会 RDT 叠衣服仅需演示 1 遍,而其他模型要重复教几十遍才能勉强学会。...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...心“交钥匙”服务,基于大模型技术的数据分析和清洗、样本数据智能生成和大模型推理数据回流,解决大模型训练数据不足且质量不高等情况,全面赋能训练数据智能处理功能,提升实际训练场景下训练数据的质量和多样性。...……更多
打脸“AI灭绝伦”!研究反驳:大模型涌现能力不会威胁人类生存
... AI 大模型在不同上下文条件下的表现,结果发现:在零样本(zero-shot)的情况下,许多大模型根本无法展现所谓的“涌现能力”,反而表现得相当一般。他们表示,这一发现有助于理解 LLM 的实际能力和局限性,并为未来的模型...……更多
更多关于科技的资讯:
□南京日报/紫金山新闻记者张甜甜通讯员熊娟新春佳节热潮涌,开年大吉福临门。2月2日,农历正月初五,民间有“迎财神”的习俗
2025-02-03 09:44:00
3名游客意外落海:水上机器人成功拖回
快科技2月3日消息,机器人越发成熟起来,在各个领域发挥的作用也越来越大,近日,就有水上机器人成功救援了三名落水的游客。据央视网报道
2025-02-03 08:10:00
RTX 5090缺货到一塌糊涂!想预定都要等4个月
快科技2月3日消息,在RTX 50系列显卡发布后,市场出现了“一卡难求”的局面,许多零售商在开售后几分钟内就宣告售罄,甚至一些商家根本未能拿到RTX 5090
2025-02-03 08:10:00
华为XHUD-AR构图引擎亮点信息公布:让开车比开飞机更有趣
快科技2月3日消息,今日凌晨,华为乾崑智能汽车解决方案公布了XHUD-AR构图引擎的亮点信息,引擎支持多维坐标转换(虚实空间融合算法)
2025-02-03 09:10:00
火热一线过大年|厦企安费诺电子近4000名员工坚守岗位
春节假期,安费诺电子员工在产线上忙碌。(记者 张奇辉 摄)厦门网讯(厦门日报记者 李晓平)“为赶订单,这个春节我们有近4000名员工坚守岗位
2025-02-03 09:07:00
牢记嘱托 善作善成 春节假期,天津港依然是一派繁忙景象。港口里的拖轮,每天平均穿梭于码头和货轮之间8到10艘次。
2025-02-03 08:51:00
体长55米的巨型虫子!缩成一团蠕动 仿佛“毒液”
提起绦虫,第一时间的反应绝对是“恶心”,因为这是一种非常长的肠道寄生虫,人类也会被寄生。它到底有多长呢?开头这张照片就比较有名
2025-02-03 08:40:00
AMD惊喜连连!锐龙9 9000X3D与RX 9070系列显卡3月同步发布
快科技2月3日消息,据媒体报道,AMD计划在3月底同步推出锐龙9 9000X3D系列处理器和RX 9070系列显卡。锐龙9 9000X3D系列处理器包括16核心的9950X3D和12核心的9900X3D
2025-02-03 08:40:00
16大核32小核!Intel下代桌面CPU Nova Lake-SK很暴力
快科技2月3日消息,Intel已经官宣,将在今年下半年投产Intel 18A工艺,发布下代移动处理器Panther Lake
2025-02-03 08:40:00
春晚与淘宝,如何成为“最佳搭档”的?
作者:剑秋申遗后的春晚,正在变得更年轻? 在辞旧迎新的除夕夜,春节联欢晚会这个持续了43年的文化盛宴,在其与老搭档淘宝7年后第四次携手之际
2025-02-03 07:17:00
2024年全新上市车型销量榜:比亚迪秦L第一 一年狂卖228818辆
快科技2月2日消息,易车榜根据终端销量数据,整理了2024年上市的全新车型销量Top20榜单。具体来看,比亚迪秦L为去年上市的全新车型销冠车型
2025-02-02 23:10:00
苹果宣布开源Swift Build:拓展开发者生态建设
快科技2月2日消息,据报道,苹果宣布其将开源用于构建Xcode开发环境的工具引擎Swift Build。为开发者提供更加灵活和强大的工具支持
2025-02-02 23:40:00
阿西莫夫三定律 还适用于今天的AI吗
1942年,伟大的科幻作家艾萨克·阿西莫夫(Isaac Asimov)在他的短篇小说《转圈圈》(Runaround)中首次提出了“机器人三定律”
2025-02-02 23:40:00
想买YU7 先看看这台14000公里的创始版SU7现在咋样了
各位买新能源车的时候,会考虑二手车么?反正脖子哥我是有点心动的,二手新能源大部分年份都很近,里程数很低,而且一看价格全是骨折价
2025-02-03 01:10:00
“新冰箱吸不住高价买的冰箱贴”,气疯有囤积癖的年轻人
原标题:为什么新出的冰箱,吸不住冰箱贴了?作者:梁婷婷囤满食物的冰箱,在爸妈眼里自带一种年味儿,但一代人有一代人的“囤积癖”
2025-02-03 03:03:00