• 我的订阅
  • 头条热搜
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本基于 LLM 的网络智能体新 Sota。 这正呼应了奥卡姆剃刀原则:「若无必要,勿增实体」。然而换个思考的角度,AgentOccam 的研究团队也想发问:构建通用智能体时,在...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...直持续到 2023 年 12 月,提供了长时间范围和及时的数据样本,能够进一步增强该数据集的应用价值。 构建轨迹基础模型 UniTraj在模型的架构设计上,UniTraj 采用了灵活的编码器 - 解码器架构,为了提升模型的计算效率、鲁棒性...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Bailing-TTS 河南话的合成效果: 再给大家听一下普通话零样本克隆的效果:我们采取了多项创新技术来实现这一目标:1.统一的方言 Token 规范:我们将各方言的 token 规范统一,并使普通话与各方言的 token 有部分重叠,以利用普...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
...然而,生成符合特定条件(如标签、属性或能量分布)的样本,通常需要为每个目标训练专门的生成模型,这种方法不仅耗费资源,还严重制约了扩散模型作为未来基座模型实际应用潜力。为了解决这一难题,斯坦福大学、北京...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...过程中逐步逼近最优策略,同时确保系统满足安全约束。样本复杂度与安全违反分析在安全强化学习中,另一个关键的理论问题是样本复杂度。样本复杂度衡量的是在给定约束条件下,算法需要多少交互样本才能找到一个足够好...……更多
...立足实际需求,历时六年,针对人工智能三要素“数据(样本)、算法、算力”逐个突破,形成高性能人工智能技术体系,并通过输电巡检图像智能识别比赛等形式,优选高性能算法进行培育,迭代创新,不断提升算法性能。为...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...他域外奖励函数(即不同于优化目标的奖励标准)对生成样本进行评分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,...……更多
星尘数据举办春季媒体开放日暨Rosetta3.0平台上线发布会,打破标注产业“人力工厂”认知
...后,提出通过2DOD算法和3D映射联合计算,通过IoU筛选候选样本的方案,并将多个算法直接以人机交互的方式嵌入标注流程中,节省了50%以上的标注时间。全流程闭环式AI数据系统将成主流在发布会上,章磊介绍了星尘数据的数据...……更多
智能体不够聪明怎么办?清华&蚂蚁团队:让它像学徒一样持续学习
...段:就像新员工入职培训,AMOR 通过在 5 万个自动构建的样本上训练掌握基础技能。这些样本被巧妙地分解到各个模块,使得即便是开源语言模型也能快速达到专业水准。 持续进化 - 适应阶段:像经验丰富的职场人一样,AMOR 在...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...助模型更好地学习和改进。MATH-APS.我们通过自动生成合成样本来增强数据。与依赖昂贵且难以扩展的人工标注的 PRM800k 数据集不同,我们引入了一个新数据集 MATH-APS。这个数据集基于 MATH 数据集,并使用 OmegaPRM 等自动化方法来...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。图 | 学习魔法书的小孩(来源:DALL-E ...……更多
阿里妈妈首提AIGB并实现大规模商业化落地,将正式开源Benchmark
...同,例如,Transformer 模型主要基于自注意力机制,能够对样本中跨时序和分层信息进行提取和关联,擅长进行自回归处理。而 Diffusion Model 则缓慢地将随机噪声添加到数据中,然后学习逆向扩散过程以从噪声中构造所需的数据样...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质设计的效率——以往需要 2~5 年...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...部性的特性。基于输入的编辑数据,对应于这三个属性的样本损失定义如下: 模型编辑的批量损失函数推导如下:prompt损失训练:prompt学习的训练损失是基于对比学习,并与可靠性、通用性和局部性的特性相一致。对于一批样...……更多
李飞飞团队“50美元”复现DeepSeek R1?真相是…
...根据李飞飞等人的研究论文,s1模型的训练仅使用了1000个样本数据。按照业内共识,这一数据量在AI训练中可谓微乎其微,通常不足以训练出一个具备推理能力的模型。青年AI科学家、上海交通大学人工智能学院谢伟迪副教授告...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...者表示,该策略足够稳健,在他们的测试场景中可以将零样本转换为真实世界的色彩观察。下面我们来看一段视频展示:机器之心,赞91LucidSim:利用物理引导生成多样化视觉数据研究者考虑了这样一种 sim-to-real 设置,机器人在...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。然而,这些方法中的大多数独立地评估不同的数据样本,忽略了样本之间复杂的...……更多
...综合化改革。比如在真实场景中,很多时候金融机构建模样本并不充足,需要用模型算法开发实现客户的冷启动。针对一些银行的局部需求,要去搭建各类平台,如决策引擎、智能营销平台等。面对一些数字化基础不足的机构,...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...LM 提示词,我常常使用一些老旧的技巧,比如思维链和少样本提示。当然,这样做没什么问题 —— 这些技巧的效果往往还不错。但我总是忍不住想我是不是已经榨取了模型的全部潜力。另一方面,LLM 却可以探索更宽广的提示词...……更多
百度智能云重磅发布开元智慧金融解决方案
...例,开元2.0能够将专业知识的问答采纳率提升至90%以上,大样本初始意图识别准确率提升至90%。目前,在银行领域,百度智能云开元助力苏州银行打造智慧合规系统,实现内外合规知识结构化抽取、标签体系与关联图谱构建,并提供制度...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
百川智能发布Baichuan4-Finance大模型,金融场景能力领先GPT-4o近20%
...数据对模型进行微调,同时针对数学计算等关键场景进行样本增强,显著提升了模型的场景适配能力与执行效率。软通动力指出,该模型完美契合了客户对通用能力与金融专业能力并重的需求,自部署以来,客户满意度提升了20%...……更多
浪潮信息推出as13000g7-n系列
...过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
更多关于科技的资讯:
德司:用心制造每一件产品,以科技驱动高性价比
在消费升级的时代浪潮中,消费者对产品的追求早已超越了简单的价格考量。他们渴望获得高品质的产品体验,同时又不愿为过度的品牌溢价买单
2025-02-15 16:52:00
《哪吒2》票房破百亿,华鼎冷链以“数字元神”领航新篇章!
截至目前,《哪吒之魔童闹海》(以下简称《哪吒2》)累计票房(含预售及海外票房)已超104.93亿,成为首部进入全球票房榜前15的亚洲电影
2025-02-15 16:55:00
性价比革命:理性消费时代的全新选择标准
在物质丰富的今天,消费者的购物行为正在发生深刻变化。追求品牌溢价的时代已经过去,理性消费、价值消费的理念深入人心。性价比不再是一个简单的价格概念
2025-02-15 16:58:00
孩子近视了?这些镜片选择要点要知道?
在当今数字化时代,青少年的视力问题日益严重。长时间使用电子设备、缺乏户外活动以及不正确的用眼习惯,导致越来越多的孩子早早戴上了眼镜
2025-02-15 17:01:00
这种豆角全身都能吃 种子更被誉为“维生素E之王”
提到日常食用的豆类蔬菜,多数人的回答可能集中在四季豆、豇豆或油豆角上。不过,在豆角的大家庭里,还有一位低调却浑身是宝的成员——四棱豆
2025-02-15 14:22:00
真不能随便借!把车借给醉酒朋友开车主也被判拘役
快科技2月15日消息,老婆与车恕不外借,相信很多人都听过这么一句颇为极端的话,但确实有其道理。央视最新报道,近日,湖北省松滋市人民法院审结一起危险驾驶共同犯罪案
2025-02-15 14:22:00
注意了!情人节捡垃圾涉侵占罪引网友热议 律师释疑需返还或上交
快科技2月15日消息,昨天情人节你是怎么过的,有没有给心爱的人送礼物?据国内媒体报道称,情人节期间,部分人将翻捡垃圾桶视为“寻宝”途径
2025-02-15 14:22:00
2024年全球运动员收入榜出炉:C罗蝉联第一
快科技2月15日消息,近日,美国体育商业媒体Sportico发布了2024年全球收入最高的100位运动员榜单。其中,40岁的足球巨星克里斯蒂亚诺·罗纳尔多(C罗)再度荣登榜首
2025-02-15 14:53:00
马斯克言论引风波!超1400名科学家联名撤销其皇家学会院士称号
快科技2月15日消息,据媒体报道,近日,伦敦帝国理工学院结构生物学名誉教授斯蒂芬·库里在其个人博客上发表了一封致英国皇家学会会长阿德里安·史密斯的公开信
2025-02-15 14:53:00
完成B+轮融资,收入过亿的FancyTech说:每个阶段都需要再找一次PMF丨涌现36人
来源:智能涌现涌现(Emergence),是生成式AI浪潮的一个关键现象:当模型规模扩大至临界点,AI会展现出人类一般的智慧
2025-02-15 16:15:00
应用材料对部分中国客户停止设备维护服务!预计损失4亿美元
快科技2月15日消息,美国半导体设备大厂应用材料(Applied Material)发布2025年第一财季报告(截至2025年1月26日)
2025-02-15 14:53:00
博主飞滑翔伞失联22天:家属悬赏百万寻人 疑被吹到丽江境内
快科技2月15日消息,据媒体报道,近日,一名网名“超级流浪师”的重庆户外极限运动博主,在云南哈巴雪山进行户外活动时失联
2025-02-15 14:53:00
本文转自:人民网人民网记者 栗翘楚因为社交平台上的一篇文章,开启一场说走就走的旅行;临近考试,下单一瓶“好运喷雾”,为自己带来好心情
2025-02-15 15:21:00
本文转自:人民网人民网北京2月15日电 (记者孙博洋)记者从市场监管总局了解到,近日,市场监管总局批准建立大长度基准装置
2025-02-15 15:22:00
《哪吒》联名金手镯已接近6万元 第一波抢购的人赚麻了
快科技2月15日消息,5年前的《哪吒》联名金手镯火了!已接近6万元,实现了价格翻倍的增长。据了解,哪吒联名金手镯,源自电影《哪吒之魔童降世》时期的联名合作
2025-02-15 15:23:00