• 我的订阅
  • 头条热搜
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本基于 LLM 的网络智能体新 Sota。 这正呼应了奥卡姆剃刀原则:「若无必要,勿增实体」。然而换个思考的角度,AgentOccam 的研究团队也想发问:构建通用智能体时,在...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...直持续到 2023 年 12 月,提供了长时间范围和及时的数据样本,能够进一步增强该数据集的应用价值。 构建轨迹基础模型 UniTraj在模型的架构设计上,UniTraj 采用了灵活的编码器 - 解码器架构,为了提升模型的计算效率、鲁棒性...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Bailing-TTS 河南话的合成效果: 再给大家听一下普通话零样本克隆的效果:我们采取了多项创新技术来实现这一目标:1.统一的方言 Token 规范:我们将各方言的 token 规范统一,并使普通话与各方言的 token 有部分重叠,以利用普...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...过程中逐步逼近最优策略,同时确保系统满足安全约束。样本复杂度与安全违反分析在安全强化学习中,另一个关键的理论问题是样本复杂度。样本复杂度衡量的是在给定约束条件下,算法需要多少交互样本才能找到一个足够好...……更多
...立足实际需求,历时六年,针对人工智能三要素“数据(样本)、算法、算力”逐个突破,形成高性能人工智能技术体系,并通过输电巡检图像智能识别比赛等形式,优选高性能算法进行培育,迭代创新,不断提升算法性能。为...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...他域外奖励函数(即不同于优化目标的奖励标准)对生成样本进行评分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...助模型更好地学习和改进。MATH-APS.我们通过自动生成合成样本来增强数据。与依赖昂贵且难以扩展的人工标注的 PRM800k 数据集不同,我们引入了一个新数据集 MATH-APS。这个数据集基于 MATH 数据集,并使用 OmegaPRM 等自动化方法来...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。图 | 学习魔法书的小孩(来源:DALL-E ...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质设计的效率——以往需要 2~5 年...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...部性的特性。基于输入的编辑数据,对应于这三个属性的样本损失定义如下: 模型编辑的批量损失函数推导如下:prompt损失训练:prompt学习的训练损失是基于对比学习,并与可靠性、通用性和局部性的特性相一致。对于一批样...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...者表示,该策略足够稳健,在他们的测试场景中可以将零样本转换为真实世界的色彩观察。下面我们来看一段视频展示:机器之心,赞91LucidSim:利用物理引导生成多样化视觉数据研究者考虑了这样一种 sim-to-real 设置,机器人在...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。然而,这些方法中的大多数独立地评估不同的数据样本,忽略了样本之间复杂的...……更多
...综合化改革。比如在真实场景中,很多时候金融机构建模样本并不充足,需要用模型算法开发实现客户的冷启动。针对一些银行的局部需求,要去搭建各类平台,如决策引擎、智能营销平台等。面对一些数字化基础不足的机构,...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...LM 提示词,我常常使用一些老旧的技巧,比如思维链和少样本提示。当然,这样做没什么问题 —— 这些技巧的效果往往还不错。但我总是忍不住想我是不是已经榨取了模型的全部潜力。另一方面,LLM 却可以探索更宽广的提示词...……更多
百度智能云重磅发布开元智慧金融解决方案
...例,开元2.0能够将专业知识的问答采纳率提升至90%以上,大样本初始意图识别准确率提升至90%。目前,在银行领域,百度智能云开元助力苏州银行打造智慧合规系统,实现内外合规知识结构化抽取、标签体系与关联图谱构建,并提供制度...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
浪潮信息推出as13000g7-n系列
...过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
大模型到了该「验收」的时候
...极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能客服、研发提效、智能营销、内容生成……首先是智能客服与知识管理场景,由于...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...练集与测试集的基础数值统计信息;图 b 揭示了 MMedBench 样本在不同主题上的分布情况。MMedBench 模型测评研究团队对主流医疗语言模型在 MMedBench 基准上,对三种不同的测试策略进行了评估:Zero-shot:适用于没有开源的模型,通...……更多
...的难题——输电领域缺陷隐患超过100类,而30%的缺陷隐患样本极少,传统小模型难以识别;且平均识别准确率低于80%,无法做到智能辅助、精确分析。南方电网广西电网公司机巡与不停电作业中心有关负责人介绍,以往依靠小模...……更多
中企通信“信息安全威胁识别平台”闪耀BPAA大赛勇夺榜眼
...专用大模型,为流量异常识别小模型提供异常识别与标识样本数据,并且能够通过text2sql的方式,将系统后台数据按照用户的自然语言指示快速检索和生成个性化图文报表,还可以通过对话交互的方式,为用户提供更有针对性的...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...房间中端茶倒水...变换任务对象和环境都难不倒它。4. 少样本学习:一点就通的高材生更厉害的是,RDT 有很强的领悟力,是机器人模型中的“学霸”。 教会 RDT 叠衣服仅需演示 1 遍,而其他模型要重复教几十遍才能勉强学会。...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...心“交钥匙”服务,基于大模型技术的数据分析和清洗、样本数据智能生成和大模型推理数据回流,解决大模型训练数据不足且质量不高等情况,全面赋能训练数据智能处理功能,提升实际训练场景下训练数据的质量和多样性。...……更多
更多关于科技的资讯:
蒋欣歪嘴拍完华妃后改不回来了:歪嘴笑是为人物专门设计的
1月12日消息,据媒体报道,在甄嬛传晚会直播里,蒋欣聊起了塑造华妃这个角色的小细节。蒋欣表示,当年刚进组,为了演出华妃娘娘的霸气
2025-01-12 00:21:00
本文转自:人民日报吕品田《人民日报》(2025年01月12日第 08 版)在线上,李子柒等博主分享的手工艺制作视频“破圈”传播
2025-01-12 06:07:00
互联网大厂花式宠员工!携程宣布新福利:给有娃员工增加3天带薪陪娃假
快科技1月12日消息,日前,携程集团25周年全球庆典在上海举行,在典礼现场,携程集团CEO孙洁宣布了一项针对“家庭友好”的新福利政策
2025-01-12 07:21:00
搞定这三个问题,投标高效又精准!
第一个问题,高效查找项目。很多朋友都习惯于去某搜索引擎查找标讯,搜出来的广告居多,而且信息来源还不可溯源查证,甚至有时候跑到官方的发布平台去搜也搜不到
2025-01-11 17:39:00
2024火蝠电商年度盘点:电商代运营为核心,多领域服务并进
2024年,国内电商市场在“国补”政策刺激与电商平台“互联互通”等积极因素推动下,展现出蓬勃的发展活力。权威数据表明,1到11月全国网上零售额达14万亿元
2025-01-11 17:58:00
各类的招标网的信息的来源主要会从政府采购网站、公共资源交易平台、招标代理机构授权、采购商自行在该网站上发布的招标信息来获取招标信息
2025-01-11 18:00:00
咱们得明确,劳保用品的采购商类型很多,需求也各不相同。大致可以分为以下几类:1.大型企业和工厂:这是劳保用品的最大买家
2025-01-11 18:01:00
造价35万元的E-bike被老外追捧,这个卷疯了的赛道仍有机会|硬氪直击CES
作者 | 张子怡编辑 | 袁斯来一年一度的科技界春晚CES 2025即将落幕,不同于去年展会上备受关注、新品频出的E-bike
2025-01-12 04:34:00
男子钓到“金蟾抱鲤”果断放生:钓了20多年鱼第一次遇到
快科技1月11日消息,近日,云南一名男子在钓鱼时遇到了令人惊叹的一幕:一条鲤鱼被一只金蟾紧紧抱住。他拍摄的视频显示,这只蟾蜍将两只前爪伸入鲤鱼的眼睛中
2025-01-11 19:51:00
招标项目可以提前知道吗?投标老鸟的实战经验分享
在招投标的战场上,能提前获取招标项目信息吗?当然可以。这就好比是手握“先知卷轴”,能让你在众多竞争者中抢占先机,为中标铺就坦途
2025-01-11 20:11:00
从风云浙商榜单看2024年浙江经济拼图
岁回律转,时光倏然。一年的时间,不过是两次年度风云浙商登台亮相的间隙。2024年度风云浙商昨天(1月10日)揭开谜底,这10位(组)最后当选的浙商面孔
2025-01-11 20:31:00
占地1万平方米,全国首家!京东奥莱线下店落户临沂
近日,临沂和谐广场与京东奥莱正式达成战略合作,双方将携手在和谐广场开设京东奥莱店。据了解,该店占地面积1万平方米,是全国首家万平米京东奥莱店
2025-01-11 20:55:00
首先,可以访问“全国建筑市场监管公共服务平台”,也就是我们常说的“四库一平台”,这里提供丰富的工程项目信息。第二,中国政府采购网
2025-01-11 21:07:00
女子考研失败后到北大当保安:以一种特殊方式来到梦想之地
1月11日消息,据媒体报道,2023年,赵予宁考研失败,这时她的同学向她推荐了北大安保岗位,赵予宁决定抓住这次机会,以一种特殊的方式来到自己梦想的地方
2025-01-11 21:21:00
固态硬盘的M.2/PCIe/NVMe有何含义 一文读懂
在选择固态硬盘的时候,我们经常会看到M.2/PCIe/NVMe这样的字眼,虽然他们经常一起出现,但是有时候会出现支持一个但是不支持另一个的情况
2025-01-11 21:21:00