• 我的订阅
  • 头条热搜
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本基于 LLM 的网络智能体新 Sota。 这正呼应了奥卡姆剃刀原则:「若无必要,勿增实体」。然而换个思考的角度,AgentOccam 的研究团队也想发问:构建通用智能体时,在...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...直持续到 2023 年 12 月,提供了长时间范围和及时的数据样本,能够进一步增强该数据集的应用价值。 构建轨迹基础模型 UniTraj在模型的架构设计上,UniTraj 采用了灵活的编码器 - 解码器架构,为了提升模型的计算效率、鲁棒性...……更多
首个支持普通话和方言混说的TTS大模型:河南话、上海话说得溜
...Bailing-TTS 河南话的合成效果: 再给大家听一下普通话零样本克隆的效果:我们采取了多项创新技术来实现这一目标:1.统一的方言 Token 规范:我们将各方言的 token 规范统一,并使普通话与各方言的 token 有部分重叠,以利用普...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...过程中逐步逼近最优策略,同时确保系统满足安全约束。样本复杂度与安全违反分析在安全强化学习中,另一个关键的理论问题是样本复杂度。样本复杂度衡量的是在给定约束条件下,算法需要多少交互样本才能找到一个足够好...……更多
...立足实际需求,历时六年,针对人工智能三要素“数据(样本)、算法、算力”逐个突破,形成高性能人工智能技术体系,并通过输电巡检图像智能识别比赛等形式,优选高性能算法进行培育,迭代创新,不断提升算法性能。为...……更多
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型
...数, 基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较,因此能够促进人脸识别模型取得更好的识别精度。其中,ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多
语言、机器人破壁,MIT等用GPT-4生成模拟任务,并迁移到真实世界
...这些策略在所有生成任务上都能很好地泛化,并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%,并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后,研究者还考虑了模拟到真实的迁...……更多
扩散模型版CS: GO!世界模型+强化学习:2小时训练登顶Atari 100K
...非平衡热力学启发的生成模型,通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程,其中τ的取值范围是0到T,然后有一系列的分布,以及边界条件:在τ=0时,分布是数据的真实分布,而在τ=T时,分布...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...他域外奖励函数(即不同于优化目标的奖励标准)对生成样本进行评分,会发现随着目标奖励逐渐上升,域外奖励评分的增长速度明显放缓,甚至出现域外评分逐渐下降的情况。这表明,模型在一个特定奖励函数上取得高分时,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...助模型更好地学习和改进。MATH-APS.我们通过自动生成合成样本来增强数据。与依赖昂贵且难以扩展的人工标注的 PRM800k 数据集不同,我们引入了一个新数据集 MATH-APS。这个数据集基于 MATH 数据集,并使用 OmegaPRM 等自动化方法来...……更多
微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分类的准确性和效率
...,由于数据集的限制和模型的复杂性,深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题,微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中,构建了图像分类融合模型,通过利用在大规模数据集上训...……更多
科学家提出情景学习新范式,让学霸大模型向学弱大模型输送能力
...针对问题实现更好的泛化,无需再将情景学习拘泥于示例样本的构建和筛选。对于大小模型的协作来说,针对端云协同的模型交互、以及利用小模型的能力,本次研究提供了新的参考方案。图 | 学习魔法书的小孩(来源:DALL-E ...……更多
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...便于进行大规模预训练和推理。其二,策略优势。利用小样本乃至零样本学习方法,提高大模型的工程泛化能力,帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化,极大地提高了蛋白质设计的效率——以往需要 2~5 年...……更多
免训练大模型知识编辑,吸收新数据更高效|EMNLP\\\'24
...部性的特性。基于输入的编辑数据,对应于这三个属性的样本损失定义如下: 模型编辑的批量损失函数推导如下:prompt损失训练:prompt学习的训练损失是基于对比学习,并与可靠性、通用性和局部性的特性相一致。对于一批样...……更多
从未见过现实世界数据,MIT在虚拟环境中训练出机器狗,能跑酷
...者表示,该策略足够稳健,在他们的测试场景中可以将零样本转换为真实世界的色彩观察。下面我们来看一段视频展示:机器之心,赞91LucidSim:利用物理引导生成多样化视觉数据研究者考虑了这样一种 sim-to-real 设置,机器人在...……更多
中科大联合华为诺亚Entropy Law,揭秘大模型性能、数据压缩率
...,但并非所有数据都有益于模型学习。直觉上,高质量的样本在教授 LLM 上预期会有更好的效率。因此,现有方法通常专注于基于质量的数据选择。然而,这些方法中的大多数独立地评估不同的数据样本,忽略了样本之间复杂的...……更多
...综合化改革。比如在真实场景中,很多时候金融机构建模样本并不充足,需要用模型算法开发实现客户的冷启动。针对一些银行的局部需求,要去搭建各类平台,如决策引擎、智能营销平台等。面对一些数字化基础不足的机构,...……更多
刚刚,OpenAI震撼发布o1大模型!强化学习突破LLM推理极限
...均只解决了 12% (1.8/15) 的问题,而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15),在 64 个样本之间达成一致的情况下为 83% (12.5/15),在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全……更多
还在人工炼丹?自动提示工程指南来了,还带从头实现
...LM 提示词,我常常使用一些老旧的技巧,比如思维链和少样本提示。当然,这样做没什么问题 —— 这些技巧的效果往往还不错。但我总是忍不住想我是不是已经榨取了模型的全部潜力。另一方面,LLM 却可以探索更宽广的提示词...……更多
百度智能云重磅发布开元智慧金融解决方案
...例,开元2.0能够将专业知识的问答采纳率提升至90%以上,大样本初始意图识别准确率提升至90%。目前,在银行领域,百度智能云开元助力苏州银行打造智慧合规系统,实现内外合规知识结构化抽取、标签体系与关联图谱构建,并提供制度...……更多
...,分别是模型训练分类器法(也被称为监督分类器法)、零样本分类器法、文本水印法。“三种检测方法本质上都是利用AI检测AI,且各有优劣。”鲍光胜说。模型训练分类器法,首先要收集大量人类创作内容与AIGC,然后以此为基...……更多
浪潮信息推出as13000g7-n系列
...过缓存预读技术,提前识别数据的冷热程度,加速了重复样本数据的读取,训练加载速度提升10倍。无论是读操作还是写操作,AS13000G7-N采取了字节级(Byte)分布式锁机制,粒度是主流并行文件系统锁机制粒度的几十分之一,确...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...、指令遵循和健壮性,团队还整理出了一套包含 110 万个样本的引用与引用指令调整数据集 GRIT。GRIT 中包含多个层次的空间知识,涵盖对象、关系、区域描述和复杂推理等要素。GRIT 包含三种数据类型:被转换为指认遵循格式的...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...中:模态对齐和模态融合。在模态对齐过程中,单个数据样本的不同模态特征往往会在连续学习过程中出现分散,这种现象被称为 MMCL 中的空间紊乱。这种发散可能会导致更严重的性能下降。在模态融合方面,在非 CL 环境中使...……更多
大模型到了该「验收」的时候
...极佳。抽取一下关键词:知识密集、自然语言、泛化与小样本、多模态内容创作。顺着大模型技术能力往下匹配,场景呼之欲出:知识管理、智能客服、研发提效、智能营销、内容生成……首先是智能客服与知识管理场景,由于...……更多
迈向多语言医疗大模型:大规模预训练语料,开源模型与全面基准测试
...练集与测试集的基础数值统计信息;图 b 揭示了 MMedBench 样本在不同主题上的分布情况。MMedBench 模型测评研究团队对主流医疗语言模型在 MMedBench 基准上,对三种不同的测试策略进行了评估:Zero-shot:适用于没有开源的模型,通...……更多
...的难题——输电领域缺陷隐患超过100类,而30%的缺陷隐患样本极少,传统小模型难以识别;且平均识别准确率低于80%,无法做到智能辅助、精确分析。南方电网广西电网公司机巡与不停电作业中心有关负责人介绍,以往依靠小模...……更多
中企通信“信息安全威胁识别平台”闪耀BPAA大赛勇夺榜眼
...专用大模型,为流量异常识别小模型提供异常识别与标识样本数据,并且能够通过text2sql的方式,将系统后台数据按照用户的自然语言指示快速检索和生成个性化图文报表,还可以通过对话交互的方式,为用户提供更有针对性的...……更多
清华全球最大双臂机器人扩散大模型RDT,懂调酒能遛狗,登顶热榜
...房间中端茶倒水...变换任务对象和环境都难不倒它。4. 少样本学习:一点就通的高材生更厉害的是,RDT 有很强的领悟力,是机器人模型中的“学霸”。 教会 RDT 叠衣服仅需演示 1 遍,而其他模型要重复教几十遍才能勉强学会。...……更多
模型即服务,卓世科技MaaS平台 2.0 正式上线
...心“交钥匙”服务,基于大模型技术的数据分析和清洗、样本数据智能生成和大模型推理数据回流,解决大模型训练数据不足且质量不高等情况,全面赋能训练数据智能处理功能,提升实际训练场景下训练数据的质量和多样性。...……更多
更多关于科技的资讯:
孩子父亲拟卖房赔!被炮炸飞两辆车车主已涨粉20多万:车总价合计超百万
快科技2月2日消息,近日在在四川内江资中,一名小孩往下水道投放鞭炮,结果这一不当行为瞬间引发剧烈爆炸。据国内媒体报道称
2025-02-02 08:10:00
周鸿祎:DeepSeek践行开源精神 是真正的“Open AI”
快科技2月2日消息,据报道,中国人工智能企业DeepSeek近期遭遇了来自美国的全方位打压,包括调查、禁用、污名化指责以及大规模攻击等
2025-02-02 08:10:00
绕开英伟达护城河CUDA!消息称DeepSeek准备适配国产GPU
快科技2月2日消息,据国内媒体报道称,DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁
2025-02-02 08:10:00
《蛟龙行动》总制片于冬:打一星的都是黑水 我们绝不撤档
快科技2月2日消息,据报道,今年春节档影片《蛟龙行动》陷入排片困境、影片遭遇水军恶意打低分等话题,引发网友热议。在《蛟龙行动》1月31日的路演活动上
2025-02-02 08:40:00
鞭炮炸翻豪车 小孩家庭支付天价赔偿为假!保险公司:8车总共受损28.5万
快科技2月2日消息,近期,四川资中一小孩因燃放鞭炮引起的沼气燃爆,致使8辆汽车受损一事,引起网友关注热议。因为受损车辆包括林肯
2025-02-02 08:40:00
余承东晒自己曾买过的车:第一辆堪称经典 百万卡宴送都被嫌弃
快科技2月2日消息,近日余承东开启了一场直播,讲述了自己曾经拥有过的一些汽车。余承东在直播中回忆,早在1998年,他就购买了人生中的第一辆车——捷达王(太过经典的车型)
2025-02-02 08:10:00
宁德时代潘健:中国电动汽车正从“EV”变为“EIV”
快科技2月1日消息,据媒体报道,宁德时代联席董事长潘健在瑞士达沃斯举行的世界经济论坛年会上表示,中国电动汽车行业正在从“EV(电动汽车)”向“EIV(智能电动汽车)”转变
2025-02-01 08:39:00
杭州70岁大妈去影院看新《射雕英雄传》:我就想看肖战演的郭靖
2月1日消息,近日在杭州的一家影院,一位70岁的阿姨说自己特地来看肖战主演的春节档电影《射雕英雄传:侠之大者》,她表示哪怕剧情一般
2025-02-01 09:09:00
越南从韩国进口的无人机大批坠机起火:被迫取消除夕夜灯光秀表演
快科技2月1日消息,据报道,1月26日,越南河内大批无人机在彩排时坠落并在美亭国家体育场附近引起火灾。网友拍摄的视频显示
2025-02-01 09:09:00
小鹏G9/G6正式登陆爱尔兰/芬兰:加速欧洲市场布局
快科技2月1日消息,日前,小鹏汽车在都柏林和赫尔辛基分别举办发布会,正式进军爱尔兰和芬兰市场,小鹏G9和小鹏G6两款车型同步亮相
2025-02-01 09:09:00
每年超过0.3厘米的下沉 我们的房子怎么办
除了西湖醋鱼,杭州还有哪些地方特色呢?作为一个杭州人,差评君会自嘲地说:还有沉降东站!杭州的东站建设于 1992 年,在 2008 年改扩建后一度是亚洲最大的火车站
2025-02-01 09:39:00
蔚来推出5年0息金融政策 加赠5年NOP+免费使用权等权益
快科技2月1日消息,蔚来官方宣布,从即日起至2月28日期间支付定金购买蔚来旗下车型的用户,可享受首付20%起以及5年0息金融方案
2025-02-01 10:39:00
周边路面已修复!放炮炸翻多辆豪车的熊孩子已被带走:家长或赔超500万
快科技2月1日消息,近日在四川内江资中,一名小孩往下水道投放鞭炮,结果这一不当行为瞬间引发剧烈爆炸。据国内媒体报道称,四川资中县一男孩将鞭炮扔进下水道引发化粪池内沼气爆燃
2025-02-01 10:39:00
电瓶车强闯收费站 逆行上高速致轿车撞车!官方通报
快科技2月1日消息,近日,一段令人揪心的视频在网络引发热议。视频显示,在四川宜宾某高速公路上,一辆电瓶车竟在快车道上逆行
2025-02-01 10:39:00
前游戏公司总裁操作无人机与救火飞机相撞
Treyarch工作室联合创始人,空舞互动娱乐前总裁彼得·艾克曼(Peter Akemann)周五与控方达成认罪协议,协议规定可免于坐牢
2025-02-01 11:09:00