样本,模型,策略,训练,经验,智能头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...间与 LLM 的训练任务对齐。他们训练的 AgentOccam 成为了零样本基于 LLM 的网络智能体新 Sota。这正呼应了奥卡姆剃刀原则：「若无必要，勿增实体」。然而换个思考的角度，AgentOccam 的研究团队也想发问：构建通用智能体时，在...……更多

2024-11-07 09:54:00样本,模型,策略,训练,经验,智能

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...直持续到 2023 年 12 月，提供了长时间范围和及时的数据样本，能够进一步增强该数据集的应用价值。构建轨迹基础模型 UniTraj在模型的架构设计上，UniTraj 采用了灵活的编码器 - 解码器架构，为了提升模型的计算效率、鲁棒性...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

首个支持普通话和方言混说的TTS大模型：河南话、上海话说得溜

...Bailing-TTS 河南话的合成效果：再给大家听一下普通话零样本克隆的效果：我们采取了多项创新技术来实现这一目标：1.统一的方言 Token 规范：我们将各方言的 token 规范统一，并使普通话与各方言的 token 有部分重叠，以利用普...……更多

2024-08-14 09:38:00河南,上海,方言,普通话,模型,话说

NeurIPS Spotlight｜从分类到生成：无训练的可

...然而，生成符合特定条件（如标签、属性或能量分布）的样本，通常需要为每个目标训练专门的生成模型，这种方法不仅耗费资源，还严重制约了扩散模型作为未来基座模型实际应用潜力。为了解决这一难题，斯坦福大学、北京...……更多

2024-12-06 09:52:00生成,训练,分类,生成,样本,指导

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...过程中逐步逼近最优策略，同时确保系统满足安全约束。样本复杂度与安全违反分析在安全强化学习中，另一个关键的理论问题是样本复杂度。样本复杂度衡量的是在给定约束条件下，算法需要多少交互样本才能找到一个足够好...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

国网山东电科院打造“空天地”立体智能巡检

...立足实际需求，历时六年，针对人工智能三要素“数据（样本）、算法、算力”逐个突破，形成高性能人工智能技术体系，并通过输电巡检图像智能识别比赛等形式，优选高性能算法进行培育，迭代创新，不断提升算法性能。为...……更多

2024-03-07 17:43:00山东,立体,智能,天地,输电,无人机

NeurIPS 2024 | FaceChain团队新作，开

...数，基于 Margin 的损失函数能够鼓励模型执行更加高效的样本到类别的比较，因此能够促进人脸识别模型取得更好的识别精度。其中，ArcFace 成为业界训练人脸识别模型首选的损失函数。2. 持续同调下面介绍一下持续同调与我们...……更多

2024-10-18 09:46:00人脸,拓扑,新作,模型,团队,人脸

语言、机器人破壁，MIT等用GPT-4生成模拟任务，并迁移到

...这些策略在所有生成任务上都能很好地泛化，并提高了零样本泛化性能。其中与 GPT-4 生成任务的联合训练可以将泛化性能提升 50%，并在模拟中将大约 40% 的零样本任务迁移到新任务中。‍最后，研究者还考虑了模拟到真实的迁...……更多

2023-10-17 16:58:00机器人,生成,机器,任务,语言,世界

扩散模型版CS: GO！世界模型+强化学习：2小时训练登顶A

...非平衡热力学启发的生成模型，通过逆转加噪过程来生成样本。假设有一个由连续时间变量τ索引的扩散过程，其中τ的取值范围是0到T，然后有一系列的分布，以及边界条件：在τ=0时，分布是数据的真实分布，而在τ=T时，分布...……更多

2024-11-19 09:49:00模型,训练,小时,学习,世界,模型

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...他域外奖励函数（即不同于优化目标的奖励标准）对生成样本进行评分，会发现随着目标奖励逐渐上升，域外奖励评分的增长速度明显放缓，甚至出现域外评分逐渐下降的情况。这表明，模型在一个特定奖励函数上取得高分时，...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

智能体不够聪明怎么办？清华&蚂蚁团队：让它像学徒一样持续学习

...段：就像新员工入职培训，AMOR 通过在 5 万个自动构建的样本上训练掌握基础技能。这些样本被巧妙地分解到各个模块，使得即便是开源语言模型也能快速达到专业水准。持续进化 - 适应阶段：像经验丰富的职场人一样，AMOR 在...……更多

2024-12-11 09:53:00清华,学徒,蚂蚁,不够,团队,怎么办

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...助模型更好地学习和改进。MATH-APS.我们通过自动生成合成样本来增强数据。与依赖昂贵且难以扩展的人工标注的 PRM800k 数据集不同，我们引入了一个新数据集 MATH-APS。这个数据集基于 MATH 数据集，并使用 OmegaPRM 等自动化方法来...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

微美全息构建基于深度迁移学习的图像分类融合模型, 提高图像分

...，由于数据集的限制和模型的复杂性，深度学习模型在小样本数据集上的表现仍然有待提高。为了解决这个问题，微美全息(NASDAQ:WIMI)将迁移学习引入到图像分类任务中，构建了图像分类融合模型，通过利用在大规模数据集上训...……更多

2023-10-23 16:02:00图像,分类,全息,深度,模型,准确性

科学家提出情景学习新范式，让学霸大模型向学弱大模型输送能力

...针对问题实现更好的泛化，无需再将情景学习拘泥于示例样本的构建和筛选。对于大小模型的协作来说，针对端云协同的模型交互、以及利用小模型的能力，本次研究提供了新的参考方案。图 | 学习魔法书的小孩（来源：DALL-E ...……更多

2024-03-01 09:36:00模型,范式,科学家,情景,能力,科学

阿里妈妈首提AIGB并实现大规模商业化落地，将正式开源Ben

...同，例如，Transformer 模型主要基于自注意力机制，能够对样本中跨时序和分层信息进行提取和关联，擅长进行自回归处理。而 Diffusion Model 则缓慢地将随机噪声添加到数据中，然后学习逆向扩散过程以从噪声中构造所需的数据样...……更多

2024-12-05 09:49:00大规,阿里,落地,大规模,妈妈,商业

上海交大团队研发通用人工智能，解决传统蛋白质工程难题

...便于进行大规模预训练和推理。其二，策略优势。利用小样本乃至零样本学习方法，提高大模型的工程泛化能力，帮助它在仅有少数湿实验数据的情况下实现蛋白质性能优化，极大地提高了蛋白质设计的效率——以往需要 2~5 年...……更多

2024-05-07 09:24:00上海交大,人工智能,交大,上海,蛋白质,蛋白

$免训练大模型知识编辑，吸收新数据更高效｜EMNLP\\\'24$

免训练大模型知识编辑，吸收新数据更高效｜EMNLP\'24

...部性的特性。基于输入的编辑数据，对应于这三个属性的样本损失定义如下：模型编辑的批量损失函数推导如下：prompt损失训练：prompt学习的训练损失是基于对比学习，并与可靠性、通用性和局部性的特性相一致。对于一批样...……更多

2024-10-30 09:57:00模型,训练,知识,数据,模型,知识

从未见过现实世界数据，MIT在虚拟环境中训练出机器狗，能跑酷

...者表示，该策略足够稳健，在他们的测试场景中可以将零样本转换为真实世界的色彩观察。下面我们来看一段视频展示：机器之心，赞91LucidSim：利用物理引导生成多样化视觉数据研究者考虑了这样一种 sim-to-real 设置，机器人在...……更多

2024-11-19 09:50:00从未,现实,机器,训练,环境,数据

中科大联合华为诺亚Entropy Law，揭秘大模型性能、数

...，但并非所有数据都有益于模型学习。直觉上，高质量的样本在教授 LLM 上预期会有更好的效率。因此，现有方法通常专注于基于质量的数据选择。然而，这些方法中的大多数独立地评估不同的数据样本，忽略了样本之间复杂的...……更多

2024-07-23 09:41:00诺亚,华为,模型,性能,联合,数据

三线并进为大模型蓄势聚力

...综合化改革。比如在真实场景中，很多时候金融机构建模样本并不充足，需要用模型算法开发实现客户的冷启动。针对一些银行的局部需求，要去搭建各类平台，如决策引擎、智能营销平台等。面对一些数字化基础不足的机构，...……更多

2024-06-03 16:13:00聚力,三线,模型,人工智能,人工,智能

刚刚，OpenAI震撼发布o1大模型！强化学习突破LLM推理

...均只解决了 12% (1.8/15) 的问题，而 o1 在每个问题只有一个样本的情况下平均为 74% (11.1/15)，在 64 个样本之间达成一致的情况下为 83% (12.5/15)，在使用学习的评分函数对 1000 个样本重新排序时为 93% (13.9/15)。13.9 分可以跻身全……更多

2024-09-13 16:42:00推理,模型,极限,突破,学习,模型