框架,团队,联合,模型,过程,步骤头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...学（广州）、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」，一个开源代码库，帮助用户快速实现构建自己的复杂推断模型。整个项目由 UCL 汪军教授发起和指导，实验主要由上海交大团队完成。我们介绍了 OpenR，首...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

扩散模型也能搞定社交信息推荐，港大数据智能实验室提出RecD

...了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架，能够更好地捕捉用户的潜在偏好和兴趣，从而生成个性化、贴合用户需求的推荐内容。具体而言，该框架采用隐空间扩散机制，有效清除用户表示中的噪声，无论是...……更多

2024-07-30 09:31:00社交,实验室,模型,实验,智能,数据

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...提示设计的标准化方法。借助 CoT，人们现在拥有了一个框架来创建更有效的提示，从而可以完成复杂的推理任务。而这种增强解数学题的能力，能帮助用户更好地解数学题。此外，CoT 还可以通过搜索引擎理解和处理多步骤查...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

多模态模型免微调接入互联网，即插即用新框架，效果超闭源方案

...大学、浙江大学、香港大学联合提出即插即用的SearchLVLMs框架，可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强，使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助...……更多

2024-11-11 13:34:00模态,接入,框架,模型,效果,互联网

不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM

...究团队也想发问：构建通用智能体时，在铺设复杂的系统框架前，是否已经优化了行动 / 观测空间，让这些功能模块达到了最优状态？论文链接：https://arxiv.org/abs/2410.13825 论文名：AgentOccam: A Simple Yet Strong Baseline for……更多

2024-11-07 09:54:00样本,模型,策略,训练,经验,智能

谷歌大模型推理范式，主要分为两个阶段

...waroopMishra是谷歌DeepMind的研究科学家，它参与的Self-Instruct框架在GitHub上星标3.5k、被引用次数超过600，并被ACL2023接收。此外QuocLe、DennyZhou等大模型提示微调、推理方向的老面孔也参与其中。虽然官方暂未开源，但已经有迫不及待..……更多

2024-02-10 21:09:00范式,推理,模型,阶段,两个,模型

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问

...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva，即 Evolving Alignment via Asymmetric Self-Play，也就是「通过非对称自博弈实现的演进式对齐」。论文标题：Evolving Alignment via Asymmetric Self-Play 论文地址……更多

2024-11-06 09:44:00框架,人类,问题,提示,策略,模型

空间智能新进展：教机器人组装家具，实现操作步骤与真实视频对齐

... 首先，研究者们首先定义了一套层次化的装配过程描述框架，将整个装配过程分为步骤、子步骤和视频帧等多个层级。作者首先从IAW数据集中提取每个手动步骤的视频片段，并将每个视频片段分解为更小的间隔（子步骤）。对...……更多

2024-11-27 09:57:00新进,机器人,步骤,机器,家具,智能

全模态对齐框架align-anything来啦：实现跨模态指

...京大学一支团队迅速跟进，用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调，表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。为进一步促进社区的多模态对齐研究，日前，该...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

...练过程中引入偏好学习，提出了一个全新的代码生成优化框架——CodeDPO。在部分模型上，相比于单独使用SFT，CodeDPO能够将模型的HumanEval得分再多提升10个百分点，最高增幅接近1/3。监督微调（SFT）等现有训练方法，尽管提升了...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍

科学家们已经建立了一个框架，通过将它们浓缩到更小的模型中，在不影响质量的情况下，给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明，由于一项技术可以将整个100个阶段的过程...……更多

2024-03-27 13:42:00麻省理工,麻省,生成器,人工智能,提速,科学家

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...oTA」的时代，简单易用、标准透明、可复现的多模态评估框架变得越来越重要，而这并非易事。为解决以上问题，来自南洋理工大学 LMMs-Lab 的研究人员联合开源了 LMMs-Eval，这是一个专为多模态大型模型设计的评估框架，为多模...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

变革管理在企业中的应用与挑战

...是一个技术过程，更是一个社会和心理过程。3.麦肯锡7S框架麦肯锡7S框架是由麦肯锡公司的两位顾问罗伯特·沃特曼和汤姆·彼得斯于20世纪80年代初提出的一个组织管理模型。最初出现在汤姆·彼得斯和罗伯特·沃特曼合著的书籍...……更多

2024-06-28 10:47:00变革,应用,管理,企业,变革,管理

补齐Transformer规划短板又不放弃快速思考，Dual

...决这些挑战，他们提出了一个利用随机化推理轨迹的训练框架。该方法的灵感来自两个研究方向：该团队注意到，即便 Searchformer 是在完整的 A* 搜索轨迹上训练的，但它也会生成更短的勾勒搜索过程的轨迹。研究表明，人类在...……更多

2024-10-17 09:47:00优势,规划,推理,轨迹,模型,慢速

姚期智院士大模型新研究：思维图DoT，用数学理论确保AI逻辑

姚期智院士领衔，推出大模型新推理框架，CoT“王冠”戴不住了。提出思维图（DiagramofThought），让大模型思考更像人类。团队更是为这种推理过程提供了数学基础，通过拓扑斯理论（Topos Theory）正式化（formalize）DoT，确保其逻...……更多

2024-09-24 13:36:00维图,院士,逻辑,模型,一致,理论

Llama3训练每3小时崩一次？豆包大模型、港大为脆皮万卡训

...提出了 ByteCheckpoint。这是一个 PyTorch 原生，兼容多个训练框架，支持 Checkpoint 的高效读写和自动重新切分的大模型 Checkpointing 系统，相比现有方法有显著性能提升和易用性优势。本文介绍了大模型训练提效中 Checkpoint 方向面临的...……更多

2024-08-09 09:37:00万卡,训练,豆包,脆皮,大为,模型

阿里推出AI数据科学家，全流程自动化，科研小白也能用

基于开源Agent框架，可自动解决复杂数据科学问题的Agent来了！具体来说，Data Science Assistant（以下称DS Assistant）是基于Modelscope-Agent框架开发的数据科学助手。有了它，我们只需给需求，这个助手就能自己跑完探索性数据分析（ED...……更多

2024-08-08 09:40:00小白,阿里,科学家,流程,自动化,科研

没排上SearchGPT？比Perplexity更好用的国产

...，需要大约 3 小时才能做完。这款「国货」就是多智能体框架 MindSearch（思・索），由来自中科大和上海人工智能实验室的研究团队联合研发。正如其名，MindSearch 是一个会「思索」的系统，面对你输入的问题，它将先调用负责...……更多

2024-08-02 09:41:00国产,节点,搜索,问题,智能,信息

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学习，利用模型自身输出构造更可靠的偏好数据，结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力，这些能力都通过SFT和预...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

苹果的封闭生态为大模型打开！发布开源多模态大模型、每天为 A

...，苹果的机器学习研究团队还悄悄发布了一个名为 MLX 的框架来构建基础模型。彭博社报道称，苹果正在开发 Siri 的改进版本，并计划在下一个重大 iOS 版本中提供以人工智能为中心的功能。另外，苹果还正在与一些大型新闻出...……更多

2023-12-26 14:06:00模型,生态,模态,零碎,苹果,模型

CMU清华教LLM练成数学高手，LeanSTaR训练模型边思

...学水平不及小学生怎么办？CMU清华团队提出了Lean-STaR训练框架，在语言模型进行推理的每一步中都植入CoT，提升了模型的定理证明能力，成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力，你会怎么做？既然模型可以通过海量...……更多

2024-08-10 09:47:00顶新,成数,清华,模型,训练,高手

苹果让大模型学会偷懒：更快吐出第一个token，准确度还保住

... 对比了标准 LLM 与 LazyLLM。LazyLLM图 4 展示了 LazyLLM 的整体框架。从完整上下文开始，LazyLLM 会逐渐对 token 进行剪枝，从而逐渐减少得到最终模型所使用的计算数量。请注意，LazyLLM 允许模型在不同的生成步骤选取不同的 token 子集...……更多

2024-08-05 09:35:00准确度,更快,模型,苹果,缓存,模型

比GPU性价比高百倍！Cerebras推出新AI推理服务，号

...署更加便捷和一致，LangChain为语言模型应用提供快速开发框架，Weights&Biases打造了供AI开发者训练和微调模型的MLOps平台……“LiveKit很高兴能与Cerebras合作，帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以...……更多

2024-08-29 09:49:00性价比高,推理,性价比,全球,服务,推理

陈天奇团队LLM结构化生成新引擎XGrammar：百倍加速、

...示：「我们正在开源 XGrammar 并将其集成到主要的开源 LLM 框架中。」XGrammar 概览如图 1 所示，Grammar 利用了字节级下推自动机（byte-level pushdown automaton）来解释上下文无关语法。这种字节级设计允许每个字符边缘包含一个或多个...……更多

2024-11-27 13:37:00结构化,开销,生成,团队,结构,引擎

以图灵机为师：通过微调训练让大语言模型懂执行计算过程

...南京大学的研究者提出了一种面向 LLM 的可组装算术执行框架（CAEF），使 LLM 能够通过模仿图灵机的方式来执行算术，从而理解计算逻辑。此外，CAEF 具有高度的可扩展性，允许组合已经学习到的运算符，以降低复杂运算符的学...……更多

2024-10-21 09:54:00灵机,模型,训练,过程,语言,运算符

70倍极致压缩！大模型的检查点再多也不怕

...降低训练中的存储开销。代码目前已经开源，在 Apache 2.0 框架下发布，issue 中已经有小伙伴成功复现了结果。文章地址：https://arxiv.org/abs/2406.11257 仓库地址：https://github.com/Gaffey/ExCP方法也很有创新性，文章中提到……更多

2024-08-06 09:27:00检查点,极致,模型,检查,检查点,权重