框架,优势,统一,综合,模型,奖励头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...back）以及基于评分的反馈（score-based feedback）。监督学习框架的统一性：UNA 通过最小化隐式奖励和显式奖励之间的差异，统一了对策略模型的优化。UNA 的理论基础UNA 的理论基础源于对 RLHF 目标函数的重新推导。研究人员证明，...……更多

2024-10-10 09:56:00框架,优势,统一,综合,模型,奖励

首个o1复现开源RL框架OpenR来了，UCL、上交等高校联

...学（广州）、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」，一个开源代码库，帮助用户快速实现构建自己的复杂推断模型。整个项目由 UCL 汪军教授发起和指导，实验主要由上海交大团队完成。我们介绍了 OpenR，首...……更多

2024-10-15 09:56:00框架,团队,联合,模型,过程,步骤

LLM超越人类时该如何对齐？谷歌用新RLHF框架解决了这个问

...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva，即 Evolving Alignment via Asymmetric Self-Play，也就是「通过非对称自博弈实现的演进式对齐」。论文标题：Evolving Alignment via Asymmetric Self-Play 论文地址……更多

2024-11-06 09:44:00框架,人类,问题,提示,策略,模型

2023内容科技应用典型案例：农业银行大模型ChatABC

...模型：打造多模型融合开放新生态。AI平台采用开放式的框架，通过组件化方法快速纳入各类开源模型和商业模型。持续跟踪开源模型最新进展，逐步构建适应问答、文本向量化等不同场景的模型库。参考HELM等模型评价体系，初...……更多

2024-04-08 17:06:00农业银行,典型案例,模型,典型,案例,银行

全模态对齐框架align-anything来啦：实现跨模态指

...京大学一支团队迅速跟进，用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调，表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。为进一步促进社区的多模态对齐研究，日前，该...……更多

2024-10-18 09:47:00模态,指令,框架,模态,模型,数据

2223 万、电力（大模型）大单

...标工作。标包2：基于大模型的电力设备诊断与综合预测框架研究咨询服务。现有设备诊断存在依靠人工经验、多源多模态数据利用不充分、诊断准确度无法保证等技术难题。为解决上述问题，构建具备持续学习能力的电力设备...……更多

2025-01-04 00:41:00模型,电力,输配,输配电,框架,电力

国云注智聚力向新第七届数字中国建设峰会·电信生态成果体验

...云智超智算加速平台“云骁”支持多款国产芯片以及上层框架，可以对万卡规模智算集群进行纳管。算力分发网络平台“息壤”建立统一的算力度量体系，整合算与网资源，服务东数西算工程，让算力像电、水等基础能源一样按...……更多

2024-05-24 11:06:00聚力,峰会,中国,成果,生态,体验

卓翼飞思智能算法云仿真平台助推全国集群挑战赛，引爆行业热潮！

...法在线训练平台提供强化学习、深度学习算法调试和训练框架，可视化设置和修改奖励函数，快速进行模型参数修改，多维度查看训练效果。·支持虚实结合平台支持实体节点和虚拟节点。实体节点具有较高的模型精度，虚拟节...……更多

2023-11-28 11:02:00法云,挑战赛,助推,集群,热潮,仿真

装备数字工程概念与实践思考

...或系统之系统，隐含的技术手段包括美国国防部体系架构框架（Department of Defense Architecture Framework， DoDAF）六步法以及体系结构开发方法（Architecture Development Method， ADM）等……更多

2024-12-21 04:00:00实践,概念,数字,工程,模型,工程

多模态模型评测框架lmms-eval发布！全面覆盖，低成本，

...oTA」的时代，简单易用、标准透明、可复现的多模态评估框架变得越来越重要，而这并非易事。为解决以上问题，来自南洋理工大学 LMMs-Lab 的研究人员联合开源了 LMMs-Eval，这是一个专为多模态大型模型设计的评估框架，为多模...……更多

2024-08-22 09:50:00模态,框架,模型,评测,污染,成本

这才是真开源模型！公开后训练一切，性能超越Llama 3.1

...有的数据、数据混合方法、配方、代码、基础设施和评估框架！模型：https://huggingface.co/allenai 技术报告：https://allenai.org/papers/tulu-3-report.pdf 数据集：https://huggingface……更多

2024-11-26 09:44:00模型,性能,训练,模型,训练,数据

科学家提出大模型分子交互学习框架，已在400多万分子对中验证

...在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC（Molecular inTeraction Modeling enhanced byChain-of-thought theory），为解决上述问题带来了新的曙光。目前，在多个数据集的 4000000 多个分子之中，MolT……更多

2024-03-07 10:44:00分子,科学家,框架,模型,验证,科学

文心大模型4.0 Turbo来了！百度推出文心快码2.5，已

...心大模型4.0 Turbo API开放同时，飞桨平台发布新一代飞桨框架3.0 Beta版本，具备大模型训推一体、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本，开发、业务迭代及企...……更多

2024-07-01 09:21:00文心,快码,程序员,模型,程序,文心

谷歌 AI 推出 CardBench 评估框架

...要为学习型基数估计（cardinality estimation）满足系统评估框架需求。CardBench 基准是个综合评估框架，包含 20 个不同真实数据库中的数千次查询，大大超过了以往的任何基准。项目背景基数估计（cardinality estimation，简称 CE）是优...……更多

2024-09-04 09:48:00框架,评估,数据,模型,基准,查询

NeurIPS Spotlight｜从分类到生成：无训练的可

...华大学等机构的研究团队联合提出了一种全新的统一算法框架，名为无训练指导（Training-Free Guidance, 简称 TFG）。这一框架无缝整合现有的无训练指导方法，凭借理论创新和大规模实验验证，成为扩散模型条件生成领域的重要里...……更多

2024-12-06 09:52:00生成,训练,分类,生成,样本,指导

重磅！TeleAI 完成首个全国产化万卡万参大模型训练

...正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院（TeleAI）院长李学龙教授带领团队完成的又...……更多

2024-09-30 09:50:00万卡,重磅,模型,国产,训练,模型

Llama3训练每3小时崩一次？豆包大模型、港大为脆皮万卡训

...提出了 ByteCheckpoint。这是一个 PyTorch 原生，兼容多个训练框架，支持 Checkpoint 的高效读写和自动重新切分的大模型 Checkpointing 系统，相比现有方法有显著性能提升和易用性优势。本文介绍了大模型训练提效中 Checkpoint 方向面临的...……更多

2024-08-09 09:37:00万卡,训练,豆包,脆皮,大为,模型

文心一言发布百度市值蒸发200亿，外界称缺乏亮点，应用前景难

...核心逻辑和ChatGPT类似百度在人工智能时代形成了“芯片-框架-模型-应用”四层技术栈，并在这四层均有自研技术布局，基于拥有2600亿参数规模的文心大模型打造的文心一言就属于模型层。据百度CEO王海峰介绍，文心一言主要脱...……更多

2023-03-17 10:00:00文心,市值,蒸发,外界,前景,亮点

智慧家庭重磅文件，征求意见稿来了！事关千亿市场、8大应用场景

...智慧家庭标准体系。基础共性标准奠定了智慧家庭的基本框架，关键技术标准提供了技术实现的底层支持，应用场景标准是对智慧家庭终端功能性能和服务流程的具体规范，三者相辅相成，共同推动智慧家庭产业的发展。工信部...……更多

2024-11-23 09:40:00重磅,场景,智慧,意见,文件,家庭

昇思MindSpore 2.3全新发布

【TechWeb】3月22日消息，人工智能框架作为软件根技术，已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇，思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办，旨在汇聚...……更多

2024-03-24 17:47:00全新,模型,开发,中国,人工智能,框架

OpenAI超级对齐团队遗作：两个大模型博弈一番，输出更好懂

...为「Prover-Verifier Games（证明者 - 验证者博弈）」的博弈论框架。该框架由两个相互竞争的学习者组成：一个可信的验证者（Verifier）网络试图选择正确的答案，另一个更强大但不可信的证明者（Prover）网络试图说服验证者接受特...……更多

2024-07-19 09:45:00遗作,输出,模型,团队,两个,模型

AI识别方言困难！专家探索用算法度量方言差距，提议构建统一框

...击破，而是要研究方言的底层逻辑和特点，构建统一识别框架。同时大模型的预训练可以自我学习，探索借助大模型技术提高识别准确性。倪博溢提出一种设想，由于音标是固定的，能否利用国际音标序列标注各种方言，构建语...……更多

2023-10-26 18:05:00方言,算法,框架,差距,困难,统一

阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o

...能力的评估中，72B及7B尺寸的Qwen2.5-Math-PRM均显示出显著的优势，7B版本的PRM模型不但超越同尺寸开源PRM模型，甚至超越了闭源GPT-4o-0806。这证明了过程奖励模型（PRM）能够显著提高推理的可靠性，为未来开发推理过程监督技术开...……更多

2025-01-16 14:56:00通义,阿里,推理,模型,尺寸,奖励

苹果推出 MLX 深度学习框架：专为 Silicon 优化

...消息，苹果今日推出了为AppleSilicon芯片优化的MLX深度学习框架，号称能够简化Mac、iPad、iPhone平台研究人员设计和部署模型的过程。IT之家获悉，目前苹果已经将项目发布在GitHub中，感兴趣的小伙伴们可以点此访问，具体框架特点...……更多

2023-12-06 21:18:00专为,框架,深度,苹果,学习,研究人员

零成本突破多模态大模型瓶颈！多所美国顶尖高校华人团队，联合推

...数据，存在成本和质量问题。Calibrated Self-Rewarding（CSR）框架通过自我增强学习，利用模型自身输出构造更可靠的偏好数据，结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力，这些能力都通过SFT和预...……更多

2024-06-21 09:21:00模态,美国,瓶颈,顶尖,模型,团队

突破时间序列组合推理难题！南加大发布一站式多步推理框架TS-

【新智元导读】TS-Reasoner是一个创新的多步推理框架，结合了大型语言模型的上下文学习和推理能力，通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估，有效提高了复杂时间序列任务的推理能力和准确性...……更多

2024-10-29 09:55:00推理,时间序列,序列,框架,难题,突破

华特智慧：“智慧”引擎助力黄河流域生态保护和高质量发展

...护需求和水利信息化建设需求，提出智慧黄河建设的目标框架，为智慧黄河建设顶层设计提供思路和参考。云计算、大数据、物联网、人工智能、数字孪生……新一代信息技术正成为黄河保护治理过程中不可或缺的手段。华特智...……更多

2022-12-17 01:00黄河流域,智慧,黄河,生态保护,流域,高质量

LLM破局泛化诊断难题，MSSP刊登北航PHM实验室健康管理

... PHM 团队最新研究成果：基于大语言模型的轴承故障诊断框架（LLM-based Framework for Bearing Fault Diagnosis）。这是北航 PHM 实验室在健康管理大模型领域的成功尝试，研究团队提出了基于大语言模型的轴承故障诊断框架，提升预训练大...……更多

2024-11-29 09:27:00北航,健康管理,难题,实验室,模型,实验

开发人员测试mlx框架训练ai能力

...日测试了苹果M1Pro、M2Ultra和M3Max三款AppleSilicon芯片升级MLX框架后训练AI能力，并对比了英伟达的RTX4090显卡。Wehrens使用OpenAI的语音识别模型Whisper进行测试，主要测量转录10分钟音频文件所需时间。测试结果显示M1Pro处理音频时间需..……更多

2023-12-15 04:37:00框架,训练,能力,人员,测试,开发