• 我的订阅
  • 头条热搜
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...back)以及基于评分的反馈(score-based feedback)。监督学习框架的统一性:UNA 通过最小化隐式奖励和显式奖励之间的差异,统一了对策略模型的优化。UNA 的理论基础UNA 的理论基础源于对 RLHF 目标函数的重新推导。研究人员证明,...……更多
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。 我们介绍了 OpenR,首...……更多
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva,即 Evolving Alignment via Asymmetric Self-Play,也就是「通过非对称自博弈实现的演进式对齐」。论文标题:Evolving Alignment via Asymmetric Self-Play 论文地址……更多
2023内容科技应用典型案例:农业银行大模型ChatABC
...模型:打造多模型融合开放新生态。AI平台采用开放式的框架,通过组件化方法快速纳入各类开源模型和商业模型。持续跟踪开源模型最新进展,逐步构建适应问答、文本向量化等不同场景的模型库。参考HELM等模型评价体系,初...……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...京大学一支团队迅速跟进,用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调,表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。 为进一步促进社区的多模态对齐研究,日前,该...……更多
2223 万、电力(大模型)大单
...标工作。标包2:基于大模型的电力设备诊断与综合预测框架研究咨询服务。现有设备诊断存在依靠人工经验、多源多模态数据利用不充分、诊断准确度无法保证等技术难题。为解决上述问题,构建具备持续学习能力的电力设备...……更多
打造“新城建”,青云科技助力城投集团落地大模型应用示范中心
...用效率,能够在满足服务需求的同时降低运营成本。开放框架支撑生态与应用创新青云提供开放的应用框架和模型服务,支持城投集团的应用开发和测试,加速创新应用,同时便于接入第三方应用与服务,为特定行业或客户提供...……更多
国云注智 聚力向新 第七届数字中国建设峰会·电信生态成果体验馆盛大开馆
...云智超智算加速平台“云骁”支持多款国产芯片以及上层框架,可以对万卡规模智算集群进行纳管。算力分发网络平台“息壤”建立统一的算力度量体系,整合算与网资源,服务东数西算工程,让算力像电、水等基础能源一样按...……更多
卓翼飞思智能算法云仿真平台助推全国集群挑战赛,引爆行业热潮!
...法在线训练平台提供强化学习、深度学习算法调试和训练框架,可视化设置和修改奖励函数,快速进行模型参数修改,多维度查看训练效果。·支持虚实结合平台支持实体节点和虚拟节点。实体节点具有较高的模型精度,虚拟节...……更多
装备数字工程概念与实践思考
...或系统之系统,隐含的技术手段包括美国国防部体系架构框架(Department of Defense Architecture Framework, DoDAF)六步法以及体系结构开发方法(Architecture Development Method, ADM)等……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...oTA」的时代,简单易用、标准透明、可复现的多模态评估框架变得越来越重要,而这并非易事。为解决以上问题,来自南洋理工大学 LMMs-Lab 的研究人员联合开源了 LMMs-Eval,这是一个专为多模态大型模型设计的评估框架,为多模...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...有的数据、数据混合方法、配方、代码、基础设施和评估框架!模型:https://huggingface.co/allenai 技术报告:https://allenai.org/papers/tulu-3-report.pdf 数据集:https://huggingface……更多
科学家提出大模型分子交互学习框架,已在400多万分子对中验证
...在团队开发的首个统一的多模态大语言模型分子交互学习框架——MolTC(Molecular inTeraction Modeling enhanced byChain-of-thought theory),为解决上述问题带来了新的曙光。目前,在多个数据集的 4000000 多个分子之中,MolT……更多
文心大模型4.0 Turbo来了!百度推出文心快码2.5,已覆盖内部80%程序员
...心大模型4.0 Turbo API开放同时,飞桨平台发布新一代飞桨框架3.0 Beta版本,具备大模型训推一体、动静统一自动并行、编译器自动优化以及大模型多硬件适配等特色。百度智能代码助手Baidu Comate升级至2.5版本,开发、业务迭代及企...……更多
谷歌 AI 推出 CardBench 评估框架
...要为学习型基数估计(cardinality estimation)满足系统评估框架需求。CardBench 基准是个综合评估框架,包含 20 个不同真实数据库中的数千次查询,大大超过了以往的任何基准。项目背景基数估计(cardinality estimation,简称 CE)是优...……更多
NeurIPS Spotlight|从分类到生成:无训练的可控扩散生成
...华大学等机构的研究团队联合提出了一种全新的统一算法框架,名为无训练指导(Training-Free Guidance, 简称 TFG)。这一框架无缝整合现有的无训练指导方法,凭借理论创新和大规模实验验证,成为扩散模型条件生成领域的重要里...……更多
集体发售,又一批增量资金来了
...投资团队就是采用以“大数据+AI算法”为基础的量化投资框架,力争在硬科技赛道捕捉超额收益。据券商中国记者了解,该模型采用统一框架下的机器学习体系:对全市场所有股票都采用统一的因子池和机器学习模型进行收益率...……更多
重磅!TeleAI 完成首个全国产化万卡万参大模型训练
...正式对外开源首个基于全国产化万卡集群和国产深度学习框架训练的千亿参数大模型——星辰语义大模型 TeleChat2-115B。这是由中国电信集团 CTO、首席科学家、中国电信人工智能研究院(TeleAI)院长李学龙教授带领团队完成的又...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...提出了 ByteCheckpoint。这是一个 PyTorch 原生,兼容多个训练框架,支持 Checkpoint 的高效读写和自动重新切分的大模型 Checkpointing 系统,相比现有方法有显著性能提升和易用性优势。本文介绍了大模型训练提效中 Checkpoint 方向面临的...……更多
智慧家庭重磅文件,征求意见稿来了!事关千亿市场、8大应用场景
...智慧家庭标准体系。基础共性标准奠定了智慧家庭的基本框架,关键技术标准提供了技术实现的底层支持,应用场景标准是对智慧家庭终端功能性能和服务流程的具体规范,三者相辅相成,共同推动智慧家庭产业的发展。工信部...……更多
昇思MindSpore 2.3全新发布
【TechWeb】3月22日消息,人工智能框架作为软件根技术,已成为加速人工智能大模型开发、推动产业智能化发展的核心力量。以“为智而昇,思创之源”为主题的昇思人工智能框架峰会2024今日在北京国家会议中心举办,旨在汇聚...……更多
OpenAI超级对齐团队遗作:两个大模型博弈一番,输出更好懂了
...为「Prover-Verifier Games(证明者 - 验证者博弈)」的博弈论框架。该框架由两个相互竞争的学习者组成:一个可信的验证者(Verifier)网络试图选择正确的答案,另一个更强大但不可信的证明者(Prover)网络试图说服验证者接受特...……更多
AI识别方言困难!专家探索用算法度量方言差距,提议构建统一框架
...击破,而是要研究方言的底层逻辑和特点,构建统一识别框架。同时大模型的预训练可以自我学习,探索借助大模型技术提高识别准确性。倪博溢提出一种设想,由于音标是固定的,能否利用国际音标序列标注各种方言,构建语...……更多
阿里云通义开源最强过程奖励PRM模型 7B尺寸比GPT-4o更能发现推理错误
...能力的评估中,72B及7B尺寸的Qwen2.5-Math-PRM均显示出显著的优势,7B版本的PRM模型不但超越同尺寸开源PRM模型,甚至超越了闭源GPT-4o-0806。这证明了过程奖励模型(PRM)能够显著提高推理的可靠性,为未来开发推理过程监督技术开...……更多
...消息,苹果今日推出了为AppleSilicon芯片优化的MLX深度学习框架,号称能够简化Mac、iPad、iPhone平台研究人员设计和部署模型的过程。IT之家获悉,目前苹果已经将项目发布在GitHub中,感兴趣的小伙伴们可以点此访问,具体框架特点...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
华特智慧:“智慧”引擎助力黄河流域生态保护和高质量发展
...护需求和水利信息化建设需求,提出智慧黄河建设的目标框架,为智慧黄河建设顶层设计提供思路和参考。云计算、大数据、物联网、人工智能、数字孪生……新一代信息技术正成为黄河保护治理过程中不可或缺的手段。华特智...……更多
华特智慧:“智慧”引擎助力黄河流域生态保护和高质量发展
...护需求和水利信息化建设需求,提出智慧黄河建设的目标框架,为智慧黄河建设顶层设计提供思路和参考。云计算、大数据、物联网、人工智能、数字孪生……新一代信息技术正成为黄河保护治理过程中不可或缺的手段。华特智...……更多
开发人员测试mlx框架训练ai能力
...日测试了苹果M1Pro、M2Ultra和M3Max三款AppleSilicon芯片升级MLX框架后训练AI能力,并对比了英伟达的RTX4090显卡。Wehrens使用OpenAI的语音识别模型Whisper进行测试,主要测量转录10分钟音频文件所需时间。测试结果显示M1Pro处理音频时间需..……更多
更多关于科技的资讯:
10月1日,从太钢获悉,今年以来,太钢不锈进料加工团队以“精准备案、高效协同”为核心,在进料铬铁镍铁资源利用方面取得突破性进展
2025-10-02 17:39:00
厦门网讯(厦门日报记者 林露虹)记者昨日从中国移动咪咕公司获悉,该公司打造的“鼓浪屿AI伴游”服务已正式上线。市民和游客只需打开“鼓浪屿元宇宙”微信小程序
2025-10-02 08:57:00
“中国脑机谷”落户新奥新智感知产业园 政企研协同构建脑机接口产业新生态
河北新闻网讯(张新)9月26日,脑机接口产业联盟首届“脑机接口50人论坛”暨天津脑机接口产业创新发展推进会举办。会上,由新奥集团旗下的天津新智感知科技有限公司
2025-10-01 08:40:00
国网三明供电公司:守护灯火庆华诞 主动运维显担当
国网三明供电公司检修人员及时更换损坏器件并调整传动系统并完成设备修复及全套试验。(纪长添 摄)东南网10月1日讯 9月28日
2025-10-01 09:19:00
9月26日,由华东政法大学与上海星瀚律师事务所联合主办的第三届“星瀚杯”走进企业的法律课公益大赛正式启动。腾讯云作为大赛的技术支持单位
2025-10-01 09:56:00
平望实小承办吴江区骨干教师(数学)讲学团活动
为进一步发挥吴江区骨干教师的示范和辐射作用,推进课堂教学改革,有效提升教师教学业务能力。2025年9月24日,由苏州市吴江区教师发展中心主办的2025年吴江区骨干教师(数学)讲学团活动在平望实验小学举行
2025-10-01 09:58:00
AI技术让抗战文物“活起来”,人民日报数字传播联合百度推抗战文物智能体
9月30日,由人民日报数字传播与中国国家博物馆、中国人民大学、百度文心大模型、百度百科联合出品的《80年,80件》智能体和3D文物词条正式上线
2025-10-01 10:00:00
新时达2025工博会圆满落幕 | STEP 2.0战略引领智能制造新篇章
2025年9月23日至27日,第二十五届中国国际工业博览会在国家会展中心(上海)盛大举行。新时达以"智拓无界 共创未来"为主题
2025-10-01 10:00:00
从课堂到产线,河北工大学子开展智慧物流与“地狼”系统自动化技术实训
河北新闻网讯(胡广涛)组装调试机器人、体验智慧仓储系统、探索自动化技术前沿……近日,河北工业大学人工智能与数据科学学院2022级自动化专业全体学生在廊坊分校
2025-10-01 11:12:00
中国青年报客户端讯(中青报·中青网记者 夏瑾)9月30日,由湖州师范学院音乐学院、湖州市音声数据挖掘与智能服务重点实验室主办的“1617系列明代魏氏乐虚拟乐器音源”全球发布会在浙江省杭州市举办
2025-10-01 14:11:00
“智慧武当”给游客带来数字文旅新体验
十堰广电讯(通讯员 汪伟 周琼 耿宇)“一部手机游武当”预约购票、AI导游、《入境武当》VR大空间、问道武当数字客厅……国庆假日
2025-10-01 18:35:00
津云文旅电商版块上线 首发“笑漾海河”优选线路 扫码阅读手机版
10月1日,天津鹏欣水游城14周年庆暨津云新媒体“笑漾海河”文旅电商线路首发仪式成功举办。近年来,随着“文旅+电商”模式的快速发展
2025-10-01 18:55:00
陕西数字贸易闪耀第四届数贸会 数字贸易合作成果丰硕
9月29日,为期5天的第四届全球数字贸易博览会(以下简称“数贸会”)在浙江杭州大会展中心圆满落下帷幕。此次盛会,陕西代表团表现亮眼
2025-10-01 18:58:00
高德扫街榜国庆提醒:全国十大吃货友好高铁站看这里
2025年国庆节与中秋节叠加,全国铁路预计发送旅客2.19亿人次。赶高铁如何吃饱吃好?今天,高德扫街榜发布“十大吃货友好高铁站”
2025-10-01 20:19:00
能效提升15%,山东港口日照港顺岸式全自动化码头再迎新突破
9月29日,在山东港口日照港全自动化集装箱码头,随着A23自动化轨道吊精准将集装箱吊起、转运,标志着日照港研发的新一代双悬臂轻量化轨道吊投产试运行
2025-10-01 23:08:00