• 我的订阅
  • 头条热搜
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...学(广州)、西湖大学联合开源了首个类 o1 全链条训练框架「OpenR」,一个开源代码库,帮助用户快速实现构建自己的复杂推断模型 。整个项目由 UCL 汪军教授发起和指导,实验主要由上海交大团队完成。 我们介绍了 OpenR,首...……更多
扩散模型也能搞定社交信息推荐,港大数据智能实验室提出RecDiff
...了新项目RecDiff。RecDiff是一种全新的基于扩散模型的推荐框架,能够更好地捕捉用户的潜在偏好和兴趣,从而生成个性化、贴合用户需求的推荐内容。具体而言,该框架采用隐空间扩散机制,有效清除用户表示中的噪声,无论是...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...提示设计的标准化方法。 借助 CoT,人们现在拥有了一个框架来创建更有效的提示,从而可以完成复杂的推理任务。而这种增强解数学题的能力,能帮助用户更好地解数学题。此外,CoT 还可以通过搜索引擎理解和处理多步骤查...……更多
多模态模型免微调接入互联网,即插即用新框架,效果超闭源方案
...大学、浙江大学、香港大学联合提出即插即用的SearchLVLMs框架,可以无缝整合任意的多模态大模型。该框架在推理阶段对大模型进行互联网检索增强,使得大模型无需微调即可对实时信息进行准确的反馈。研究团队提出首个辅助...……更多
不靠更复杂的策略,仅凭和大模型训练对齐,零样本零经验单LLM调用
...究团队也想发问:构建通用智能体时,在铺设复杂的系统框架前,是否已经优化了行动 / 观测空间,让这些功能模块达到了最优状态?论文链接:https://arxiv.org/abs/2410.13825 论文名:AgentOccam: A Simple Yet Strong Baseline for……更多
谷歌大模型推理范式,主要分为两个阶段
...waroopMishra是谷歌DeepMind的研究科学家,它参与的Self-Instruct框架在GitHub上星标3.5k、被引用次数超过600,并被ACL2023接收。此外QuocLe、DennyZhou等大模型提示微调、推理方向的老面孔也参与其中。虽然官方暂未开源,但已经有迫不及待..……更多
LLM超越人类时该如何对齐?谷歌用新RLHF框架解决了这个问题
...芝加哥大学一个研究团队开发了一种可扩展的开放式 RLHF 框架 eva,即 Evolving Alignment via Asymmetric Self-Play,也就是「通过非对称自博弈实现的演进式对齐」。论文标题:Evolving Alignment via Asymmetric Self-Play 论文地址……更多
全模态对齐框架align-anything来啦:实现跨模态指令跟随
...京大学一支团队迅速跟进,用自研的全球首个全模态对齐框架「Align Anything」对 Llama 3.2 进行了微调,表现出了比 Meta 微调的 Llama-3.2-11B-Vision-Instruct 更强的对齐性与指令跟随性。 为进一步促进社区的多模态对齐研究,日前,该...……更多
麻省理工的科学家可以让最流行的人工智能图像生成器提速30倍
科学家们已经建立了一个框架,通过将它们浓缩到更小的模型中,在不影响质量的情况下,给像Dall·E3和Stable Diffusion这样的生成式人工智能系统带来了巨大的提振。一项新的研究表明,由于一项技术可以将整个100个阶段的过程...……更多
多模态模型评测框架lmms-eval发布!全面覆盖,低成本,零污染
...oTA」的时代,简单易用、标准透明、可复现的多模态评估框架变得越来越重要,而这并非易事。为解决以上问题,来自南洋理工大学 LMMs-Lab 的研究人员联合开源了 LMMs-Eval,这是一个专为多模态大型模型设计的评估框架,为多模...……更多
...是一个技术过程,更是一个社会和心理过程。3.麦肯锡7S框架麦肯锡7S框架是由麦肯锡公司的两位顾问罗伯特·沃特曼和汤姆·彼得斯于20世纪80年代初提出的一个组织管理模型。最初出现在汤姆·彼得斯和罗伯特·沃特曼合著的书籍...……更多
补齐Transformer规划短板又不放弃快速思考,Dualformer双重优势
...决这些挑战,他们提出了一个利用随机化推理轨迹的训练框架。该方法的灵感来自两个研究方向: 该团队注意到,即便 Searchformer 是在完整的 A* 搜索轨迹上训练的,但它也会生成更短的勾勒搜索过程的轨迹。 研究表明,人类在...……更多
姚期智院士大模型新研究:思维图DoT,用数学理论确保AI逻辑一致
姚期智院士领衔,推出大模型新推理框架,CoT“王冠”戴不住了。提出思维图(DiagramofThought),让大模型思考更像人类。团队更是为这种推理过程提供了数学基础,通过拓扑斯理论(Topos Theory)正式化(formalize)DoT,确保其逻...……更多
Llama3训练每3小时崩一次?豆包大模型、港大为脆皮万卡训练提效
...提出了 ByteCheckpoint。这是一个 PyTorch 原生,兼容多个训练框架,支持 Checkpoint 的高效读写和自动重新切分的大模型 Checkpointing 系统,相比现有方法有显著性能提升和易用性优势。本文介绍了大模型训练提效中 Checkpoint 方向面临的...……更多
阿里推出AI数据科学家,全流程自动化,科研小白也能用
基于开源Agent框架,可自动解决复杂数据科学问题的Agent来了!具体来说,Data Science Assistant(以下称DS Assistant)是基于Modelscope-Agent框架开发的数据科学助手。有了它,我们只需给需求,这个助手就能自己跑完探索性数据分析(ED...……更多
没排上SearchGPT?比Perplexity更好用的国产开源平替了解一下?
...,需要大约 3 小时才能做完。这款「国货」就是多智能体框架 MindSearch(思・索),由来自中科大和上海人工智能实验室的研究团队联合研发。正如其名,MindSearch 是一个会「思索」的系统,面对你输入的问题,它将先调用负责...……更多
零成本突破多模态大模型瓶颈!多所美国顶尖高校华人团队,联合推出自增强技术CSR
...数据,存在成本和质量问题。Calibrated Self-Rewarding(CSR)框架通过自我增强学习,利用模型自身输出构造更可靠的偏好数据,结合视觉约束提高学习效率和准确性。多模态大模型展现出了多种多样的能力,这些能力都通过SFT和预...……更多
突破时间序列组合推理难题!南加大发布一站式多步推理框架TS-Reasoner
【新智元导读】TS-Reasoner是一个创新的多步推理框架,结合了大型语言模型的上下文学习和推理能力,通过程序化多步推理、模块化设计、自定义模块生成和多领域数据集评估,有效提高了复杂时间序列任务的推理能力和准确性...……更多
苹果的封闭生态为大模型打开!发布开源多模态大模型、每天为 AI 烧百万美元,零碎的 Android 生态打得过吗?
...,苹果的机器学习研究团队还悄悄发布了一个名为 MLX 的框架来构建基础模型。彭博社报道称,苹果正在开发 Siri 的改进版本,并计划在下一个重大 iOS 版本中提供以人工智能为中心的功能。另外,苹果还正在与一些大型新闻出...……更多
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
...学水平不及小学生怎么办?CMU清华团队提出了Lean-STaR训练框架,在语言模型进行推理的每一步中都植入CoT,提升了模型的定理证明能力,成为miniF2F上的新SOTA。如果想训练LLM证明定理的能力,你会怎么做?既然模型可以通过海量...……更多
苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了
... 对比了标准 LLM 与 LazyLLM。LazyLLM图 4 展示了 LazyLLM 的整体框架。从完整上下文开始,LazyLLM 会逐渐对 token 进行剪枝,从而逐渐减少得到最终模型所使用的计算数量。请注意,LazyLLM 允许模型在不同的生成步骤选取不同的 token 子集...……更多
比GPU性价比高百倍!Cerebras推出新AI推理服务,号称“全球最快”
...署更加便捷和一致,LangChain为语言模型应用提供快速开发框架,Weights&Biases打造了供AI开发者训练和微调模型的MLOps平台……“LiveKit很高兴能与Cerebras合作,帮助开发者构建下一代多模态AI应用。结合Cerebras的计算能力和模型以...……更多
以图灵机为师:通过微调训练让大语言模型懂执行计算过程
...南京大学的研究者提出了一种面向 LLM 的可组装算术执行框架 (CAEF),使 LLM 能够通过模仿图灵机的方式来执行算术,从而理解计算逻辑。此外,CAEF 具有高度的可扩展性,允许组合已经学习到的运算符,以降低复杂运算符的学...……更多
70倍极致压缩!大模型的检查点再多也不怕
...降低训练中的存储开销。代码目前已经开源,在 Apache 2.0 框架下发布,issue 中已经有小伙伴成功复现了结果。文章地址:https://arxiv.org/abs/2406.11257 仓库地址:https://github.com/Gaffey/ExCP方法也很有创新性,文章中提到……更多
苹果开源7B模型,训练过程数据集一口气全给了,网友:很不像苹果
...、StarCoder和ProofPile2 MMLU得分接近Llama 3 8B 使用PyTorch和OpenLM框架进行训练具体而言,研究团队先是提出了一个语言模型数据比较新基准——DCLM。之所以提出这一基准,是因为团队发现:由机器学习 (ML) 模型从较大的数据集中自动...……更多
AI药物化学家登Nature子刊:重现职业化学家专业知识,有望加速药物研发
...的模型不仅限于当前研究的应用范围。具体来说,讨论的框架可以扩展到药物发现领域的其他可量化但却昂贵的可观测值。此外,它可以为化学空间中尚未被探索的领域提供见解。 鉴于这一点,研究团队相信一些流行的基于规...……更多
...数学问题提出了“新见解”,并通过系统的、迭代的评估框架确保其正确。这一研究或可改进LLM用来解决问题和学习新知识的途径。相关论文发表在14日的《自然》杂志上。基于人工智能的工具(例如LLM)有时受制于“幻觉”,...……更多
Claude自动玩崩铁清日常,NUS新论文完整测评AI电脑操控
...了更多测试场景外,论文还提出了一个开箱即用的自动GUI框架。 有网友看到视频后评论说:以后我去上学的时候,就可以让Claude帮我玩每日任务了。还可以自动完成很多办公任务Claude Computer Use的潜能还远远没有被人类发掘——...……更多
字节版Sora火爆24小时,同名论文再次被热议
...值也是拉满了,嗷嗷待哺内测资格!与此同时,字节研究团队一篇PixelDance同名论文,也被扒了出来,再次引发热议。‍‍‍背后论文揭示「PixelDance」原型‍‍字节团队此前入选CVPR 2024的论文,就提出了名为一种PixelDance的模型。...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...种称作SURE(Saliency-Based Unlearning with a Large Learning Rate)的框架作为改进方案。该框架通过构建模块级显著性图来指导遗忘过程,选择性地对与遗忘数据最相关的组件使用较大的学习率,同时最小化对其它功能的影响。通过实验,...……更多
更多关于科技的资讯:
赴港上市?前程无忧回应:有官方消息会直接公告
文|罗曾在回归中国市场并完成私有化后,前程无忧似乎再次踏上资本市场的舞台。1月20日,有消息称中国领先的人力资源服务企业前程无忧计划最快于今年上半年在香港上市
2025-01-21 13:51:00
随着数字技术的迅猛发展,新的理念、业态和模式正渗透至社会各个领域,职业教育同样需要迎接数字化转型带来的的重大机遇,牢牢抓住这一数字化发展的契机
2025-01-21 10:51:00
2025年01月21日环洋市场咨询机构出版了一份详细的、综合性的调研分析报告【全球深层组织激光治疗设备行业总体规模、主要厂商及IPO上市调研报告
2025-01-21 11:01:00
安徽高速创新“无人机 + 路网管理”模式,助力春运高效通行
本文转自:人民网-安徽频道今年春运前,安徽高速巡查有了一只“低空之眼”——安徽高速低空无人机巡查服务平台正式启用。该平台由安徽省交通运输综合执法监督局统筹协调组织
2025-01-21 11:12:00
本文转自:人民网-安徽频道春节临近,年味渐浓。在春节“返乡潮”和消费政策的叠加下,合肥蜀山区家电市场持续升温,市民消费势头高涨
2025-01-21 11:12:00
本文转自:人民网-北京频道人民网北京1月21日电 (记者董兆瑞)“海淀很潮”机器人乐队出道、机器人球员驰骋球场、人形机器人现场卖“年货”……1月30日至2月3日(大年初二至初六)
2025-01-21 11:15:00
《诛仙世界》首月流水4亿,完美世界2025年能否逆风翻盘?
国产MMO端游《诛仙世界》上线满30天,达成4亿元流水。作为近五年内市面上较为稀缺的纯端游,可谓开局良好。这本应是其背后研发商完美世界收获满满的一刻
2025-01-21 11:34:00
京东汽车正式发布《汽车漆面膜施工规范》团体标准 让高品质贴膜有据可依
1月17日,“新膜式聚力 新生态出发”汽车漆面膜施工规范团体标准发布仪式暨京东汽车贴膜年度颁奖盛典在京举行。京东汽车联合中国汽车维修行业协会
2025-01-21 11:40:00
全新洗衣免搓粉上市,碧浪携手临沂大润发引领洁净新革命
鲁网1月21日讯春节临近,宝洁旗下织物护理品牌碧浪携手临沂大润发举办新品发布活动,联合发布全新革命性新品——洗衣免搓粉
2025-01-21 11:44:00
泰坦斯科技:数智赋能汽车制造业,打造高效智能生产新范式
树立行业标杆,讲好中国故事,传递中国声音,为了充分展现腾飞的中国经济、崛起的民族品牌和向上的企业家精神,近日,“崛起的民族品牌”专题系列节目对话长春泰坦斯科技有限公司的总经理南宫恩先生
2025-01-21 11:45:00
1月13日,山东省工业和信息化厅公布了首批优秀工业领域大模型(MaaS)服务平台名单,山东联通申报的精细化工“产业大脑”服务平台成功入选行业类(综合型)服务平台
2025-01-21 11:58:00
“韩国游客涌入上海”背后,京东快递寄韩国单量增长30%
近日,“周五下班去中国”成为韩国消费者风潮。据中新社报道,近来,上海“含韩量”仍在猛增,其中尤以上海黄浦区“韩潮”浓度最高
2025-01-21 12:03:00
从0到100+:帆麦全自助KTV的扩张奇迹
引言:100家门店背后的行业变革在娱乐行业的版图中,KTV一直占据着独特的社交娱乐地位。然而近年来,随着消费者娱乐需求的多元化和市场竞争的加剧
2025-01-21 12:11:00
“牛牛免费短剧APP”下载量突破3亿,极致短剧新标志
在当今数字化娱乐时代,短剧凭借其短小精悍、情节紧凑、内容丰富等特点,迅速成为大众喜爱的娱乐方式之一。天津智同道合网络科技有限公司旗下牛牛免费短剧APP
2025-01-21 12:16:00
“看得见”的安全成焦点,小罐茶十二周年再启新程
在国家消费刺激政策频频出台的当下,消费者对商品信息“透明度”的关注从未如此高涨。近期,奶茶行业频频爆发的成分问题,再次引发消费者对食品安全的关注
2025-01-21 12:18:00