• 我的订阅
  • 头条热搜
首个o1复现开源RL框架OpenR来了,UCL、上交等高校联合团队发布
...理教授(研究)杨林易。o1 作为 OpenAI 在推理领域的最新模型,大幅度提升了 GPT-4o 在推理任务上的表现,甚至超过了平均人类水平。o1 背后的技术到底是什么?OpenAI 技术报告中所强调的强化学习和推断阶段的 Scaling Law 如何实现...……更多
智能体首达Kaggle Grandmaster,华为结构化推理补齐思维链短板
...数据科学的目的是从结构化和非结构化数据中提取见解和知识,从而解决各种复杂问题。这需要系统级的方法,需要自动化和优化来适应具体的任务目标。举个例子,在 Kaggle 数据科学竞赛中(如图 1 所示),数据科学家需要遵...……更多
科大讯飞申请推理方法相关装置及推理系统专利,具有较高的推理速度
金融界2025年5月6日消息,国家知识产权局信息显示,科大讯飞股份有限公司申请一项名为“一种推理方法、相关装置及推理系统”的专利,公开号CN119918679A,申请日期为2025年4月。专利摘要显示,本申请公开了一种推理方法、相...……更多
“深思熟虑”的 AI:OpenAI 提出全新安全对齐方法
...熟虑的对齐”(Deliberative Alignment)的新方法,以提升 AI 模型安全性,并已在 o 系列模型中取得显著成效。项目背景如何确保大语言模型(LLMs)遵守明确的道德和安全准则,目前存在诸多挑战。监督微调(SFT)和来自人类反馈的...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...套严格的评分标准(就像是奖励模型),目的是测试你的知识深度和理解能力。这套标准非常全面,涵盖了大量的知识点和难题,理论上应该能够准确衡量你的学习水平。 然而,你发现了一些 “捷径”:考试中虽然有很多问题...……更多
这才是真开源模型!公开后训练一切,性能超越Llama 3.1 Instruct
...新基准以及其它已有基准上的表现,具体涉及的领域包括知识调用、推理、数学、编程和指令遵从。需要注意,这些都是 Unseen 基准,即这些任务是模型训练过程中未见过的。安全性方面,以下两表展示了 Tülu 3 与对比模型在两...……更多
ChatGPT 火爆,程序员会不会被取代?答案都在这里!
...人工智能是以服务人类为目的的。它由神经网络大模型+知识图谱+强化学习构成,在 ChatGPT 浪潮中已经打好基座,未来将引起从效率革命到思维革命,从改造自然到改造自身的深远影响。智源人工智能研究院总工程师林咏华:GPT3...……更多
3天把Llama训成Mamba,性能不降,推理更快!
...(8B)。不过世界上有那么多成功的Transformer大模型,而知识就包含在这些模型参数里。如果能够锁住知识,同时把Transformer微调成Mamba,不就解决问题了?在本文中,研究人员结合渐进式蒸馏、监督微调(SFT)和定向偏好优化(D...……更多
港中文团队提出大模型元推理范式,革新大模型的评价体系
...院工作过一段时间。在 ChatGPT 面世以后,他意识到针对大模型的研究范式存在一定的不足,于是决定来到香港中文大学读博。图 | 曾忠燊(来源:曾忠燊)前不久,曾忠燊和所在团队提出一个全新评测范式。基于这一评测范式,...……更多
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...方法比学生模型的零样本性能平均提高了 13.53%,比 SOTA 知识提炼基线提高了 6.84%。此外,这一方法还展示了样本效率——仅使用训练数据中 10% 的正确前向推理,它就超越了使用 10 倍前向推理训练的标准微调方法。RevThink 还表...……更多
OpenAI o1太贵?那就自己做一个!纯提示方法让普通LLM进化出复杂推理能力
...僚机构担任管理人员的候选人,常识试卷测试不同领域的知识。这些问题非常严格,测试深入的概念理解、解决问题的能力以及跨多个领域(如物理、数学、化学、社会科学等)的概念应用。作者使用脚本来进行这项评估:脚本...……更多
大模型新趋势之MoE:现状、挑战及研究方向
...有架构集成难,部分关键技术仍有待攻关。一是MoE仍存在知识混合、知识冗余等原始架构缺陷,容易导致专家同质化严重、专业化能力不足等问题。同时,根植于MoE的超参数调整、专家模型设计及协作、动态性适应数据变化、对...……更多
百度文心一言发布会详细纪要
...这些问题都答对相当不容易,因为百度的文心一言采用了知识增强和检索增强。我们有5500亿的事实知识在训练数据里,所以可以保证事实性的问题回答比较准确。第二个例子,是商业文案的创作。问“如果要成立一个用大模型...……更多
什么是AGI?人工智能的未来
...程序 – 其能够具备人类的普遍智慧,即能够学习各领域知识,并能将知识输出在各个领域。当时,约翰·麦卡锡预计人工智能将在几个月内实现。约翰·麦卡锡在实践过程中,遇到了极大的技术阻碍,因此多年来,【人工智能】...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
...文本处理能力被广为诟病,难以充分理解长文本和复杂的知识表达。随着大语言模型的发展,新的可能性逐渐显现:LLM 可以引入更丰富的开放时间知识、更强的文本理解力,极大提升 CLIP 的多模态表示学习能力。在此背景下,...……更多
...升级迭代,通过引入深度思考技术实现法律人工智能从“知识问答工具”向“人机协同伙伴”的跨越,标志着法律智能服务正式迈入深度推理时代。“法衡-R1”主要服务于法律从业者、企业法务、法律研究人员以及普通用户,提...……更多
...定基础。 (三)特征工程与算法选择特征工程是利用领域知识和数据分析技术,从原始数据中提取、构建能够刻画需求规律、影响因素的关键特征指标,为算法建模提供输入。常见的特征工程方法包括特征选择、特征提取、特征...……更多
北大推出全新机器人多模态大模型!面向通用和机器人场景的高效推理和操作
...为刘家铭博士,研究方向为面向开放世界的多模态具身大模型与持续性学习技术。本工作第二作者为刘梦真,研究方向为视觉基础模型与机器人操纵。指导老师为仉尚航,北京大学计算机学院研究员、博士生导师、博雅青年学者...……更多
让大模型能听会说,国内机构开源首个端到端语音对话模型Mini-Omni
...非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。随着多类型大模型的飞速发展,全球 AI 已经进入到了多模交互时代。2024 年 5 月,OpenAI 推出了全新的多模...……更多
OpenAI o1强推理能提升安全性?长对话诱导干翻o1
...有暴露用户的有害意图,用户最终还是获得了制作炸弹的知识。 当详细查看 OpenAI o1 的「想法」时,研究人员惊奇地发现,o1 在开始的推理中确实识别到了用户的有害意图,并且声称要遵守安全政策。但是在随后的推理中,o1 ...……更多
构建数字经济新引擎:枫清科技 高雪峰解读AI技术的未来趋势
...CEO高雪峰受邀出席,并发表了题为《AI+行业落地新范式:知识引擎与大模型双轮驱动企业智能化升级》的分享,阐述了他对以大模型技术为代表的人工智能技术赋能产业转型升级的深刻见解。高雪峰认为,“如果仅停留在对话、...……更多
LeCun最新万字演讲:纯语言模型到不了人类水平,我们基本已放弃
...频或在现实世界中进行体验来训练它,以学习常识和物理知识。放弃机器学习的四大支柱所以再来说说这个目标驱动架构是什么,它与语言模型或前馈神经网络等有着显著不同。因为在推理过程中不仅仅是神经网络在起作用,实...……更多
科研也完了,AI暴虐170位人类专家!Nature子刊:大模型精准预测研究结果,准确率高达81%
【新智元导读】知识密集型工作也败了!大型语言模型在预测神经科学结果方面超越了人类专家,平均准确率达到81%,而人类专家仅为63%;模型通过整合大量文献数据,展现出了惊人的前瞻性预测能力,预示着未来科研工作中...……更多
空间智能版ImageNet来了!李飞飞吴佳俊团队出品
...视频理解面临诸多挑战,譬如要设计任务、避免通过先验知识或简短片断回答等。因此,团队提出HourVideo。这是一个为长视频理解而设计的基准数据集。为了设计出需要长期理解的任务,团队首先提出了一个新的任务对应套件,...……更多
腾讯发布最大开源MoE模型,3890亿参数免费可商用
...个共享专家和1个专门专家,共享专家处理所有token的通用知识,而特殊专家则用top-k路由策略动态激活,负责处理任务相关的特殊能力。 回收路由策略:传统MoE常因专家超载而丢弃过多tokens。Hunyuan-Large设计了专家回收机制,保...……更多
硬件在人工智能基础教育中的角色: 机遇和挑战
...趣,培养和发展了学生的问题解决能力和机电一体化相关知识。 二、Arduino以及类似开发板被认为是一个用户友好且易于获取的教育资源,可以与模拟器结合使用,激发学生的动机,促进跨学科和多学科的学习。 三、编程与STEA...……更多
大模型步入推理Scaling时代,SambaNova如何挑战英伟达的霸主地位
...越人类专家。在性能跃升之外,更重要的是,它揭示了大模型进化范式的转变:通过更多的强化学习(训练时计算)和更多的推理(Test-Time 计算),模型可以获得更强大的性能。这又一次让我们想起 Richard Sutton 在《The Bitter Lesso...……更多
量化能让大模型“恢复记忆”,删掉的隐私版权内容全回来了
...术失灵!也就是大模型在人类要求下“假装”忘记了特定知识(版权、私人内容等),但有手段能让它重新“回忆”起来。最近,来自宾夕法尼亚州立大学、哈佛大学、亚马逊团队的一项新研究在reddit、Hacker News上引起热议。他...……更多
大江东|在首届浦江AI学术年会,感受人工智能加速跑
...从大数据中发现数据之间的因果关系,这样就能形成新的知识。”“我们正在把大模型和因果推理方法联系起来,让大模型去寻找纷繁复杂世界中的因果关系,从而开启新的‘知识爆炸’时代。”陆超超说。 “知识爆炸”来临...……更多
全球最强开源大模型Llama 3发布:使用15T数据预训练,最大模型参数将超4000亿
...情况下都能表现出色,包括琐事问题、STEM、编码、历史知识等。 3)扩大预训练规模为了在 Llama 3 模型中有效利用预训练数据,Meta 为下游基准评估制定了一系列详细的 scaling laws,这些 scaling laws 使他们能够选择最佳的数据组合...……更多
更多关于科技的资讯:
厦门抢占具身智能产业新赛道
第十四届中国创新创业大赛——首届具身智能专业赛成果在厦发布。厦门网讯(文/厦门日报记者 吴晓菁 通讯员 高菲 康潇潇 图/厦门日报记者 卢剑豪)昨日的厦门国际会议中心酒店
2025-09-26 08:38:00
具身智能孵化加速器在厦正式揭牌第十四届中国创新创业大赛首届具身智能专业赛昨日发布成果东南网9月26日讯(海峡导报记者 黄奕琳)昨日
2025-09-26 10:17:00
全国26家实验室参与!由雷沃支持的这场“田间论剑”举行
日前,2025年农业机械检测实验室间比对活动在山东潍坊举行。该活动由中国农业机械化协会主办、农机鉴定检测分会承办、潍柴雷沃智慧农业协助开展
2025-09-26 07:05:00
人们依托脑力开展思维活动,而人工智能则依赖算力进行“思考”。“十四五”期间,中国在算力建设上的投入力度相当大,发展成效显著
2025-09-26 07:31:00
王灿:以笔为犁 深耕“城事”
王灿。 臧翔宇 摄□胡欣玥芮天舒祁绩外出采访结束后,王灿轻轻推开南京报业传媒集团融媒中心时政新闻部的门。工位上屏幕亮起
2025-09-26 07:41:00
560余家企业携4.8万余个岗位来东大揽才“AI+”岗位热度不减,实战经验是核心指标□南京日报/紫金山新闻记者何洁 实习生黄佳琪杨久久9月25日
2025-09-26 07:41:00
厦门网讯(厦门日报记者 沈彦彦 应洁)明日,厦门岛外首家永辉“胖东来模式”调改店将在杏林万科里正式开业。作为厦门第二家
2025-09-25 08:53:00
9月24日,“青春华章・向西而歌”网络大思政课活动上,西安交通大学微电子学院集成电路工程专业博士研究生魏上杰介绍,集成电路是“国之重器”的“心脏”
2025-09-25 09:44:00
杜建英一持股公司被吊销,名下关联60家企业其中8家已注销或吊销
企查查APP显示,近日,杜建英持股的杭州芸台文化创意有限公司被吊销,原因是公司成立后无正当理由超过6个月未开业,或者开业后自行停业连续6个月以上
2025-09-25 11:20:00
雷军“五十来岁正是闯的年纪”,出生于1969年,和余承东、陈明永同龄
9月25日,雷军发文:这5年,小米一路摸爬滚打、跌宕起伏,依然启动了造车、芯片和高端化……没什么好犹豫的,五十来岁,正是闯的年纪
2025-09-25 11:20:00
贵州国企“智”变攻坚推动数实融合
赤水河畔,国内首台高温复合型仿生压曲机稳定运转,物联网实时优化发酵参数……这场酿酒的“数字革命”,也是贵州习酒公司以全链数智革新推动产业跃迁的生动缩影
2025-09-25 11:57:00
近8成职场人每周都会用AI工具 “人机互信”仍在磨合期
在人工智能技术日臻成熟的2025年,AI已是深度融入职场生态的“数字同事”,在AI辅助下的2025年职场迎来了哪些变化
2025-09-25 13:30:00
9月23日下午,2025北京文化论坛“破界共生:科技激发文化原创力”平行论坛在京举办。本场论坛由中国文联、中国作协指导
2025-09-25 13:38:00
国庆前夕,房山区物美超市“胖改店”、居然之家房山店、瑞莱广场分别于9月26日、27日、28日开业,进一步丰富了房山区消费场景
2025-09-25 13:38:00
OPPO杭州研发总部项目易主,山子高科接手公司95%股权
企查查APP显示,近日,负责OPPO项目的杭州逗酷软件科技有限公司发生工商变更,新增山子高科旗下浙江山子超影科技有限公司为股东
2025-09-25 16:25:00