• 我的订阅
  • 头条热搜
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...不要教,要激励),核心观点是:激励AI自我学习比试图教会AI每一项具体任务更重要思维链作者Jason Wei迅速赶来打call:Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底,他意识到了强化学习的...……更多
...任务就是帮学生建立“百分数解题策略”这个模型工具,教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景,把百分数的问题嵌入其中,让学生自主辨析要用哪个模型工具去解决遇到的问题。在这个过程中,教学的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...代表解决问题的步骤。GATO 由DeepMind开发,基于强化学习教会大模型完成600多个不同的任务,包含离散控制如Atari小游戏、推箱子游戏,以及连续控制如机器人、机械臂,还有NLP对话和视觉生成等,进一步加速了通用人工智能的进...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程,而是逐步地解决问题。这符合人类自然解决问题的方式...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人(来源:RUM 网站) 创建高效的 RUMs 涉及几个关键步骤:首先是数据收集。为了加快收集机器人学习新技...……更多
...焦点是“小样本概念学习”,这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释:“这是一种‘举一反三’的能力。例如,我们在打...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
...作用。充分发挥“影子教师”的作用,让学生当小先生,教会别人提升自己,每个班级根据情况每学科设置1—2 人。开展“结对互助”活动,班主任根据学生情况科学设置,两两结对帮扶,互相监督,互相激励,互相提升。9.推...……更多
数字化转型究竟给基础教育带来什么?
...境下解决实际问题的能力。从这一点上来看,恰如其分地教会学生如何使用技术工具,是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”,并不单纯指电脑等实体工具,大模型、文本生成类的场景和视频等,都...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...。科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带...……更多
谷歌公开“社会学习”ai框架
...的数据学习,而在教师获得检测垃圾信息知识后,便可以教会学生模型区分垃圾和非垃圾信息。▲图源谷歌官方新闻稿IT之家注意到,相关教师模型可以依据实际数据集,合成出新的范例与学生模型共享,合成数据集与原始数据...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...。在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。我很高兴地宣布,将从本周起加入 Anthropic!Claude 是我发现自己一直在使用的第一个 LLM。最近,我被《Artifacts》和《……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇异向量和构成的秩为1的矩阵。 全局基:矩阵的全局基定义为,对于所有, ,涵盖了左奇异向量和右奇异向量的所有组合。...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...代码生成概率的变化情况如下图所示。传统的SFT策略难以教会模型更倾向于生成正确解决方案,而非错误或执行缓慢的方案。因此,在代码模型的后训练中更新训练策略,对于改进这些代码模型以应对各种代码生成任务至关重要...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...,谷歌就已经提前“押中”了具有超强推理能力的大模型核心原理。但遗憾的是,其并未基于此推出相关产品,而 OpenAI 则率先发布了 o1 模型。对此,美国人工智能初创公司 Abacus.AI 的 CEO 宾杜·雷迪(Bindu Reddy)在社交平台写道...……更多
职业“上新”激发新活力 新经济动能澎湃
...,让大模型紧跟最前沿的医学知识。准确理解病人提问 教会人工智能诊疗看病大量录入文献资料,让人工智能具备了丰富的医学知识。然而在实际应用中,知识渊博的大模型与病人交流时却常出现答非所问,或者提供的回答过...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监督信号、完……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...Motion LoRA,学习画师的绘画技法。深入解读 ProcessPainter 的核心技术1. 时序注意力机制(Temporal Attention)用时序注意力学习生成绘画过程是 ProcessPainter 的核心创新。绘画序列生成的关键是,整个序列是同一张图从抽象到具体的变...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...Safe-Reinforcement-Learning-Baselines 一、安全强化学习的定义与核心问题强化学习的核心目标是通过与环境的交互,不断调整和优化策略以获得最大化的奖励。然而,现实环境中的风险与不确定性往往导致严重的安全问题。例如,在自...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...训练模型运用思维链进行推理思考。这种训练的核心在于教会模型“如何思考”。因此,与传统模型追求的快速响应不同,新模型开始学会慢思考——在回答之前,内部进行长链条的思考和推理,确保生成内容的质量。在OpenAI的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。实现模型自我进化的原理模型的自我进...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...样策略是基于轨迹采样频率的间隔一致性重采样策略,其核心思想是将原始轨迹调整为一个随机的固定采样率,以适应不同的设备和场景需要,同时也能够显著降低轨迹点的数量。掩码策略由于 UniTraj 使用重构式预训练的方法来...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...于受奖励目标驱动,这些扩散模型对齐方法常常面临一个核心挑战 —— 奖励过优化(Reward Overoptimization),即经过微调后的模型可能会过度偏向于某一奖励目标,导致生成的图像丧失个性化和多样性、视觉保真度降低,最终偏...……更多
科学家阐释纯量子AI算法理论,或极大提升生化及图文领域模型性能
...因此不断追求高算力的计算设备,是人类保持高速发展的核心途径之一。而经典计算尤其是基于硅芯片的经典计算,已经进入后摩尔时代。因此,如何研制新型计算设备以保持算力的稳步增长,成为学界和业界十分关心的问题。...……更多
刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
爆炸消息——ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI!他们分别是翟晓华(Xiaohua Zhai)、卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)。相关消息已被本人证实,三人均官宣了新动向。2021...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...是针对上述第一步过程的改进。作者采用了Llama 2 70B 作为核心LLM,以提取放射学报告中的数据。整个数据生成过程可以分为以下几个步骤:首先,为增强LLM对特定任务的理解,作者对其进行了微调(finetune)。使用GPT-4对100份放...……更多
扩散模型=进化算法!生物学大佬用数学揭示本质
...化目标函数。同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。另一方面,也可以从进化的角度...……更多
手脑并用,AI大模型“补全”机器人
...部分观点摘要:“肢解”具身智能机器人:大脑、小脑是核心● 具身智能(Embodied Intelligence)不是一个新的知识,更多是把目前现有的人工智能领域的新发展统一放到一起。它从上到下的功能可划分为:大脑、小脑、主控系统...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...的情况下,拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收。 图 1. 经典傅立叶神经网络与量子傅立叶神经网络。近年来,隐式神经表征作为一种新...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统、预测未来变化和制定决策规划至关重要,在...……更多
更多关于科技的资讯:
从迷失到笃行:一位古贝春经销商的二十载商海沉浮与顿悟
鲁网11月27日讯(记者 赵洪斌)在鲁北商业版图上,王文俊的名字与古贝春酒业紧紧相连。然而,这段长达二十余年的合作关系
2025-11-28 08:45:00
近日,广东宇太能源与河北某工业玻璃龙头企业签约,合作利用空微子发电技术降低企业电耗。该项目由玻璃企业投资,宇太能源提供技术及设备支持
2025-11-28 08:57:00
罗振宇、张夕勇、杨慧林、罗军民四位大咖重磅推荐,杨钧博士《未来竞速》即将出版发行
百年汽车产业大变局的必读之作。近日,由国内汽车行业资深媒体人与研究观察者杨钧博士撰写的新书《竞速未来-全球新能源汽车的崛起与挑战》一书已由中国出版集团中译出版社正式出版发行
2025-11-28 09:27:00
近日,鹏华基金发布公告,旗下科创创业人工智能ETF鹏华 (认购代码:588413)于11月28日正式发行。作为首批双创人工智能ETF中的一员
2025-11-28 10:11:00
入选概率不及万分之二,阿里千问斩获顶级AI会议最佳论文
11月28日消息,人工智能领域顶级会议NeurIPS 2025公布了论文奖,阿里通义千问团队最新研究成果从全球2万多篇投稿论文中脱颖而出
2025-11-28 11:01:00
11月24日,位于启东市南阳镇的朗峰新材料启东有限公司生产车间内,自动化生产线高速运转,一条薄如蝉翼的银色金属带材从特制喷嘴中“飞”出
2025-11-28 11:05:00
济南轨道交通集团举办财务资本培训,实战专家孙春浩解析财务精英三级跃迁路径
近日,济南轨道交通集团全资子公司莱芜交通发展集团成功举办财务管理及融资业务培训。本次培训由集团财务管理部部长刘文芹主持
2025-11-28 11:09:00
锚定本土、驱动创新的金融实践!青岛银行荣膺CFV“最佳品牌竞争力城商行”奖项
11月21日,在上海举办的“2025第一财经金融价值年会”上,青岛银行凭借在科技金融、绿色金融、地方经济服务及创新能力方面的突出表现
2025-11-28 11:18:00
挂号缴费不用跑!微信医保移动支付在北京140家公立医院全面上线
近日,北京市参保市民就医迎来“智慧升级”——微信医保移动支付功能已在中国医学科学院、北京协和医院、北京大学人民医院等140家公立医院全面上线
2025-11-28 11:28:00
河北省煤田地质局物测队引入新装备提升探测能力
河北新闻网讯(吕若汐、齐彦红)11月18日,地球物理勘探设备供应商法国塞赛尔公司正式向河北省煤田地质局物测队交付了两套数字地震仪(激发系统)诺玛德65尼奥
2025-11-28 11:53:00
中新经纬11月28日电 北京市广电局网站消息,《北京市促进“人工智能+视听”产业高质量发展行动方案(2025-2029年)》(下称《行动方案》)近日发布
2025-11-28 11:57:00
均胜电子:定位“汽车+机器人Tier1”,双轮驱动进阶智能新时代
全球领先的智能汽车科技解决方案提供商均胜电子(600699.SH / 00699.HK)正以创新驱动和全球协同,在汽车电子
2025-11-28 12:15:00
严禁“带病运行”!河南就政务信息系统开发公开征求意见
大河网讯 为给非涉密政务信息系统的开发建设加上一把“安全锁”,规范全生命周期的安全管控工作,11月27日,省行政审批政务信息管理局起草了《非涉密政务信息系统开发安全管理指南(征求意见稿)》(以下简称《征求意见稿》)
2025-11-28 14:10:00
吉林机场集团门户网站二次升级 打造智慧出行服务新标杆
为持续优化用户体验、丰富服务维度,吉林省民航机场集团有限公司门户网站(https//www.jlairports.com)正式迎来二次重大升级
2025-11-28 14:41:00
商赢酱酒以文化赋能商务社交,重塑“场景思维”新体验
11月25日,一场以“商界链接创富圈层,共享‘商赢酱酒’杯中哲学,解锁中国式商务社交的‘心’语”为主题的交流会在济南成功举办
2025-11-28 14:55:00