• 我的订阅
  • 头条热搜
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...不要教,要激励),核心观点是:激励AI自我学习比试图教会AI每一项具体任务更重要思维链作者Jason Wei迅速赶来打call:Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底,他意识到了强化学习的...……更多
...任务就是帮学生建立“百分数解题策略”这个模型工具,教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景,把百分数的问题嵌入其中,让学生自主辨析要用哪个模型工具去解决遇到的问题。在这个过程中,教学的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...代表解决问题的步骤。GATO 由DeepMind开发,基于强化学习教会大模型完成600多个不同的任务,包含离散控制如Atari小游戏、推箱子游戏,以及连续控制如机器人、机械臂,还有NLP对话和视觉生成等,进一步加速了通用人工智能的进...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程,而是逐步地解决问题。这符合人类自然解决问题的方式...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人(来源:RUM 网站) 创建高效的 RUMs 涉及几个关键步骤:首先是数据收集。为了加快收集机器人学习新技...……更多
...焦点是“小样本概念学习”,这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释:“这是一种‘举一反三’的能力。例如,我们在打...……更多
...作用。充分发挥“影子教师”的作用,让学生当小先生,教会别人提升自己,每个班级根据情况每学科设置1—2 人。开展“结对互助”活动,班主任根据学生情况科学设置,两两结对帮扶,互相监督,互相激励,互相提升。9.推...……更多
数字化转型究竟给基础教育带来什么?
...境下解决实际问题的能力。从这一点上来看,恰如其分地教会学生如何使用技术工具,是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”,并不单纯指电脑等实体工具,大模型、文本生成类的场景和视频等,都...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...。科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带...……更多
谷歌公开“社会学习”ai框架
...的数据学习,而在教师获得检测垃圾信息知识后,便可以教会学生模型区分垃圾和非垃圾信息。▲图源谷歌官方新闻稿IT之家注意到,相关教师模型可以依据实际数据集,合成出新的范例与学生模型共享,合成数据集与原始数据...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...。在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。我很高兴地宣布,将从本周起加入 Anthropic!Claude 是我发现自己一直在使用的第一个 LLM。最近,我被《Artifacts》和《……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇异向量和构成的秩为1的矩阵。 全局基:矩阵的全局基定义为,对于所有, ,涵盖了左奇异向量和右奇异向量的所有组合。...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...,谷歌就已经提前“押中”了具有超强推理能力的大模型核心原理。但遗憾的是,其并未基于此推出相关产品,而 OpenAI 则率先发布了 o1 模型。对此,美国人工智能初创公司 Abacus.AI 的 CEO 宾杜·雷迪(Bindu Reddy)在社交平台写道...……更多
职业“上新”激发新活力 新经济动能澎湃
...,让大模型紧跟最前沿的医学知识。准确理解病人提问 教会人工智能诊疗看病大量录入文献资料,让人工智能具备了丰富的医学知识。然而在实际应用中,知识渊博的大模型与病人交流时却常出现答非所问,或者提供的回答过...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...Motion LoRA,学习画师的绘画技法。深入解读 ProcessPainter 的核心技术1. 时序注意力机制(Temporal Attention)用时序注意力学习生成绘画过程是 ProcessPainter 的核心创新。绘画序列生成的关键是,整个序列是同一张图从抽象到具体的变...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...Safe-Reinforcement-Learning-Baselines 一、安全强化学习的定义与核心问题强化学习的核心目标是通过与环境的交互,不断调整和优化策略以获得最大化的奖励。然而,现实环境中的风险与不确定性往往导致严重的安全问题。例如,在自...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...训练模型运用思维链进行推理思考。这种训练的核心在于教会模型“如何思考”。因此,与传统模型追求的快速响应不同,新模型开始学会慢思考——在回答之前,内部进行长链条的思考和推理,确保生成内容的质量。在OpenAI的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。实现模型自我进化的原理模型的自我进...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...样策略是基于轨迹采样频率的间隔一致性重采样策略,其核心思想是将原始轨迹调整为一个随机的固定采样率,以适应不同的设备和场景需要,同时也能够显著降低轨迹点的数量。掩码策略由于 UniTraj 使用重构式预训练的方法来...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...于受奖励目标驱动,这些扩散模型对齐方法常常面临一个核心挑战 —— 奖励过优化(Reward Overoptimization),即经过微调后的模型可能会过度偏向于某一奖励目标,导致生成的图像丧失个性化和多样性、视觉保真度降低,最终偏...……更多
科学家阐释纯量子AI算法理论,或极大提升生化及图文领域模型性能
...因此不断追求高算力的计算设备,是人类保持高速发展的核心途径之一。而经典计算尤其是基于硅芯片的经典计算,已经进入后摩尔时代。因此,如何研制新型计算设备以保持算力的稳步增长,成为学界和业界十分关心的问题。...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...是针对上述第一步过程的改进。作者采用了Llama 2 70B 作为核心LLM,以提取放射学报告中的数据。整个数据生成过程可以分为以下几个步骤:首先,为增强LLM对特定任务的理解,作者对其进行了微调(finetune)。使用GPT-4对100份放...……更多
手脑并用,AI大模型“补全”机器人
...部分观点摘要:“肢解”具身智能机器人:大脑、小脑是核心● 具身智能(Embodied Intelligence)不是一个新的知识,更多是把目前现有的人工智能领域的新发展统一放到一起。它从上到下的功能可划分为:大脑、小脑、主控系统...……更多
信号表征指数级强、内存节省35%,量子隐式表征网络
...的情况下,拟合误差最多减少 35%。图 1 中展示了本文的核心思想和主要结论。相关论文已经被机器学习领域最权威的会议之一 ICML 2024 接收。 图 1. 经典傅立叶神经网络与量子傅立叶神经网络。近年来,隐式神经表征作为一种新...……更多
清华提出时间序列大模型:面向通用时序分析的生成式Transformer
...Transformer在大规模时间序列上进行生成式预训练,获得了任务通用的时序分析模型,展现出大模型特有的泛化性与可扩展性时间序列提供了数据随时间变化的视角,对于理解复杂系统、预测未来变化和制定决策规划至关重要,在...……更多
OpenCity大模型预测交通路况,零样本下表现出色,来自港大百度
...环境。 快速的情境适应能力:OpenCity在不同天的时空预测任务中展现了广泛的适用性。模型只需快速微调就能适应上下文,可以无缝部署在各种场景中。 可扩展性:OpenCity展示了有希望的缩放定律,表明该模型有潜力在最小的额...……更多
首个多模态连续学习综述,港中文、清华、UIC联合发布
...数据的重新训练。连续学习的主要挑战是灾难性遗忘:当任务按顺序训练时,新的任务训练会严重干扰之前学习的任务的性能,因为不受约束的微调会使参数远离旧任务的最优状态。尽管连续学习取得了重大进展,但大多数工作...……更多
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了
...on 论文地址:https://arxiv.org/abs/2408.15339 UNA 的创新点UNA 的核心创新点在于通过一个(generalized implicit reward function)将 RLHF、DPO 和 KTO 统一为一个监督学习问题。UNA 的创新体现在以下几个……更多
黄仁勋对话Transformer七作者:很多计算资源被浪费,世界需要更好的模型
...,而机器学习就是软件的一部分。因此,最直接的方法是教会机器编码,这样你就能够生成软件,并改变所有人的访问方式。”当琼斯谈到推理是“下一个重要的发展方向”,其他研究者都进行了附和。凯泽指出,在未来,作为...……更多
字节豆包大模型团队突破残差连接局限!预训练收敛最快加速80%
...-Connections 论文链接:https://arxiv.org/pdf/2409.196061. 超连接的核心思想前文提及,残差连接的两种主要变体Pre-Norm和Post-Norm各自都有其局限性,具体体现如下:Pre-Norm:在每个残差块之前进行归一化操作,可有效减少梯度消失问题……更多
更多关于科技的资讯:
鲁网9月28日讯金融是经济的血脉,更是百姓生活的依托。在中国经济迈向高质量发展的今天,中国建设银行青岛市分行以国有大行的责任与担当
2025-09-28 10:37:00
五年连获七家世界知名轴承制造企业认证一根轴承钢转动全球——“铁疙瘩”怎样变成“金娃娃”(九)前不久,河钢集团石钢公司收到日本某国际知名轴承企业高碳铬轴承钢的认证邮件
2025-09-28 08:04:00
锚定新赛道 壮大新动能超31亿元新一代工业软件基地项目开工南报网讯(记者刘安琪)项目兴则产业兴,项目强则经济强。9月26日上午
2025-09-28 07:43:00
山东移动成功入选2025年度山东省中小企业服务支撑机构
近日,山东省轻工联社发布《关于公布2025年度山东省中小企业服务支撑机构名单的通知》,山东移动成功入选。作为推动中小企业数字化转型的主力军
2025-09-27 08:11:00
南报网讯(记者卫凌云通讯员建萱)9月26日,2025南京河西中央科创区生态建设推进会举行,“大厂+大学+大所”创新平台揭牌
2025-09-27 09:53:00
山东移动淄博公司织就高速信息网络,筑牢“数字淄博”智慧生命线
在数字化浪潮席卷而来的今天,信息传输网络如同城市的“神经网络”,是智慧城市运转的核心支撑。作为这一无形“生命线”的守护者
2025-09-27 12:34:00
迭代焕新“吾悦经营五步法”,新城控股再启商业新篇
9月24日-25日,新城控股“2025第八届商业年会暨吾悦商管第一届悦链计划合伙人大会”在上海西岸美高梅酒店举行,新城控股集团董事长王晓松及公司高管
2025-09-27 12:37:00
25日上午,以“上山下山·食在晋安”为主题的晋安区“一县一桌菜”云上发布会举行,12道“云端”盛宴引爆味蕾。
2025-09-27 13:53:00
产业链协同驱动 新奥加速冲刺氢硼聚变
河北新闻网讯(张新)2025年,是我国“十四五”规划收官之年,也是“双碳”目标提出五周年。在此背景下,央视《东方时空》栏目近日推出“可控核聚变专题”
2025-09-27 14:45:00
9月25日,国网山西省电力公司发布消息,该公司成功完成配电网无人机电力北斗定位服务的全面应用,标志着该公司依托电力北斗高精度定位服务
2025-09-27 19:56:00
谢志强:从金融菁英到人才“伯乐”,以产学研融合破局就业困境
谢志强,现任中科汇理信息技术研究院党支部书记、秘书长、中科产学研合作一体化人才培育开发平台项目主任。历任中国银行总行风险管理部业务经理
2025-09-27 20:20:00
聚焦数贸会 | 工匠行:机器狗能听会说还会自主巡逻
在第四届全球数字博览会上,贵州工匠行科技有限公司展出的SomaSeek具身智能平台,让机器人彻底告别了遥控器,也能听会说
2025-09-27 22:17:00
企业新市场何处寻?潍坊这场产业国际精准对接会送来“及时雨”
齐鲁晚报·齐鲁壹点 胡晓雪 李国栋9月26日,2025潍坊纺织服装产业国际精准对接活动在奎文区成功举办,本次活动以“我帮企业组主场·我为企业找订单”为主题
2025-09-27 22:22:00
生产周期缩短1/3,宇捷轴承凭核心技术领跑细分市场
齐鲁晚报·齐鲁壹点 陶春燕 山东省宇捷轴承制造有限公司是国家级专精特新重点“小巨人”企业、国内最大的调心滚子轴承生产企业
2025-09-27 20:05:00
电动车照亮小区应急通道?淄博供电验证居民V2G桩集群放电场景
当小区突发故障停电,地下车库里业主们的电动汽车,瞬间变身为一个巨大“充电宝”,为消防、通风和应急照明系统供电,守护社区安全
2025-09-27 12:35:00