• 我的订阅
  • 头条热搜
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...不要教,要激励),核心观点是:激励AI自我学习比试图教会AI每一项具体任务更重要思维链作者Jason Wei迅速赶来打call:Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底,他意识到了强化学习的...……更多
...任务就是帮学生建立“百分数解题策略”这个模型工具,教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景,把百分数的问题嵌入其中,让学生自主辨析要用哪个模型工具去解决遇到的问题。在这个过程中,教学的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...代表解决问题的步骤。GATO 由DeepMind开发,基于强化学习教会大模型完成600多个不同的任务,包含离散控制如Atari小游戏、推箱子游戏,以及连续控制如机器人、机械臂,还有NLP对话和视觉生成等,进一步加速了通用人工智能的进...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程,而是逐步地解决问题。这符合人类自然解决问题的方式...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人(来源:RUM 网站) 创建高效的 RUMs 涉及几个关键步骤:首先是数据收集。为了加快收集机器人学习新技...……更多
...焦点是“小样本概念学习”,这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释:“这是一种‘举一反三’的能力。例如,我们在打...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
...作用。充分发挥“影子教师”的作用,让学生当小先生,教会别人提升自己,每个班级根据情况每学科设置1—2 人。开展“结对互助”活动,班主任根据学生情况科学设置,两两结对帮扶,互相监督,互相激励,互相提升。9.推...……更多
数字化转型究竟给基础教育带来什么?
...境下解决实际问题的能力。从这一点上来看,恰如其分地教会学生如何使用技术工具,是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”,并不单纯指电脑等实体工具,大模型、文本生成类的场景和视频等,都...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...。科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...。在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。我很高兴地宣布,将从本周起加入 Anthropic!Claude 是我发现自己一直在使用的第一个 LLM。最近,我被《Artifacts》和《……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇异向量和构成的秩为1的矩阵。 全局基:矩阵的全局基定义为,对于所有, ,涵盖了左奇异向量和右奇异向量的所有组合。...……更多
谷歌公开“社会学习”ai框架
...的数据学习,而在教师获得检测垃圾信息知识后,便可以教会学生模型区分垃圾和非垃圾信息。▲图源谷歌官方新闻稿IT之家注意到,相关教师模型可以依据实际数据集,合成出新的范例与学生模型共享,合成数据集与原始数据...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...代码生成概率的变化情况如下图所示。传统的SFT策略难以教会模型更倾向于生成正确解决方案,而非错误或执行缓慢的方案。因此,在代码模型的后训练中更新训练策略,对于改进这些代码模型以应对各种代码生成任务至关重要...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...,谷歌就已经提前“押中”了具有超强推理能力的大模型核心原理。但遗憾的是,其并未基于此推出相关产品,而 OpenAI 则率先发布了 o1 模型。对此,美国人工智能初创公司 Abacus.AI 的 CEO 宾杜·雷迪(Bindu Reddy)在社交平台写道...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监督信号、完……更多
职业“上新”激发新活力 新经济动能澎湃
...,让大模型紧跟最前沿的医学知识。准确理解病人提问 教会人工智能诊疗看病大量录入文献资料,让人工智能具备了丰富的医学知识。然而在实际应用中,知识渊博的大模型与病人交流时却常出现答非所问,或者提供的回答过...……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...Motion LoRA,学习画师的绘画技法。深入解读 ProcessPainter 的核心技术1. 时序注意力机制(Temporal Attention)用时序注意力学习生成绘画过程是 ProcessPainter 的核心创新。绘画序列生成的关键是,整个序列是同一张图从抽象到具体的变...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...Safe-Reinforcement-Learning-Baselines 一、安全强化学习的定义与核心问题强化学习的核心目标是通过与环境的交互,不断调整和优化策略以获得最大化的奖励。然而,现实环境中的风险与不确定性往往导致严重的安全问题。例如,在自...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...训练模型运用思维链进行推理思考。这种训练的核心在于教会模型“如何思考”。因此,与传统模型追求的快速响应不同,新模型开始学会慢思考——在回答之前,内部进行长链条的思考和推理,确保生成内容的质量。在OpenAI的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。实现模型自我进化的原理模型的自我进...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...样策略是基于轨迹采样频率的间隔一致性重采样策略,其核心思想是将原始轨迹调整为一个随机的固定采样率,以适应不同的设备和场景需要,同时也能够显著降低轨迹点的数量。掩码策略由于 UniTraj 使用重构式预训练的方法来...……更多
刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
爆炸消息——ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI!他们分别是翟晓华(Xiaohua Zhai)、卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)。相关消息已被本人证实,三人均官宣了新动向。2021...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...于受奖励目标驱动,这些扩散模型对齐方法常常面临一个核心挑战 —— 奖励过优化(Reward Overoptimization),即经过微调后的模型可能会过度偏向于某一奖励目标,导致生成的图像丧失个性化和多样性、视觉保真度降低,最终偏...……更多
科学家阐释纯量子AI算法理论,或极大提升生化及图文领域模型性能
...因此不断追求高算力的计算设备,是人类保持高速发展的核心途径之一。而经典计算尤其是基于硅芯片的经典计算,已经进入后摩尔时代。因此,如何研制新型计算设备以保持算力的稳步增长,成为学界和业界十分关心的问题。...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...是针对上述第一步过程的改进。作者采用了Llama 2 70B 作为核心LLM,以提取放射学报告中的数据。整个数据生成过程可以分为以下几个步骤:首先,为增强LLM对特定任务的理解,作者对其进行了微调(finetune)。使用GPT-4对100份放...……更多
Chat AI项目丨对标DeepMind Gato,人工智能模型「DB1」已在多领域落地验证
...于AIGA(AI Generated Action,人工智能生成决策)范畴。AIGC的核心是大语言模型,大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本含义,完成多种自然语言任务,如文本分类、问答、对...……更多
扩散模型=进化算法!生物学大佬用数学揭示本质
...化目标函数。同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。另一方面,也可以从进化的角度...……更多
ChatGPT大流行的思考-解析篇
...的思维链,又称CoT,(few-shot CoT,Chain of Thought),方法是:为了教会LLM模型学会推理,给出一些人工写好的推理示例,示例里把得到最终答案前,一步步的具体推理步骤说清楚,而这些人工写的详细推理过程,就是思维链Prompting,这种...……更多
手脑并用,AI大模型“补全”机器人
...部分观点摘要:“肢解”具身智能机器人:大脑、小脑是核心● 具身智能(Embodied Intelligence)不是一个新的知识,更多是把目前现有的人工智能领域的新发展统一放到一起。它从上到下的功能可划分为:大脑、小脑、主控系统...……更多
更多关于科技的资讯:
Vision Pro遭遇滑铁卢:苹果研发廉价版
快科技1月13日消息,苹果记者Mark Gurman透露,苹果不打算在2025年推出Vision Pro 2,而是将主要精力放到廉价版头显设备上
2025-01-13 07:52:00
20元就能山寨官网!央视曝光克隆网站黑幕 专家教你如何辨别
快科技1月13日消息,日前,央视财经曝光克隆网站黑幕,一些不法分子打着“退费补贴”“消费充值”“证件办理”“期刊征稿”等幌子
2025-01-13 07:52:00
厦门网讯(厦门日报记者 林雯)24小时在线,精准解答政策——日前,思明区AI数字人“科悦”正式上线,实时在线为企业提供智能政策解答服务
2025-01-13 08:41:00
厦门网讯(厦门日报记者 李晓平)2025开年以来,科技圈最关注的莫过于刚刚在美国拉斯维加斯举行的2025年国际消费类电子产品展览会(简称“CES 2025”)
2025-01-13 08:41:00
Mac Studio首发!苹果最强芯片M4 Ultra今年登场
快科技1月13日消息,今天,Mark Gurman爆料,全新的苹果Mac Studio会在今年上半年亮相,标准版搭载M4 Max芯片
2025-01-13 08:52:00
记者日前从中新天津生态城获悉,生态城商务和投资促进局与青岛飞熊领鲜科技有限公司(以下简称“飞熊领鲜”)、正和(天津)食品科技有限公司(以下简称“正和食品”)分别签署战略合作协议
2025-01-13 08:55:00
本文转自:人民网-观点频道思睿以425.02亿元的总票房和10.1亿的总观影人次收官,2024年中国电影市场喜忧参半。忧的是电影市场总票房同比下降22
2025-01-13 09:02:00
雷军现身黑河参加冬测:吃东北铁锅炖 荡秋千开怀大笑
快科技1月13日消息,日前,小米CEO雷军、小米总裁卢伟冰等小米高管来到黑龙江黑河的冬测基地,参加冬季测试。小米CEO雷军还发布了此次黑河之行的视频
2025-01-13 09:22:00
中新经纬1月12日电 (袁媛)11日,第26届北大光华新年论坛在北京大学百年讲堂召开。会上,第十四届全国政协委员,北京大学人工智能研究院
2025-01-13 09:38:00
升级高端!天坤工匠品牌发布,聚焦制造业高技能人才服务
2025年1月9日,天坤控股集团“匠心启航·卓越同行”新品牌发布会在苏州隆重举行,正式发布旗下制造业高技能人才专业服务品牌——天坤工匠
2025-01-13 09:45:00
AI赋能!踏浪潮头!
岁序更易,再启华章;春潮涌动,鼓点催征。今天(1月11日)上午召开的2025年昆山市新型工业化推进会,紧扣“AI赋能昆山智造”这一主题
2025-01-13 09:46:00
闲鱼养肥白嫖怪
在多个电商平台被严格规范“仅退款”后,这股“薅羊毛风潮”开始在闲鱼上蔓延。近期,不少闲鱼卖家反馈,仅退款的行为在闲鱼流行
2025-01-13 09:52:00
SpaceX星舰第七次试飞推迟:推测天气条件不佳所致
快科技1月13日消息,据报道,美国太空探索技术公司(SpaceX)宣布,星舰飞船(Starship)第七次试射将推迟至1月15日
2025-01-13 09:52:00
于东来宣布在胖东来不允许夫妻间家暴冷暴力!员工不能打孩子
快科技1月13日消息,今日,胖东来创始人、董事长于东来在其个人抖音号发布多条视频作品,内容涉及员工家庭、员工借钱等。于东来表示
2025-01-13 09:52:00
刘春泽 中国地质大学臭气治理是污水处理与固废处理行业亟待解决的重要课题。臭气不仅影响周边居民的生活质量,还对环境和生态系统造成影响
2025-01-13 09:52:00