教会,核心,任务,作者,学习,模型头条新闻资讯订阅

我的订阅
头条热搜

我们正处于一个信息大暴发的时代，每天都能产生数以百万计的新闻资讯！

虽然有大数据推荐，但面对海量数据，通过我们的调研发现，在一个小时的时间里，您通常无法真正有效地获取您感兴趣的资讯！

头条新闻资讯订阅，旨在帮助您收集感兴趣的资讯内容，并且在第一时间通知到您。可以有效节约您获取资讯的时间，避免错过一些关键信息。

...不要教，要激励），核心观点是：激励AI自我学习比试图教会AI每一项具体任务更重要思维链作者Jason Wei迅速赶来打call：Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底，他意识到了强化学习的...……更多

2024-09-21 09:36:00教会,核心,任务,作者,学习,模型

回归数学本质，推动学生“真”学习

...任务就是帮学生建立“百分数解题策略”这个模型工具，教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景，把百分数的问题嵌入其中，让学生自主辨析要用哪个模型工具去解决遇到的问题。在这个过程中，教学的...……更多

2024-03-14 11:03:00本质,数学,学习,学生,数学,学生

2022生成模型进展有多快，新论文盘点9类生成模型代表作

...代表解决问题的步骤。GATO 由DeepMind开发，基于强化学习教会大模型完成600多个不同的任务，包含离散控制如Atari小游戏、推箱子游戏，以及连续控制如机器人、机械臂，还有NLP对话和视觉生成等，进一步加速了通用人工智能的进...……更多

2023-01-30 16:34:00生成,模型,新论,代表作,盘点,进展

罗格斯大学团队提出思想链概念，提高大模型的算数推理能力

...源：金明宇）CoT 的原理是通过提供推理过程的示例，来教会模型处理推理，详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程，而是逐步地解决问题。这符合人类自然解决问题的方式...……更多

2024-03-15 10:41:00罗格,罗格斯,推理,模型,团队,概念

Meta联合开发机器人AI模型，任务成功率达90%

...·沙菲乌拉（Mahi Shafiullah）表示，这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人（来源：RUM 网站）创建高效的 RUMs 涉及几个关键步骤：首先是数据收集。为了加快收集机器人学习新技...……更多

2024-09-23 10:02:00成功率,机器人,模型,机器,任务,联合

学习“小样本” 练出“大智慧”（新知）

...焦点是“小样本概念学习”，这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释：“这是一种‘举一反三’的能力。例如，我们在打...……更多

2024-04-29 06:24:00新知,样本,智慧,学习,人工智能,人工

跨模态大升级！少量数据高效微调，LLM教会CLIP玩转复杂文

在当今多模态领域，CLIP 模型凭借其卓越的视觉与文本对齐能力，推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习，将视觉与语言信号嵌入到同一特征空间中，受到了广泛应用。然而，CLIP 的文本处理能力被广...……更多

2024-11-28 09:59:00模态,教会,文本,升级,数据,模态

让课堂教学真正改变让深度学习真实发生

...作用。充分发挥“影子教师”的作用，让学生当小先生，教会别人提升自己，每个班级根据情况每学科设置1—2 人。开展“结对互助”活动，班主任根据学生情况科学设置，两两结对帮扶，互相监督，互相激励，互相提升。9.推...……更多

2024-02-29 09:43:00课堂教学,深度,课堂,教学,学习,课堂

数字化转型究竟给基础教育带来什么？

...境下解决实际问题的能力。从这一点上来看，恰如其分地教会学生如何使用技术工具，是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”，并不单纯指电脑等实体工具，大模型、文本生成类的场景和视频等，都...……更多

2024-02-27 06:22:00数字,基础,教育,教育,数字,技术

自动化机器学习研究MLR-Copilot：利用大型语言模型进

...。科学技术的快速发展过程中，机器学习研究作为创新的核心驱动力，面临着实验过程复杂、耗时且易出错，研究进展缓慢以及对专门知识需求高的挑战。近年来，LLM 在生成文本和代码方面展现出了强大的能力，为科学研究带...……更多

2024-09-26 13:35:00研究,模型,自动化,机器,语言,学习

谷歌公开“社会学习”ai框架

...的数据学习，而在教师获得检测垃圾信息知识后，便可以教会学生模型区分垃圾和非垃圾信息。▲图源谷歌官方新闻稿IT之家注意到，相关教师模型可以依据实际数据集，合成出新的范例与学生模型共享，合成数据集与原始数据...……更多

2024-03-11 11:35:00框架,社会,学习,模型,学习,指令

Anthropic挖走DeepMind强化学习大牛、Alph

...。在谷歌工作十年后，大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser，宣布加入 Anthropic。我很高兴地宣布，将从本周起加入 Anthropic！Claude 是我发现自己一直在使用的第一个 LLM。最近，我被《Artifacts》和《……更多

2024-10-30 09:54:00大牛,核心,作者,学习,学习,算法

比LoRA更高效！上交大&哈佛推出新微调框架，瞄准特定任务方

...量和右奇异向量分别由矩阵和表示，矩阵的基定义如下。核心基：矩阵的核心基定义为，其中每个是由奇异向量和构成的秩为1的矩阵。全局基：矩阵的全局基定义为，对于所有, ，涵盖了左奇异向量和右奇异向量的所有组合。...……更多

2024-09-18 09:57:00哈佛,交大,框架,方向,任务,方向

将偏好学习引入模型训练，北大李戈团队提出代码生成优化新框架

...代码生成概率的变化情况如下图所示。传统的SFT策略难以教会模型更倾向于生成正确解决方案，而非错误或执行缓慢的方案。因此，在代码模型的后训练中更新训练策略，对于改进这些代码模型以应对各种代码生成任务至关重要...……更多

2024-11-28 09:57:00代码生成,偏好,框架,北大,生成,模型

思维链让大模型推理更准确？谷歌早于OpenAI押中o1模型核

...，谷歌就已经提前“押中”了具有超强推理能力的大模型核心原理。但遗憾的是，其并未基于此推出相关产品，而 OpenAI 则率先发布了 o1 模型。对此，美国人工智能初创公司 Abacus.AI 的 CEO 宾杜·雷迪（Bindu Reddy）在社交平台写道...……更多

2024-09-20 13:33:00模型,推理,思维,原理,核心,模型

职业“上新”激发新活力新经济动能澎湃

...，让大模型紧跟最前沿的医学知识。准确理解病人提问教会人工智能诊疗看病大量录入文献资料，让人工智能具备了丰富的医学知识。然而在实际应用中，知识渊博的大模型与病人交流时却常出现答非所问，或者提供的回答过...……更多

2024-08-01 14:12:00动能,活力,职业,经济,人工智能,人工

推动大模型自我进化，北理工推出「流星雨计划」

...式，解决代码模型在处理复杂问题时缺少中间推理过程。核心观点：自我进化的力量跟随上述自我进化的思想，在 SRA-MCTS（Self-guided MCTS-based data generation for Reasoning Augmentation）方法中，作者无需借助额外的任何监督信号、完……更多

2024-12-06 09:52:00流星雨,进化,理工,流星,模型,模型

只要一张图就能还原绘画过程，这篇论文比Paints-UNDO

...Motion LoRA，学习画师的绘画技法。深入解读 ProcessPainter 的核心技术1. 时序注意力机制（Temporal Attention）用时序注意力学习生成绘画过程是 ProcessPainter 的核心创新。绘画序列生成的关键是，整个序列是同一张图从抽象到具体的变...……更多

2024-07-31 09:39:00绘画,过程,论文,绘画,过程,生成

安全强化学习方法、理论与应用综述，慕工大、同济等深度解析

...Safe-Reinforcement-Learning-Baselines 一、安全强化学习的定义与核心问题强化学习的核心目标是通过与环境的交互，不断调整和优化策略以获得最大化的奖励。然而，现实环境中的风险与不确定性往往导致严重的安全问题。例如，在自...……更多

2024-10-09 09:51:00同济,学习方法,深度,理论,方法,应用

OpenAI o1模型到博士水平了?复旦教授:没有真正推理能

...训练模型运用思维链进行推理思考。这种训练的核心在于教会模型“如何思考”。因此，与传统模型追求的快速响应不同，新模型开始学会慢思考——在回答之前，内部进行长链条的思考和推理，确保生成内容的质量。在OpenAI的...……更多

2024-09-13 16:44:00复旦,相关性,概率,推理,模型,教授

整合长期记忆，AI实现自我进化，探索大模型这一可能性

...数据集。但到了阶段 3，架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。实现模型自我进化的原理模型的自我进...……更多

2024-10-29 09:55:00进化,可能性,模型,整合,记忆,模型

全球十亿级轨迹点驱动，首个轨迹基础大模型来了

...样策略是基于轨迹采样频率的间隔一致性重采样策略，其核心思想是将原始轨迹调整为一个随机的固定采样率，以适应不同的设备和场景需要，同时也能够显著降低轨迹点的数量。掩码策略由于 UniTraj 使用重构式预训练的方法来...……更多

2024-11-23 09:42:00轨迹,模型,驱动,基础,全球,轨迹

与OpenAI o1技术理念相似，TDPO-R算法有效缓解奖

...于受奖励目标驱动，这些扩散模型对齐方法常常面临一个核心挑战 —— 奖励过优化（Reward Overoptimization），即经过微调后的模型可能会过度偏向于某一奖励目标，导致生成的图像丧失个性化和多样性、视觉保真度降低，最终偏...……更多

2024-10-26 09:48:00算法,奖励,理念,问题,技术,模型

科学家阐释纯量子AI算法理论，或极大提升生化及图文领域模型性

...因此不断追求高算力的计算设备，是人类保持高速发展的核心途径之一。而经典计算尤其是基于硅芯片的经典计算，已经进入后摩尔时代。因此，如何研制新型计算设备以保持算力的稳步增长，成为学界和业界十分关心的问题。...……更多

2024-06-14 09:55:00量子,算法,科学家,模型,性能,领域

刚刚，谷歌ViT核心骨干集体投奔OpenAI：他们为Sora

爆炸消息——ViT三大核心作者集体离职谷歌DeepMind。下一站：OpenAI！他们分别是翟晓华（Xiaohua Zhai）、卢卡斯·拜尔（Lucas Beyer）、亚历山大·科列斯尼科夫（Alexander Kolesnikov）。相关消息已被本人证实，三人均官宣了新动向。2021...……更多

2024-12-05 09:47:00骨干,集体,核心,基础,苏黎世,研究