• 我的订阅
  • 头条热搜
o1核心作者分享:激励AI自我学习,比试图教会AI每一项任务更重要
...不要教,要激励),核心观点是:激励AI自我学习比试图教会AI每一项具体任务更重要思维链作者Jason Wei迅速赶来打call:Hyung Won识别新范式并完全放弃任何沉没成本的能力给我留下了深刻的印象。2022年底,他意识到了强化学习的...……更多
...任务就是帮学生建立“百分数解题策略”这个模型工具,教会学生使用这个工具。其次要创造一个学生感兴趣的生活场景,把百分数的问题嵌入其中,让学生自主辨析要用哪个模型工具去解决遇到的问题。在这个过程中,教学的...……更多
2022生成模型进展有多快,新论文盘点9类生成模型代表作
...代表解决问题的步骤。GATO 由DeepMind开发,基于强化学习教会大模型完成600多个不同的任务,包含离散控制如Atari小游戏、推箱子游戏,以及连续控制如机器人、机械臂,还有NLP对话和视觉生成等,进一步加速了通用人工智能的进...……更多
罗格斯大学团队提出思想链概念,提高大模型的算数推理能力
...源:金明宇)CoT 的原理是通过提供推理过程的示例,来教会模型处理推理,详细说明导致最终答案的每个步骤。这种提示方法能够有效地教会模型不要匆忙完成推理过程,而是逐步地解决问题。这符合人类自然解决问题的方式...……更多
Meta联合开发机器人AI模型,任务成功率达90%
...·沙菲乌拉(Mahi Shafiullah)表示,这项研究聚焦于“如何教会机器人在任何地方打开任何门”。图 | 正在打开抽屉的机器人(来源:RUM 网站) 创建高效的 RUMs 涉及几个关键步骤:首先是数据收集。为了加快收集机器人学习新技...……更多
...焦点是“小样本概念学习”,这一人工智能范式旨在探索教会人工智能系统掌握抽象概念学习和认知推理的能力。论文通讯作者、北京大学人工智能研究院助理教授朱毅鑫解释:“这是一种‘举一反三’的能力。例如,我们在打...……更多
跨模态大升级!少量数据高效微调,LLM教会CLIP玩转复杂文本
在当今多模态领域,CLIP 模型凭借其卓越的视觉与文本对齐能力,推动了视觉基础模型的发展。CLIP 通过对大规模图文对的对比学习,将视觉与语言信号嵌入到同一特征空间中,受到了广泛应用。然而,CLIP 的文本处理能力被广...……更多
...作用。充分发挥“影子教师”的作用,让学生当小先生,教会别人提升自己,每个班级根据情况每学科设置1—2 人。开展“结对互助”活动,班主任根据学生情况科学设置,两两结对帮扶,互相监督,互相激励,互相提升。9.推...……更多
数字化转型究竟给基础教育带来什么?
...境下解决实际问题的能力。从这一点上来看,恰如其分地教会学生如何使用技术工具,是现代教育理念下中小学教育应该完成的任务。这里所谓的“工具”,并不单纯指电脑等实体工具,大模型、文本生成类的场景和视频等,都...……更多
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
...。科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带...……更多
谷歌公开“社会学习”ai框架
...的数据学习,而在教师获得检测垃圾信息知识后,便可以教会学生模型区分垃圾和非垃圾信息。▲图源谷歌官方新闻稿IT之家注意到,相关教师模型可以依据实际数据集,合成出新的范例与学生模型共享,合成数据集与原始数据...……更多
Anthropic挖走DeepMind强化学习大牛、AlphaGo核心作者
...。在谷歌工作十年后,大名鼎鼎的谷歌 DeepMind Alpha 系列核心作者 Julian Schrittwieser,宣布加入 Anthropic。我很高兴地宣布,将从本周起加入 Anthropic!Claude 是我发现自己一直在使用的第一个 LLM。最近,我被《Artifacts》和《……更多
比LoRA更高效!上交大&哈佛推出新微调框架,瞄准特定任务方向
...量和右奇异向量分别由矩阵和表示,矩阵的基定义如下。核心基:矩阵的核心基定义为,其中每个是由奇异向量和构成的秩为1的矩阵。 全局基:矩阵的全局基定义为,对于所有, ,涵盖了左奇异向量和右奇异向量的所有组合。...……更多
将偏好学习引入模型训练,北大李戈团队提出代码生成优化新框架
...代码生成概率的变化情况如下图所示。传统的SFT策略难以教会模型更倾向于生成正确解决方案,而非错误或执行缓慢的方案。因此,在代码模型的后训练中更新训练策略,对于改进这些代码模型以应对各种代码生成任务至关重要...……更多
首个“开源chatgpt”来了:基于谷歌5400亿参数大模型
...在发问:这……有人能run?开源了但没完全开? 项目的核心内容,是在PaLM架构上实现基于人类反馈的强化学习。其中,PaLM(PathwaysLanguageModel)是谷歌在今年4月发布的 5400亿参数全能大模型,基于Pathways系统训练,BERT之父JacobDev...……更多
思维链让大模型推理更准确?谷歌早于OpenAI押中o1模型核心原理
...,谷歌就已经提前“押中”了具有超强推理能力的大模型核心原理。但遗憾的是,其并未基于此推出相关产品,而 OpenAI 则率先发布了 o1 模型。对此,美国人工智能初创公司 Abacus.AI 的 CEO 宾杜·雷迪(Bindu Reddy)在社交平台写道...……更多
职业“上新”激发新活力 新经济动能澎湃
...,让大模型紧跟最前沿的医学知识。准确理解病人提问 教会人工智能诊疗看病大量录入文献资料,让人工智能具备了丰富的医学知识。然而在实际应用中,知识渊博的大模型与病人交流时却常出现答非所问,或者提供的回答过...……更多
推动大模型自我进化,北理工推出「流星雨计划」
...式,解决代码模型在处理复杂问题时缺少中间推理过程。核心观点:自我进化的力量跟随上述自我进化的思想,在 SRA-MCTS(Self-guided MCTS-based data generation for Reasoning Augmentation)方法中,作者无需借助额外的任何监督信号、完……更多
只要一张图就能还原绘画过程,这篇论文比Paints-UNDO实现得更早
...Motion LoRA,学习画师的绘画技法。深入解读 ProcessPainter 的核心技术1. 时序注意力机制(Temporal Attention)用时序注意力学习生成绘画过程是 ProcessPainter 的核心创新。绘画序列生成的关键是,整个序列是同一张图从抽象到具体的变...……更多
安全强化学习方法、理论与应用综述,慕工大、同济等深度解析
...Safe-Reinforcement-Learning-Baselines 一、安全强化学习的定义与核心问题强化学习的核心目标是通过与环境的交互,不断调整和优化策略以获得最大化的奖励。然而,现实环境中的风险与不确定性往往导致严重的安全问题。例如,在自...……更多
OpenAI o1模型到博士水平了?复旦教授:没有真正推理能力,学到的还是概率相关性
...训练模型运用思维链进行推理思考。这种训练的核心在于教会模型“如何思考”。因此,与传统模型追求的快速响应不同,新模型开始学会慢思考——在回答之前,内部进行长链条的思考和推理,确保生成内容的质量。在OpenAI的...……更多
整合长期记忆,AI实现自我进化,探索大模型这一可能性
...数据集。但到了阶段 3,架构就会变得和数据一样重要。核心的难题是如何在统计模型的基础上有效表达少数个体的数据。该研究关注的核心是如何确保在统计模型内有效地表达个体数据。实现模型自我进化的原理模型的自我进...……更多
全球十亿级轨迹点驱动,首个轨迹基础大模型来了
...样策略是基于轨迹采样频率的间隔一致性重采样策略,其核心思想是将原始轨迹调整为一个随机的固定采样率,以适应不同的设备和场景需要,同时也能够显著降低轨迹点的数量。掩码策略由于 UniTraj 使用重构式预训练的方法来...……更多
与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题
...于受奖励目标驱动,这些扩散模型对齐方法常常面临一个核心挑战 —— 奖励过优化(Reward Overoptimization),即经过微调后的模型可能会过度偏向于某一奖励目标,导致生成的图像丧失个性化和多样性、视觉保真度降低,最终偏...……更多
Chat AI项目丨对标DeepMind Gato,人工智能模型「DB1」已在多领域落地验证
...于AIGA(AI Generated Action,人工智能生成决策)范畴。AIGC的核心是大语言模型,大语言模型是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本含义,完成多种自然语言任务,如文本分类、问答、对...……更多
科学家阐释纯量子AI算法理论,或极大提升生化及图文领域模型性能
...因此不断追求高算力的计算设备,是人类保持高速发展的核心途径之一。而经典计算尤其是基于硅芯片的经典计算,已经进入后摩尔时代。因此,如何研制新型计算设备以保持算力的稳步增长,成为学界和业界十分关心的问题。...……更多
刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础
爆炸消息——ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI!他们分别是翟晓华(Xiaohua Zhai)、卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)。相关消息已被本人证实,三人均官宣了新动向。2021...……更多
21.5万张X光,78万个问题!德州大学NIH等联合发布医学视觉问答数据集Medical-CXR-VQA
...是针对上述第一步过程的改进。作者采用了Llama 2 70B 作为核心LLM,以提取放射学报告中的数据。整个数据生成过程可以分为以下几个步骤:首先,为增强LLM对特定任务的理解,作者对其进行了微调(finetune)。使用GPT-4对100份放...……更多
ChatGPT大流行的思考-解析篇
...的思维链,又称CoT,(few-shot CoT,Chain of Thought),方法是:为了教会LLM模型学会推理,给出一些人工写好的推理示例,示例里把得到最终答案前,一步步的具体推理步骤说清楚,而这些人工写的详细推理过程,就是思维链Prompting,这种...……更多
扩散模型=进化算法!生物学大佬用数学揭示本质
...化目标函数。同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。另一方面,也可以从进化的角度...……更多
更多关于科技的资讯:
杨蕊:人工智能赋能民族文化传承
构建“非遗+数智转型”的传承模式。依托丰富的民族文化资源,积极构建智能化文化传承体系。探索推动侗族大歌、侗族刺绣等国家级非物质文化遗产代表性项目的数字化保存与传播
2025-08-21 23:02:00
今年暑期,海洋公园们走到生死边缘
作者:theodore熙少海洋公园面临终极宿命。(图/unsplash)今年暑期,留给国内城市海洋公园们面前的路愈来愈清晰了
2025-08-21 08:18:00
近年来,部分消费领域陷入“内卷式”竞争,通过非理性价格战、虚假补贴、过度促销等手段吸引消费者。这种竞争看似让消费者得利
2025-08-21 19:52:00
汇腾科技:超临界萃取“邂逅”黔地珍宝
多彩贵州网讯走进贵州汇腾科技有限公司(简称:汇腾科技)生产基地,1500L*3的超临界萃取生产装备正发出低沉而稳定的嗡鸣
2025-08-21 21:25:00
科拓生物亮相首届精准营养大会,引领益生菌产业精准化变革
8月17-19日,中国营养学会精准营养产业分会主办的第一届精准营养产业大会在上海盛大启幕。本届大会以“创新新生态,转化新标准”为主题
2025-08-21 10:53:00
英特尔成立UQD互插互换联盟:携手五大伙伴,共筑液冷生态新未来
今日,英特尔®通用快接头(下称UQD)互插互换联盟正式成立。成立仪式上,英特尔与首批认证合作伙伴——英维克、丹佛斯、立敏达科技
2025-08-21 10:55:00
安全护航真诚相遇 珍爱网筑起坚固反诈防线为爱保驾护航
从清晨醒来手机收到的一条天气提醒,到开启旅途的一份行程规划,到工作中依赖网络开展的业务往来,再到闲暇时畅游网络世界的娱乐放松……网络已深度融入我们的日常生活与工作
2025-08-21 09:10:00
萍乡构建“返乡即就业”服务体系 已帮扶2万余人达成就业意向
本报讯 信息日报全媒体记者谢梦丽报道:8月19日,记者从萍乡市人社部门了解到,今年以来,针对返乡人员就业工作,萍乡多举措构建“返乡即就业”全周期服务体系
2025-08-21 06:19:00
8月18日,“中国醋都·清徐”陈醋系列产品包装设计大赛启动。本次大赛以“清徐陈醋 健康好醋”为主题,由清徐县醋产业发展和研究中心
2025-08-21 07:20:00
四院士“智”见AI
8月20日,第九届未来网络发展大会在南京上秦淮国际文化交流中心开幕。邬贺铨、李国杰、刘韵洁、郑庆华等专家,在会上开展深度对话
2025-08-21 07:40:00
算力可像“水电”一样便捷取用
未来网络试验设施(CENI)创新试验展台的灵犀导览机器人。紫金山实验室展台。南报网讯(记者张安琪实习生饶嘉萱)8月20日在第九届未来网络发展大会开幕式上
2025-08-21 07:42:00
全球首个!西电“玄知”密码大模型问世!
近日,西安电子科技大学计算机科学与技术学院沈玉龙教授团队在密码大模型方面取得突破性进展,研究成果以“玄知大模型”命名在西部网络安全大会上正式发布
2025-08-20 09:45:00
东方甄选股价跳水,新东方紧急声明
8月19日,东方甄选股价上演“天地板”,早盘一度暴涨逾23%,午后高台跳水,盘后跌20.89%。若以日内高点计算,追高资金在不足两小时内浮亏逾30%
2025-08-20 09:55:00
产业链上的山东好品牌|历时19年,平耐集团为全球建筑与工业装备披上“中国智造”外衣
大众网记者 刘爽 张宁 菏泽报道“作为国家级高新技术企业,平耐集团正以毫米级的品质追求和绿色智能的产业实践,为全球建筑与工业装备披上‘中国智造’的防护外衣……”平耐新材料科技(山东)有限公司(以下简称
2025-08-20 10:39:00
宇树科技发布新款人形机器人预告海报,身高180cm,拥有31个全身自由度,动作灵活且优雅
8月19日晚间,宇树科技发布新款人形机器人预告海报,配文“敬请期待”。根据官方海报显示,新款机器人有1米8大高个,拥有31个关节自由度(6*2+3+7*2+2)
2025-08-20 11:39:00