• 我的订阅
  • 科技

扩散模型=进化算法!生物学大佬用数学揭示本质

类别:科技 发布时间:2024-11-25 09:56:00 来源:新智元

扩散模型=进化算法!生物学大佬用数学揭示本质

【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。

扩散模型居然就是生物的进化算法!

这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:

扩散模型=进化算法!生物学大佬用数学揭示本质

论文地址:https://arxiv.org/pdf/2410.02543

论文的压轴大佬是美国发育和合成生物学家Michael Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。

Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:

扩散模型=进化算法!生物学大佬用数学揭示本质

视频地址:https://youtu.be/RjD1aLm4Thg

在ALife 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。

这位懂计算机的生物学专家是如何理解「扩散模型就是进化算法」的?

答案是数学。

扩散模型的本质

在生物圈中,至少有两个过程能够泛化并创造新事物:

进化:生物通过自然选择适应环境的缓慢过程(需要多代); 学习:生物个体获取知识并概括主观经验的快速过程(自己这一代)。

研究者不断探索进化与学习之间的联系,从Hinton的经典著作《How Learning Can Guide Evolution》(1987年),到Vanchurin、Wolf、Katsnelson、Koonin的《Toward a theory of evolution as multilevel learning》(2022年),以及Watson和Levin的《The collective intelligence of evolution and development》(2023年)。

扩散模型=进化算法!生物学大佬用数学揭示本质

目前的工作认为,在扩散模型的框架中,生成模型执行顺序随机去噪,可以通过执行自然选择、突变和生殖隔离的进化过程来理解。

前向扩散过程将图像作为输入(也可以是任何其他信号),并逐步按顺序添加噪声,直到它变成一坨完完全全的噪声。

扩散模型=进化算法!生物学大佬用数学揭示本质

与之相对,扩散模型的反向是一个去噪的过程,以噪声作为输入并依次去除,最终发掘出隐藏在噪声背后的图像。

扩散模型=进化算法!生物学大佬用数学揭示本质

原始扩散模型:https://arxiv.org/abs/2006.11239

想象一个复杂的任务(例如,找到飞机机翼的最佳形状),我们可以先创建一组随机解决方案——就像自然界中的生物种群。然后根据特定标准(比如飞行情况)评估每个解决方案。

过程中可以「杂交」不同解决方案的优势(从一个方案中获取一些参数,从另一个方案中获取另一些参数),偶尔还可以随机改变这些方案(的参数),由此获得新一版解决方案。

扩散模型=进化算法!生物学大佬用数学揭示本质

将这个过程重复多次,就像在自然选择中一样,通过遗传和变异,更成功的版本存活下来并继续发展。

通常,参数空间的结构事先是未知的,因此初始总体通常以标准正态分布开始。这种方法的主要优点是它不需要精确理解任务的工作原理——只需能够评估解决方案的质量就足够了。

扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型在每个时间步长直接从样本的噪声中预测原始数据样本:

扩散模型=进化算法!生物学大佬用数学揭示本质

样本x的估计可以表示为条件概率,结合贝叶斯公式可得:

扩散模型=进化算法!生物学大佬用数学揭示本质

基于深度学习的扩散模型是使用均方误差损失进行训练的,所以估计函数变为:

扩散模型=进化算法!生物学大佬用数学揭示本质

其中的高斯项仅对局部邻居敏感,将上式简化:

扩散模型=进化算法!生物学大佬用数学揭示本质

由此可知,扩散模型和进化算法都涉及迭代数据更新和从复杂分布中对新对象进行采样,两者都是定向更新和随机扰动的组合。

在进化的情况下,是选择+突变,而在扩散的情况下,是随机噪声+学习去噪。

这就提出了一个问题:这两个过程的机制是否从根本上相互关联?生物进化和生成建模之间是否存在深刻的数学二元性?

扩散与进化

首先,作者从生成模型的角度分析了进化。

观察生物圈中的物种种群,变异进化过程可以理解为基因型和表型分布的转变。突变和选择共同改变了这些分布的形状。

许多受生物启发的进化算法都是通过维护和迭代大量种群的分布,来优化目标函数。

同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。

另一方面,也可以从进化的角度来看待扩散。

在训练过程中,向数据点逐步加入干扰,模型会学习预测这种干扰以逆转该过程。在采样阶段,模型从高斯分布开始,通过降噪逐步更新数据点。

在这种情况下,定向降噪可以解释为有向选择,并且每个步骤都会增加一个类似于突变的小噪声,与生物的进化过程一致。

而如果把进化过程反过来,那么高度适应自然的进化种群将逐渐溶解,类似于正向扩散过程。

考虑统计物理学中的能量和概率,进化任务可以将适应度映射到概率密度,从而来与生成任务联系起来(高适应度对应于高概率密度)。

扩散模型=进化算法!生物学大佬用数学揭示本质

作者最终从数学上推导出了一种称为Diffusion Evolution的新算法,基于迭代误差校正来进行优化,类似于扩散模型,但不依赖于神经网络:

1)从一组随机解开始(如扩散模型中的噪声); 2)在每个步骤中,每个解决方案都由一个适应度函数评估,对每个解决方案进行「去噪」(与相邻解决方案加权平均来估计),并向前迈出一小步,同时加入一个小的随机突变; 3)逐渐减小相邻搜索半径(首先全局探索解决方案空间,然后在本地进行优化)

与许多经典进化算法通常收敛为单个解不同,Diffusion Evolution可以同时发现并维护多个表现良好的解。

实验

研究人员在多个二维优化场景中进行了实验(Rosenbrock和Beale有一个最优值,Himmelblau、Ackley和Rastrigin有多个最优值),并与其他进化算法(CMA-ES、OpenES和PEPG)做出比较。

扩散模型=进化算法!生物学大佬用数学揭示本质

每种方法运行进化算法100次,每个实验的群体规模为512,使用25次迭代(OpenES需要1000步才能收敛)。

结果表明,Diffusion Evolution找到了高质量和多样化的解决方案,尤其是在最后三种情况下,其他方法都遇到了困难,并且往往收敛到单一解决方案。

扩散模型=进化算法!生物学大佬用数学揭示本质

在进化算法中,适应度评估通常是计算成本最高的操作,作者通过从扩散模型的工作中借用余弦调度来减少迭代次数。

扩散模型=进化算法!生物学大佬用数学揭示本质

在另一项实验中,研究人员提出了 Latent Space Diffusion Evolution,灵感来自潜在空间扩散模型 (通过探索低维潜在空间来解决高维参数空间的问题)。

扩散模型=进化算法!生物学大佬用数学揭示本质

学习和进化,本质上是在做同样的事情,顺着这条路,我们可以继续思考:

模型推理是有限的,而真正的进化可能是无限且开放式的,如何使Diffusion Evolution适应开放式环境?

其他版本的扩散模型会衍生出新的进化算法吗?扩散模型中的归纳偏差可以被引入进化算法吗?扩散模型可以通过进化的思想来改进吗?

参考资料:

https://gonzoml.substack.com/p/diffusion-models-are-evolutionary

https://arxiv.org/pdf/2410.02543

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-25 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI会比人类更懂宇宙吗
...认知和决策能力,但是这种技术路线需要解决很多复杂的生物学和神经科学问题,并且模型的构建和训练也需要大量的计算资源,目前还在探索之中。实现“AI理解宇宙”的目标尚面临诸多困难“
2023-07-31 03:46:00
基因测序、生物打印机……数字生命其实没那么遥远
...于模拟植物真实生长过程自上世纪60年代,多位计算机与生物学领域的专家基于自身的研究,进行了数字生命的相关实验,并提出了“磁芯大战”、“L系统”、“生物形态”等重要的理论与思想
2023-02-02 07:00:00
分子之心公布达尔文大模型新进展
...力图高精度、低门槛、高通用性地满足创新药设计、合成生物学等真实产业应用需求,大幅提升蛋白质设计的效率和成功率。NewOrigin大模型基于条件生成机制,联合使用AI、分子动力
2023-09-22 11:08:00
继 AI 绘画、AI 聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质
...有特定氨基酸序列的分子,因其空间结构的不同,决定了生物学功能的差异。因此,当天然蛋白结构功能,不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要对其结构进行设计。然
2023-02-24 01:00:00
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...的过程,进而具备预测能力。宋乐博士指出:“尽管这些生物学领域的数据在过去的十年中呈现出爆发式增长,但小工具难以实现数据的挖掘和应用。”二是通过提升化合物合成和筛选的准确率及可
2023-03-15 09:26:00
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...那么就来仔细看看,这次的ESM3具体有哪些新内容?ESM3:生物学的前沿语言模型生命科学并不像我们想象的那般神秘莫测、不可捉摸。蛋白质分子虽然有难以置信的多样性和动态变化,但
2024-06-27 09:31:00
AI蛋白质折叠:在生命宇宙中漫游,远眺生物经济的流光
...结构研究开启先河。然而直到半个世纪后的1959年,英国生物学家马克斯·佩鲁茨(Max Perutz)和约翰·肯德鲁(John C
2024-09-18 15:04:00
南科大研制出“新一代变形金刚”
...境污染、能源消耗的效果。 据戴建生介绍,1998年,他从生物学原理提出“Metamorphic Mechanisms”
2024-04-08 06:57:00
「分子之心」获凯赛生物超亿元战略投资,研发蛋白质设计领域的ChatGPT | 36氪首发
...设计平台「分子之心」近日完成超亿元战略融资,由合成生物学上市公司凯赛生物(688065.SH)领投,联想创投跟投,天使轮领投方红杉中国追加投资
2023-02-20 08:53:00
更多关于科技的资讯:
3亿人参与冰雪运动后,天猫打造“雪上空港”再燃冰雪经济
12月25日,在距离北京市中心200公里的崇礼雪场,天猫打造了一场沉浸式冰雪大秀,在云顶雪场Big Air大跳台,交响乐团现场演奏与专业滑手大跳台专业表演交织
2025-12-30 11:05:00
火炬高新区已培育上百家国家级专精特新“小巨人”企业
厦门网讯(厦门日报记者 林露虹 通讯员 管轩 雷飏 陈晓敏)如果要衡量区域的科创硬实力和发展后劲,专精特新“小巨人”企业的集聚度无疑是一个关键指标
2025-12-30 08:16:00
浙江日报讯 (记者 沈超 石磊 共享联盟·金华开发区 俞夏冰) 知识产权路演,是促进创新成果从实验室走向市场的关键一招
2025-12-30 08:39:00
野蛮生长近二十年的充电宝行业,不到半年就掉进了漩涡。据了解,工信部已于10月及11月多次组织召开《移动电源安全技术规范》征求意见稿研讨会
2025-12-30 08:40:00
在贵州省贵阳市的繁华商圈中,一家传统与现代相结合的特殊金融机构正悄然改变着人们对典当行业的刻板印象。贵州中泰星诚典当有限公司凭借其专业化
2025-12-30 08:52:00
OceanBase杨冰:技术产品领导者,如何“进化”为全球经营者?
第17个双11大促如期而至,淘宝天猫等平台热度依旧。在预售、开售等关键节点,数亿用户瞬时涌入,带来数据量的飙升,但消费者无论是浏览
2025-12-30 10:20:00
乌江榨菜上榜餐企食材供应商百强,成餐饮供应核心力量
近日,艾媒咨询发布的《2025 年中国餐企食材供应商百强榜》引发行业广泛关注,重庆市涪陵榨菜集团(乌江榨菜母公司)凭借其在餐饮领域的深耕成果
2025-12-30 10:20:00
外卖骑手、上门保洁、居家收纳 临近年底,零工岗位薪资整体上涨
年关临近,有人回家团圆,也有人趁机赚钱。“12月起,各大企业陆续放出过年的零工岗位,一直到春节前15天左右,都会是零工市场的火热招工期
2025-12-30 09:10:00
近三十年坚守“足米足重”:一个河北品牌的诚信故事与全球化征程
在商业的洪流中,“诚信”二字显得尤为珍贵。安加集团自1996年成立以来,始终秉持着“足米足重,诚信为本”的经营理念,在国内外市场上书写了一段又一段令人动容的品牌故事
2025-12-30 09:50:00
现场评|体验焕新激发消费新活力
12月23日上午10时,虽是工作日,石家庄裕华万达广场二楼却十分热闹。京东七鲜超市石家庄首店内,收银处排起长队。62岁的刘阿姨推着购物车
2025-12-30 08:05:00
近日,在杭州云栖小镇一个新建的试验室内,一台人形机器人正行走在环形测试道上,脚下的路面在钢板、沙地、草地等环境中不断切换
2025-12-30 08:08:00
河北新闻网讯(张婧)近日,开滦股份吕家坨矿洗煤厂重介介质自动化添加改造项目落地,以PLC控制系统替代人工操作,实现了从浓介质制备
2025-12-29 21:32:00
■王心怡摘要:数字化转型已成为推动航空业实现高质量发展的重要路径。地勤服务作为航空公司运行体系中直接面向旅客的关键环节
2025-12-30 04:42:00
理想、夸克 等AI 眼镜 “一镜难求” 发货排到明年 2 月!
大皖新闻讯 近期,多名购买了理想AI眼镜 Livis等产品的消费者向大皖新闻反映称,购买的AI眼镜一再被推迟发货,预计发货时效从2025年年底延期至2026年2月26日前
2025-12-29 23:09:00


Fatal error: Uncaught Error: mysqli object is already closed in /appdata/www/td.fyun.cc/libs/class.db.php:64 Stack trace: #0 /appdata/www/td.fyun.cc/libs/class.db.php(64): mysqli->close() #1 /appdata/www/td.fyun.cc/index.php(78): DBObject->__destruct() #2 {main} thrown in /appdata/www/td.fyun.cc/libs/class.db.php on line 64