• 我的订阅
  • 科技

扩散模型=进化算法!生物学大佬用数学揭示本质

类别:科技 发布时间:2024-11-25 09:56:00 来源:新智元

扩散模型=进化算法!生物学大佬用数学揭示本质

【新智元导读】扩散模型的本质竟是进化算法!生物学大佬从数学的角度证实了这个结论,并结合扩散模型创建了全新的进化算法。

扩散模型居然就是生物的进化算法!

这个结论来自「新常春藤」塔夫茨大学(Tufts University)于近日发表的一项研究:

扩散模型=进化算法!生物学大佬用数学揭示本质

论文地址:https://arxiv.org/pdf/2410.02543

论文的压轴大佬是美国发育和合成生物学家Michael Levin,博士毕业于哈佛大学,目前担任塔夫茨大学Allen Discovery Center主任。

Michael Levin长期从事生物电、人工生命和许多其他生物学相关主题的研究,曾在NeurIPS 2018上发表了题为「What Bodies Think About:Bioelectric Computation Outside the Nervous System」的精彩演讲:

扩散模型=进化算法!生物学大佬用数学揭示本质

视频地址:https://youtu.be/RjD1aLm4Thg

在ALife 2020上,Michael Levin还阐述了有关「机器人癌症」的话题:「what the bioelectrics of embryogenesis and regeneration can teach us about unconventional computing, cognition, and the software of life」。

这位懂计算机的生物学专家是如何理解「扩散模型就是进化算法」的?

答案是数学。

扩散模型的本质

在生物圈中,至少有两个过程能够泛化并创造新事物:

进化:生物通过自然选择适应环境的缓慢过程(需要多代); 学习:生物个体获取知识并概括主观经验的快速过程(自己这一代)。

研究者不断探索进化与学习之间的联系,从Hinton的经典著作《How Learning Can Guide Evolution》(1987年),到Vanchurin、Wolf、Katsnelson、Koonin的《Toward a theory of evolution as multilevel learning》(2022年),以及Watson和Levin的《The collective intelligence of evolution and development》(2023年)。

扩散模型=进化算法!生物学大佬用数学揭示本质

目前的工作认为,在扩散模型的框架中,生成模型执行顺序随机去噪,可以通过执行自然选择、突变和生殖隔离的进化过程来理解。

前向扩散过程将图像作为输入(也可以是任何其他信号),并逐步按顺序添加噪声,直到它变成一坨完完全全的噪声。

扩散模型=进化算法!生物学大佬用数学揭示本质

与之相对,扩散模型的反向是一个去噪的过程,以噪声作为输入并依次去除,最终发掘出隐藏在噪声背后的图像。

扩散模型=进化算法!生物学大佬用数学揭示本质

原始扩散模型:https://arxiv.org/abs/2006.11239

想象一个复杂的任务(例如,找到飞机机翼的最佳形状),我们可以先创建一组随机解决方案——就像自然界中的生物种群。然后根据特定标准(比如飞行情况)评估每个解决方案。

过程中可以「杂交」不同解决方案的优势(从一个方案中获取一些参数,从另一个方案中获取另一些参数),偶尔还可以随机改变这些方案(的参数),由此获得新一版解决方案。

扩散模型=进化算法!生物学大佬用数学揭示本质

将这个过程重复多次,就像在自然选择中一样,通过遗传和变异,更成功的版本存活下来并继续发展。

通常,参数空间的结构事先是未知的,因此初始总体通常以标准正态分布开始。这种方法的主要优点是它不需要精确理解任务的工作原理——只需能够评估解决方案的质量就足够了。

扩散模型=进化算法!生物学大佬用数学揭示本质

扩散模型在每个时间步长直接从样本的噪声中预测原始数据样本:

扩散模型=进化算法!生物学大佬用数学揭示本质

样本x的估计可以表示为条件概率,结合贝叶斯公式可得:

扩散模型=进化算法!生物学大佬用数学揭示本质

基于深度学习的扩散模型是使用均方误差损失进行训练的,所以估计函数变为:

扩散模型=进化算法!生物学大佬用数学揭示本质

其中的高斯项仅对局部邻居敏感,将上式简化:

扩散模型=进化算法!生物学大佬用数学揭示本质

由此可知,扩散模型和进化算法都涉及迭代数据更新和从复杂分布中对新对象进行采样,两者都是定向更新和随机扰动的组合。

在进化的情况下,是选择+突变,而在扩散的情况下,是随机噪声+学习去噪。

这就提出了一个问题:这两个过程的机制是否从根本上相互关联?生物进化和生成建模之间是否存在深刻的数学二元性?

扩散与进化

首先,作者从生成模型的角度分析了进化。

观察生物圈中的物种种群,变异进化过程可以理解为基因型和表型分布的转变。突变和选择共同改变了这些分布的形状。

许多受生物启发的进化算法都是通过维护和迭代大量种群的分布,来优化目标函数。

同样的概念(分布变换)是许多生成模型的核心:VAE、GAN和扩散模型学习将简单的分布(如标准的高斯分布)转换为更复杂的分布(分布中的样本代表有意义的图像、声音和文本)。

另一方面,也可以从进化的角度来看待扩散。

在训练过程中,向数据点逐步加入干扰,模型会学习预测这种干扰以逆转该过程。在采样阶段,模型从高斯分布开始,通过降噪逐步更新数据点。

在这种情况下,定向降噪可以解释为有向选择,并且每个步骤都会增加一个类似于突变的小噪声,与生物的进化过程一致。

而如果把进化过程反过来,那么高度适应自然的进化种群将逐渐溶解,类似于正向扩散过程。

考虑统计物理学中的能量和概率,进化任务可以将适应度映射到概率密度,从而来与生成任务联系起来(高适应度对应于高概率密度)。

扩散模型=进化算法!生物学大佬用数学揭示本质

作者最终从数学上推导出了一种称为Diffusion Evolution的新算法,基于迭代误差校正来进行优化,类似于扩散模型,但不依赖于神经网络:

1)从一组随机解开始(如扩散模型中的噪声); 2)在每个步骤中,每个解决方案都由一个适应度函数评估,对每个解决方案进行「去噪」(与相邻解决方案加权平均来估计),并向前迈出一小步,同时加入一个小的随机突变; 3)逐渐减小相邻搜索半径(首先全局探索解决方案空间,然后在本地进行优化)

与许多经典进化算法通常收敛为单个解不同,Diffusion Evolution可以同时发现并维护多个表现良好的解。

实验

研究人员在多个二维优化场景中进行了实验(Rosenbrock和Beale有一个最优值,Himmelblau、Ackley和Rastrigin有多个最优值),并与其他进化算法(CMA-ES、OpenES和PEPG)做出比较。

扩散模型=进化算法!生物学大佬用数学揭示本质

每种方法运行进化算法100次,每个实验的群体规模为512,使用25次迭代(OpenES需要1000步才能收敛)。

结果表明,Diffusion Evolution找到了高质量和多样化的解决方案,尤其是在最后三种情况下,其他方法都遇到了困难,并且往往收敛到单一解决方案。

扩散模型=进化算法!生物学大佬用数学揭示本质

在进化算法中,适应度评估通常是计算成本最高的操作,作者通过从扩散模型的工作中借用余弦调度来减少迭代次数。

扩散模型=进化算法!生物学大佬用数学揭示本质

在另一项实验中,研究人员提出了 Latent Space Diffusion Evolution,灵感来自潜在空间扩散模型 (通过探索低维潜在空间来解决高维参数空间的问题)。

扩散模型=进化算法!生物学大佬用数学揭示本质

学习和进化,本质上是在做同样的事情,顺着这条路,我们可以继续思考:

模型推理是有限的,而真正的进化可能是无限且开放式的,如何使Diffusion Evolution适应开放式环境?

其他版本的扩散模型会衍生出新的进化算法吗?扩散模型中的归纳偏差可以被引入进化算法吗?扩散模型可以通过进化的思想来改进吗?

参考资料:

https://gonzoml.substack.com/p/diffusion-models-are-evolutionary

https://arxiv.org/pdf/2410.02543

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-11-25 12:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

AI会比人类更懂宇宙吗
...认知和决策能力,但是这种技术路线需要解决很多复杂的生物学和神经科学问题,并且模型的构建和训练也需要大量的计算资源,目前还在探索之中。实现“AI理解宇宙”的目标尚面临诸多困难“
2023-07-31 03:46:00
基因测序、生物打印机……数字生命其实没那么遥远
...于模拟植物真实生长过程自上世纪60年代,多位计算机与生物学领域的专家基于自身的研究,进行了数字生命的相关实验,并提出了“磁芯大战”、“L系统”、“生物形态”等重要的理论与思想
2023-02-02 07:00:00
分子之心公布达尔文大模型新进展
...力图高精度、低门槛、高通用性地满足创新药设计、合成生物学等真实产业应用需求,大幅提升蛋白质设计的效率和成功率。NewOrigin大模型基于条件生成机制,联合使用AI、分子动力
2023-09-22 11:08:00
继 AI 绘画、AI 聊天后,没学过生物的「门外汉」也能「一键生成」蛋白质
...有特定氨基酸序列的分子,因其空间结构的不同,决定了生物学功能的差异。因此,当天然蛋白结构功能,不能满足工业或医疗应用需求时,想要得到特定的功能蛋白,就需要对其结构进行设计。然
2023-02-24 01:00:00
对话百图生科首席AI科学家宋乐博士:“xTrimo”生命科学AI大模型,不应止于加速药物研发
...的过程,进而具备预测能力。宋乐博士指出:“尽管这些生物学领域的数据在过去的十年中呈现出爆发式增长,但小工具难以实现数据的挖掘和应用。”二是通过提升化合物合成和筛选的准确率及可
2023-03-15 09:26:00
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...那么就来仔细看看,这次的ESM3具体有哪些新内容?ESM3:生物学的前沿语言模型生命科学并不像我们想象的那般神秘莫测、不可捉摸。蛋白质分子虽然有难以置信的多样性和动态变化,但
2024-06-27 09:31:00
AI蛋白质折叠:在生命宇宙中漫游,远眺生物经济的流光
...结构研究开启先河。然而直到半个世纪后的1959年,英国生物学家马克斯·佩鲁茨(Max Perutz)和约翰·肯德鲁(John C
2024-09-18 15:04:00
南科大研制出“新一代变形金刚”
...境污染、能源消耗的效果。 据戴建生介绍,1998年,他从生物学原理提出“Metamorphic Mechanisms”
2024-04-08 06:57:00
「分子之心」获凯赛生物超亿元战略投资,研发蛋白质设计领域的ChatGPT | 36氪首发
...设计平台「分子之心」近日完成超亿元战略融资,由合成生物学上市公司凯赛生物(688065.SH)领投,联想创投跟投,天使轮领投方红杉中国追加投资
2023-02-20 08:53:00
更多关于科技的资讯:
视频摄制:冯阳 霍艳恩 赵新宇 王思宁
2026-03-07 10:02:00
中国青年医师IP孵化计划在杭州启动
2026年3月5日,以“AI链全球 生态共生”为主题的中国青年医师IP孵化计划在杭州启动。本次活动来自全国多所医院的专家
2026-03-07 10:40:00
租金两块钱一分钟 “共享机器人”即将入驻杭州商场、电影院
星枢智能的“机器人家族” 记者 杨亦淇 摄一台售价20多万元的春晚同款人形机器人,现在花5000元就能租一天;如果是基础款
2026-03-07 08:05:00
摘要:随着信息技术的快速发展,人工智能技术逐渐渗透金融机构的各类业务与管理环节,对传统金融运作模式产生了深刻影响。金融机构在激烈竞争和成本约束的背景下
2026-03-07 05:46:00
近日,省应急管理厅举行“AI+工业企业火情预警(火眼哨兵)”“AI+烟花爆竹监管(烟花卫士)”应用上线发布仪式。浙江拥有30余万家工业企业
2026-03-07 07:34:00
视频摄制:张晶、赵新宇、朱泊宇
2026-03-07 07:47:00
今年的全国两会上,“一人公司”(One Person Company,简称OPC)成为代表委员们热议的话题。全国人大代表
2026-03-07 07:04:00
2026年全国两会正式开幕,全国政协委员、京东集团技术委员会主席、京东云总裁曹鹏围绕人工智能产业发展建言献策。他建议,推动我国AI产业实现从规模扩张到效能提升
2026-03-06 22:56:00
编者按:从生力军天创机器人开始,《大众证券报》明镜财经工作室记者将陆续探访在各种应用场景解决着实际问题的南京机器人企业
2026-03-06 22:56:00
从平台赋能到标杆涌现:青岛崂山区打造OPC创业首选地
鲁网3月6日讯2026年,是“一人公司”(OPC)从概念走向规模化实践的关键之年。当这一新型创业范式成为科创发展新风口
2026-03-06 20:12:00
【宅男财经|专家面对面】据央视新闻报道,十四届全国人大四次会议今天(6日)举行经济主题记者会。商务部部长王文涛在会上表示
2026-03-06 21:54:00
从手工“制茶”到数据“智茶”:竹叶青展现AI时代品质新解法
在中国古老的传统产业版图中,茶产业无疑是最具代表性,却又最难被现代化改造的堡垒之一。长期以来,非标化、依赖人工经验、产业链条冗长等痛点
2026-03-06 17:21:00
全球AI迈向“办事时代”,千问持续推进AI生活服务落地
3月6日,千问宣布持续投入“AI办事”,用户可以让AI一句话下单各类生活服务,享受AI办事带来的便捷和立减实惠。进入2026年
2026-03-06 18:54:00
三联家电洪楼店店庆盛典3.07火热开启!
鲁网3月6日讯春暖花开,焕新正当时!一年一度,三联家电洪楼店将于3月7日至3月15日隆重举办店庆盛典,为广大消费者带来一场诚意十足
2026-03-06 17:08:00
2025ITEC颁奖典礼在京举行 半导体AI创新成果引关注
2月4日,第十三届朝阳国际人才创业大会(ITEC2025)创新峰会在北京举办,大会全球创业赛获奖名单同期正式揭晓——“人工智能在半导体制造的应用与研究”项目凭借核心技术突破与产业化落地实效
2026-03-06 14:10:00