• 我的订阅
  • 科技

AI能生成超越自然界的新型蛋白质,可用于制造特定机械性能材料

类别:科技 发布时间:2023-04-24 20:48:00 来源:浅语科技

蛋白质是生命的基础,也是许多新型材料的灵感来源。然而,自然界中已知的蛋白质只是冰山一角,还有无数未被发现的蛋白质等待探索。如何快速有效地设计出具有特定结构和功能的新型蛋白质,是一个巨大的挑战。

AI能生成超越自然界的新型蛋白质,可用于制造特定机械性能材料

为了解决这个问题,麻省理工学院(MIT)的研究人员利用人工智能技术,开发了一种能够生成超越自然界的新型蛋白质的方法。他们创建了一种基于机器学习的算法,可以根据预设的结构目标,预测出能够形成相应蛋白质的氨基酸序列。这些序列既有一定的与已知蛋白质相似的程度,又有一定的创新性和独特性。这些蛋白质可用于制造具有特定机械性能(如刚度或弹性)的材料,从而取代作为原料的石油或陶瓷,会大大减少碳足迹。

这项研究将于近期发表在最新一期《化学》杂志上,该研究的高级作者是MIT工程学院教授、土木与环境工程系和机械工程系教授、MIT-IBM沃森人工智能实验室成员马库斯・布勒(MarkusBuehler)。他表示,这种方法可以为各种应用领域提供新的解决方案,比如生物医学、材料科学、食品保鲜等。他说:“在超越自然界的蛋白质方面,这是一个巨大的设计空间,不能用人工的方法来解决。我们需要理解生命的语言,如何用DNA编码氨基酸,以及它们如何组合成蛋白质结构。在深度学习出现之前,这是不可能做到的。”

该研究的合作者还有布勒实验室的博士后研究员倪博(BoNi)和塔夫茨大学(TuftsUniversity)生物工程系教授、工程学院院长大卫・卡普兰(DavidKaplan)。利用新型机器学习模型

蛋白质是由氨基酸串联而成的长链,这些链会折叠成三维的形状。氨基酸的顺序决定了蛋白质的结构特征,而结构特征又影响了蛋白质的力学性能。虽然科学家们已经发现了数千种经过自然选择形成的蛋白质,但他们估计还有很多氨基酸序列没有被发现。

为了加速蛋白质发现的过程,科学家们最近设计了一些深度学习模型,可以根据给定的氨基酸序列预测出相应的蛋白质三维结构。然而,反过来,根据给定的结构目标预测出相应的氨基酸序列,却是一个更复杂的问题。

布勒和他的同事们能够应对这个难题,是因为他们利用了一种新型的机器学习模型,叫做基于注意力的扩散模型(IT之家注:attention-baseddiffusionmodel)。布勒解释说,基于注意力的模型对于蛋白质设计非常重要,因为它们可以学习和捕捉长距离的关系。这在蛋白质中很常见,因为一个很长的氨基酸序列中的一个突变,可能会对整个设计产生很大的影响。

扩散模型的学习过程是通过给训练数据添加“噪声”,然后再去除“噪声”来恢复原始数据。这些模型能够生成高质量和逼真的数据,而且可以根据特定的设计目标进行调节。因此,它们比其他模型更适合满足设计要求。

利用这种架构,研究人员开发了两种机器学习模型,能够预测出满足特定结构目标的氨基酸序列。布勒说,在生物医学领域,拥有一个完全未知的蛋白质可能会带来问题,因为它的性质不太清楚。但是,在一些应用中,可能需要设计出一种与自然界中存在的蛋白质具有相似特性但不同功能的新型蛋白质。通过使用他们开发的模型,可以生成一系列的蛋白质,并通过调整一些参数来控制它们的设计,从而实现定制化的需求。

蛋白质中不同的氨基酸折叠模式,称为二级结构,会导致不同的力学性能。比如,具有α-螺旋结构的蛋白质往往具有弹性,而具有β-折叠结构的蛋白质通常比较刚性。在一个蛋白质中同时结合α-螺旋和β-折叠结构,可以创造出既有弹性又有强度的材料,就像丝绸一样。

研究人员创建了两种模型,一种是在整体结构层面上工作的,另一种是在氨基酸层面上工作的。两种模型都可以组合氨基酸来生成蛋白质。在第一种模型中,用户只需要输入想要的不同结构的百分比,比如40%的α-螺旋和60%的β-折叠,模型就会生成满足这些要求的序列。在第二种模型中,用户不仅要指定百分比,还要指定氨基酸结构的顺序,从而对最终产品有更大的控制力。

为了验证生成的蛋白质是否符合预期的规格,研究人员将开发的模型与一个可以预测蛋白质折叠情况的算法相连。他们用这个算法来确定生成蛋白质的三维结构,然后计算出相应的力学性能,并与预设的设计要求进行比较。这使得他们能够验证设计的蛋白质是否满足期望的规格。创新而可靠的设计

为了评估他们的模型的有效性,研究人员将新生成的蛋白质与具有相似结构特性的已知蛋白质进行了比较。他们发现,许多生成的蛋白质与已知的氨基酸序列有大约50%到60%的重合度,表明它们是可合成的。此外,模型还产生了完全新的序列,显示了它们设计新型蛋白质的能力。

布勒说,生成和已知蛋白质之间的相似度程度表明,设计的蛋白质很可能是现实的,也是可合成的。为了验证设计蛋白质的可靠性,研究人员试图用一些物理上不可能的设计目标来欺骗模型。然而,模型并没有产生不太可能的蛋白质,而是生成了最接近可行解决方案的蛋白质。这个结果表明,模型是健壮的,即使给出不切实际的设计规范,也能找到最接近可行的解决方案。

倪博指出,机器学习算法能够发现自然界中隐藏的关系。这种能力给研究人员提供了信心,认为生成的蛋白质很可能是现实的,也是可合成的。

在下一步中,研究人员打算通过在实验室中合成它们来验证一些新设计的蛋白质。此外,他们还计划进一步改进和完善他们的模型,使它们能够设计出满足更多条件的氨基酸序列,比如特定的生物功能。

最终目标是开发一个多功能的平台,可以生成各种各样的蛋白质设计,用于各种应用领域,包括生物医学和材料科学。布勒强调说,这些应用领域需要超越自然界所提供的解决方案,比如可持续性、医药、食品、健康和材料设计等。因此,新开发的设计工具可以在解决这些问题中发挥重要作用。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-25 13:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

本文转自:科技日报AI生成超越自然界的新蛋白质可用于制造特定机械性能材料科技日报北京4月23日电 (记者张梦然)美国研究人员使用人工智能(AI)来设计超越自然界的新蛋白质。他们开
2023-04-24 01:36:00
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3
2024-06-27 09:31:00
AI蛋白质折叠:在生命宇宙中漫游,远眺生物经济的流光
...卷在人们眼前逐渐展开:利用AI去设计蛋白质(而不是在自然界中挑选蛋白质)、生产契合人类需求的蛋白质产品,如药物、食品、调味品、新材料、营养保健品、化妆品等,进而推动现有以高污
2024-09-18 15:04:00
生成式AI大模型:有望实现生命从头设计
...》也引起科技界轰动。这篇文章用生成式AI大模型生成了自然界中从来没有存在过的蛋白质分子,并经实验验证获得了蛋白质的三维分子结构。为什么这项研究会引起科技界的轰动?首先,之前的
2023-12-25 05:45:00
“ChatGPT们”改变新药研发,高质量数据哪里来?
...据,在新一代的生成式AI基础上,我们真的可以生成之前自然界完全不存在的新的蛋白,不止是蛋白,还包括其他的一些核酸生物大分子。我们将AI或数字化计算在生命科学里的应用分成至少两
2023-02-22 08:00:00
...经网络设计了数百万个新的CRISPR蛋白序列,这些序列属于自然界中发现的数十个不同的蛋白质家族。为验证人工智能设计的CRISPR是否为真正的基因编辑器
2024-05-06 06:37:00
科学家利用神经网络设计全新蛋白质
...种优势结合起来,不仅可预测现有蛋白质特性,还可设想自然界尚未设计出的新蛋白质。蛋白质通过构建块的独特排列来执行大量生物任务。将这个几乎无限的排列库转化为各自的功能,就可让研究
2023-08-30 00:56:00
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...在化学工程领域,能充当各种反应的关键催化剂。不过,自然界的蛋白质,通常需要经过工程改造,提高它的活性、热稳定性、对极端 PH 环境和恶劣溶剂的耐受性等多种指标之后,才能在各类
2024-05-07 09:24:00
美泰双键v脸提拉饮:自然界的奢华品!
...养品中脱颖而出,成为了众多爱美人士的新宠。鱼子酱:自然界的奢华馈赠提及鱼子酱,人们首先想到的是其作为高端美食的尊贵地位。然而,在美泰双键V脸提拉饮中,鱼子酱的角色远不止于此。
2024-07-16 01:50:00
更多关于科技的资讯: