• 我的订阅
  • 科技

AI能生成超越自然界的新型蛋白质,可用于制造特定机械性能材料

类别:科技 发布时间:2023-04-24 20:48:00 来源:浅语科技

蛋白质是生命的基础,也是许多新型材料的灵感来源。然而,自然界中已知的蛋白质只是冰山一角,还有无数未被发现的蛋白质等待探索。如何快速有效地设计出具有特定结构和功能的新型蛋白质,是一个巨大的挑战。

AI能生成超越自然界的新型蛋白质,可用于制造特定机械性能材料

为了解决这个问题,麻省理工学院(MIT)的研究人员利用人工智能技术,开发了一种能够生成超越自然界的新型蛋白质的方法。他们创建了一种基于机器学习的算法,可以根据预设的结构目标,预测出能够形成相应蛋白质的氨基酸序列。这些序列既有一定的与已知蛋白质相似的程度,又有一定的创新性和独特性。这些蛋白质可用于制造具有特定机械性能(如刚度或弹性)的材料,从而取代作为原料的石油或陶瓷,会大大减少碳足迹。

这项研究将于近期发表在最新一期《化学》杂志上,该研究的高级作者是MIT工程学院教授、土木与环境工程系和机械工程系教授、MIT-IBM沃森人工智能实验室成员马库斯・布勒(MarkusBuehler)。他表示,这种方法可以为各种应用领域提供新的解决方案,比如生物医学、材料科学、食品保鲜等。他说:“在超越自然界的蛋白质方面,这是一个巨大的设计空间,不能用人工的方法来解决。我们需要理解生命的语言,如何用DNA编码氨基酸,以及它们如何组合成蛋白质结构。在深度学习出现之前,这是不可能做到的。”

该研究的合作者还有布勒实验室的博士后研究员倪博(BoNi)和塔夫茨大学(TuftsUniversity)生物工程系教授、工程学院院长大卫・卡普兰(DavidKaplan)。利用新型机器学习模型

蛋白质是由氨基酸串联而成的长链,这些链会折叠成三维的形状。氨基酸的顺序决定了蛋白质的结构特征,而结构特征又影响了蛋白质的力学性能。虽然科学家们已经发现了数千种经过自然选择形成的蛋白质,但他们估计还有很多氨基酸序列没有被发现。

为了加速蛋白质发现的过程,科学家们最近设计了一些深度学习模型,可以根据给定的氨基酸序列预测出相应的蛋白质三维结构。然而,反过来,根据给定的结构目标预测出相应的氨基酸序列,却是一个更复杂的问题。

布勒和他的同事们能够应对这个难题,是因为他们利用了一种新型的机器学习模型,叫做基于注意力的扩散模型(IT之家注:attention-baseddiffusionmodel)。布勒解释说,基于注意力的模型对于蛋白质设计非常重要,因为它们可以学习和捕捉长距离的关系。这在蛋白质中很常见,因为一个很长的氨基酸序列中的一个突变,可能会对整个设计产生很大的影响。

扩散模型的学习过程是通过给训练数据添加“噪声”,然后再去除“噪声”来恢复原始数据。这些模型能够生成高质量和逼真的数据,而且可以根据特定的设计目标进行调节。因此,它们比其他模型更适合满足设计要求。

利用这种架构,研究人员开发了两种机器学习模型,能够预测出满足特定结构目标的氨基酸序列。布勒说,在生物医学领域,拥有一个完全未知的蛋白质可能会带来问题,因为它的性质不太清楚。但是,在一些应用中,可能需要设计出一种与自然界中存在的蛋白质具有相似特性但不同功能的新型蛋白质。通过使用他们开发的模型,可以生成一系列的蛋白质,并通过调整一些参数来控制它们的设计,从而实现定制化的需求。

蛋白质中不同的氨基酸折叠模式,称为二级结构,会导致不同的力学性能。比如,具有α-螺旋结构的蛋白质往往具有弹性,而具有β-折叠结构的蛋白质通常比较刚性。在一个蛋白质中同时结合α-螺旋和β-折叠结构,可以创造出既有弹性又有强度的材料,就像丝绸一样。

研究人员创建了两种模型,一种是在整体结构层面上工作的,另一种是在氨基酸层面上工作的。两种模型都可以组合氨基酸来生成蛋白质。在第一种模型中,用户只需要输入想要的不同结构的百分比,比如40%的α-螺旋和60%的β-折叠,模型就会生成满足这些要求的序列。在第二种模型中,用户不仅要指定百分比,还要指定氨基酸结构的顺序,从而对最终产品有更大的控制力。

为了验证生成的蛋白质是否符合预期的规格,研究人员将开发的模型与一个可以预测蛋白质折叠情况的算法相连。他们用这个算法来确定生成蛋白质的三维结构,然后计算出相应的力学性能,并与预设的设计要求进行比较。这使得他们能够验证设计的蛋白质是否满足期望的规格。创新而可靠的设计

为了评估他们的模型的有效性,研究人员将新生成的蛋白质与具有相似结构特性的已知蛋白质进行了比较。他们发现,许多生成的蛋白质与已知的氨基酸序列有大约50%到60%的重合度,表明它们是可合成的。此外,模型还产生了完全新的序列,显示了它们设计新型蛋白质的能力。

布勒说,生成和已知蛋白质之间的相似度程度表明,设计的蛋白质很可能是现实的,也是可合成的。为了验证设计蛋白质的可靠性,研究人员试图用一些物理上不可能的设计目标来欺骗模型。然而,模型并没有产生不太可能的蛋白质,而是生成了最接近可行解决方案的蛋白质。这个结果表明,模型是健壮的,即使给出不切实际的设计规范,也能找到最接近可行的解决方案。

倪博指出,机器学习算法能够发现自然界中隐藏的关系。这种能力给研究人员提供了信心,认为生成的蛋白质很可能是现实的,也是可合成的。

在下一步中,研究人员打算通过在实验室中合成它们来验证一些新设计的蛋白质。此外,他们还计划进一步改进和完善他们的模型,使它们能够设计出满足更多条件的氨基酸序列,比如特定的生物功能。

最终目标是开发一个多功能的平台,可以生成各种各样的蛋白质设计,用于各种应用领域,包括生物医学和材料科学。布勒强调说,这些应用领域需要超越自然界所提供的解决方案,比如可持续性、医药、食品、健康和材料设计等。因此,新开发的设计工具可以在解决这些问题中发挥重要作用。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-25 13:45:31

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

本文转自:科技日报AI生成超越自然界的新蛋白质可用于制造特定机械性能材料科技日报北京4月23日电 (记者张梦然)美国研究人员使用人工智能(AI)来设计超越自然界的新蛋白质。他们开
2023-04-24 01:36:00
模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
...理,团队还在实验中发现,它设计的新蛋白质相当于模拟自然界5亿年的进化。继AlphaFold 3更新后,我们又看到了一个生命科学领域的大模型ESM3
2024-06-27 09:31:00
AI蛋白质折叠:在生命宇宙中漫游,远眺生物经济的流光
...卷在人们眼前逐渐展开:利用AI去设计蛋白质(而不是在自然界中挑选蛋白质)、生产契合人类需求的蛋白质产品,如药物、食品、调味品、新材料、营养保健品、化妆品等,进而推动现有以高污
2024-09-18 15:04:00
生成式AI大模型:有望实现生命从头设计
...》也引起科技界轰动。这篇文章用生成式AI大模型生成了自然界中从来没有存在过的蛋白质分子,并经实验验证获得了蛋白质的三维分子结构。为什么这项研究会引起科技界的轰动?首先,之前的
2023-12-25 05:45:00
“ChatGPT们”改变新药研发,高质量数据哪里来?
...据,在新一代的生成式AI基础上,我们真的可以生成之前自然界完全不存在的新的蛋白,不止是蛋白,还包括其他的一些核酸生物大分子。我们将AI或数字化计算在生命科学里的应用分成至少两
2023-02-22 08:00:00
...经网络设计了数百万个新的CRISPR蛋白序列,这些序列属于自然界中发现的数十个不同的蛋白质家族。为验证人工智能设计的CRISPR是否为真正的基因编辑器
2024-05-06 06:37:00
科学家利用神经网络设计全新蛋白质
...种优势结合起来,不仅可预测现有蛋白质特性,还可设想自然界尚未设计出的新蛋白质。蛋白质通过构建块的独特排列来执行大量生物任务。将这个几乎无限的排列库转化为各自的功能,就可让研究
2023-08-30 00:56:00
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...在化学工程领域,能充当各种反应的关键催化剂。不过,自然界的蛋白质,通常需要经过工程改造,提高它的活性、热稳定性、对极端 PH 环境和恶劣溶剂的耐受性等多种指标之后,才能在各类
2024-05-07 09:24:00
美泰双键v脸提拉饮:自然界的奢华品!
...养品中脱颖而出,成为了众多爱美人士的新宠。鱼子酱:自然界的奢华馈赠提及鱼子酱,人们首先想到的是其作为高端美食的尊贵地位。然而,在美泰双键V脸提拉饮中,鱼子酱的角色远不止于此。
2024-07-16 01:50:00
更多关于科技的资讯:
【红色导师·思想汇报60】以青春之我,奔赴人工智能浪潮下的时代之约
思想汇报:“人工智能是引领新一轮科技革命和产业变革的战略性技术。”今年暑假,我作为华中农业大学经济管理学院“数智商途”暑期社会实践团队的队长
2025-08-29 14:52:00
临沂首届“何为精工”高端私宅精工论坛启幕,精工专委会同步成立
8月27日至28日,临沂首届“何为精工”高端私宅精工论坛在居然之家北城店盛大启幕。论坛由临沂室内设计师协会主办,汇聚建筑
2025-08-29 14:52:00
从“一瓶酒”到“一头牛”:海普数智为传统产业装上“数据引擎”
在氤氲的酱酒香里,一粒粒红缨子高粱正被赋予数字身份,经历着从农田到餐桌的全程溯源;在繁忙的灌装生产线上,一个个智能瓶盖不再只是容器
2025-08-29 14:55:00
央牧乳业:构建全域渠道生态,引领羊乳产业升级新纪元
央牧乳业以“真羊乳,选央牧”为品牌核心,打造中国羊乳产业渠道建设标杆。目前已完成全国5000+龙头商超系统战略布局(含大润发
2025-08-29 14:59:00
鲁网8月29日讯2025年8月,知名学者王立胜等人所著的《胖东来凭什么:一家幸福企业的哲学逻辑》一书由中国民主法制出版社出版发行
2025-08-29 16:03:00
小米升级澎湃OS 3Beta版后手机变得很烫,官方:约3天恢复满血
8月29日,小米澎湃OS官方微博发布答网友问,详细介绍了澎湃OS 3 Beta 后续推送计划,集中回答大家对小米澎湃OS 3 Beta版的高频问题
2025-08-29 16:04:00
拼多多要亲自拍短剧?招聘短剧制片运营,年薪近50万
8月29日消息,拼多多在招聘平台上发布了一则引人注目的招聘信息,招聘“短剧制片运营”岗位,年薪近50万,负责短剧内容制作
2025-08-29 16:05:00
【2025数博会】可信数据空间破解数据要素流通难题
8月28日,2025中国国际大数据产业博览会上,行业专家与企业代表聚焦可信数据空间建设及数据要素市场化发展开展深度交流
2025-08-29 16:29:00
浙江卫视×浙江文交所 联手打造全球首个爆款综艺文化数字资产
综艺史上的首次突破!浙江文化产权交易所携手Z视介,联手打造的浙江卫视全球首张综艺数字卡,8月29日重磅上线浙江文交所旗下乐数通平台
2025-08-29 16:30:00
对话领航者--滨高电梯朱海涛:成立换新体验中心 业务聚焦两大领域
鲁网8月29日讯近日,齐鲁商势力联盟对话领航者走进滨州市滨高电梯销售有限公司日立换新体验中心,与公司负责人朱海涛面对面
2025-08-29 16:40:00
贵安超算中心:每秒1.3亿亿次的峰值算力助力影视项目渲染
2025年暑期档光影盛宴的背后,贵安超算中心功不可没:参与《猫和老鼠:星盘奇缘》《刺杀小说家2》《731》等12部影视项目渲染
2025-08-29 17:00:00
【2025数博会】虚拟F1驱动贵阳打造全球数字体育新生态
虚拟F1赛事已从娱乐载体跃升为融合职业竞技、技术研发与商业创新的复合生态系统,成为推动真实F1技术革新与连接尖端科技大众化的核心桥梁
2025-08-29 17:00:00
《辞海》实时更新,与孔子对话 数字出版让传统文化“活”起来
大河网讯(记者 莫韶华)感叹随时随地可查阅,有声、有色、有形的立体“辞书”《辞海》;走进字圣许慎的故里,领略《说文解字》的博大精神和跨越千年的不朽智慧
2025-08-29 17:04:00
破解翻译“失准”难题 提升儿童绘本翻译质量
儿童绘本,是一类以绘画为主,并附有少量文字的书籍。与图画书的区别在于,儿童绘本强调图画与文字的内在关系,两者共同承担着陈述“故事”的重要作用
2025-08-29 17:04:00
滨州绳网部落:围绕“编织”主题,打造集主题乐园、家居产品、儿童玩具于一体的多元化品牌
鲁网8月29日讯为生动展现滨州“5210N”产业集群高质量发展动能,推动品质滨州建设行稳致远,8月29日,滨州市组织召开产业链上的山东好品牌——滨州“5210N”产业集群记者见面会第二场
2025-08-29 17:13:00