• 我的订阅
  • 科技

当ChatGPT遇上CRISPR

类别:科技 发布时间:2024-05-06 06:37:00 来源:每日看点快看

本文转自:中国科学报

当ChatGPT遇上CRISPR

人工智能创建基因编辑新工具

本报讯 在探索CRISPR基因编辑系统的过程中,研究人员从温泉、泥炭沼泽、粪便甚至酸奶中搜寻各种微生物。现在,由于生成式人工智能的进步,他们可能只需按一下按钮就能设计出这些系统。

据《自然》报道,日前,研究人员公布了他们使用一种名为蛋白质语言模型的生成式人工智能工具,设计CRISPR基因编辑蛋白质的细节,并证明其中一些系统能够像预期那样工作。

今年2月,另一个团队曾宣布,他们已经开发出一种基于微生物基因组的模型,并用它来设计新的CRISPR系统,后者由DNA或RNA切割酶和RNA分子组成。

“这表明,用机器学习模型设计这些复杂系统是可能的。”美国生物技术公司Profluent首席执行官Ali Madani说。4月22日,Madani团队在预印本服务器bioRxiv上报告了他们“首次成功通过完全用机器学习设计的蛋白质编辑人类基因组”。

中国香港大学合成生物学家Alan Wong表示,自然产生的基因编辑系统在其可以靶向的序列以及可以做出的改变方面存在局限性。因此找到合适的CRISPR可能是一个挑战。“利用人工智能扩大编辑的范围,可能会有所帮助。”他说。

像ChatGPT这样的聊天机器人以现有文本进行训练后处理语言,而设计CRISPR的人工智能则在大量生物数据上进行训练,这些数据往往以蛋白质或基因组序列的形式存在。这一“预训练”步骤的目标是让模型深入了解自然发生的遗传序列,比如哪些氨基酸倾向于组合在一起。然后,这些信息可以应用于创建全新序列的任务。

Madani团队此前开发了蛋白质语言模型ProGen。为了设计新的CRISPR系统,该团队用数百万种不同的CRISPR系统重新训练了一个更新版本的ProGen。

由于CRISPR基因编辑系统不仅包括蛋白质,还包括指定其靶点的RNA分子,于是Madani团队开发了另一个人工智能模型来设计这些“引导RNA”。然后,团队使用神经网络设计了数百万个新的CRISPR蛋白序列,这些序列属于自然界中发现的数十个不同的蛋白质家族。

为验证人工智能设计的CRISPR是否为真正的基因编辑器,该团队合成了与CRISPR-Cas9系统中200多种蛋白质设计相对应的DNA序列。当研究人员将这些序列——Cas9蛋白和“引导RNA”插入人类细胞时,许多基因编辑器能够精确切割基因组中的预期靶点。

最有前景的Cas9蛋白—— 一种名为OpenCRISPR-1的分子,在切割靶向DNA序列方面与广泛使用的细菌CRISPR-Cas9酶一样有效,而且在错误的地方进行的切割要少得多。研究人员还使用OpenCRISPR-1设计创建了一个碱基编辑器。这是一种精确的基因编辑工具,可以改变单个DNA的“字母”。结果显示,它与其他碱基编辑系统一样高效,且不容易出错。

在bioRxiv 2月公布的研究中,由美国斯坦福大学计算生物学家Brian Hie和美国Arc研究所生物工程师Patrick Hsu领导的另一个团队,使用了一种能够生成蛋白质和RNA序列的人工智能模型。这个名为EVO的模型用细菌和古细菌以及其他微生物序列的8万个基因组——总计有3000亿个DNA碱基进行了训练。

Hie和Hsu的团队尚未在实验室测试其设计。但他们预测,该团队设计的一些CRISPR-Cas9系统的结构与天然蛋白质结构相似。

西班牙巴塞罗那分子生物学研究所计算生物学家Noelia Ferruz Capapey说:“这太神奇了。”与一些获得专利授权的基因编辑工具不同,研究人员可以无限制地使用OpenCRISPR-1分子,这令她印象深刻。

Madani说,希望人工智能设计的基因编辑工具比现有CRISPR更适合医学应用。他还希望与开发基因编辑疗法的公司合作,测试人工智能生成的CRISPR。(文乐乐)

相关论文信息:

https://doi.org/10.1101/2024.04.22.590591

https://doi.org/10.1101/2024.02.27.582234

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-05-06 08:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

科技观察|十大科技进展新闻:中国宇宙探索进展神速 世界对“生命”认识深入
...存长达两年的生物材料,从而惠及更多有视力问题的人。人工智能工具正在帮助科学家设计出形状不同于任何自然界结构的蛋白质(图片来源于网络)人工智能加速“原创”新蛋白质设计:随着人工
2023-01-13 23:22:00
Nature重磅研究:AlphaFold绘制病毒「族谱」,揭开身世之谜
...助工具未被发掘的潜力,黄病毒研究只是冰山一角。借助人工智能,其他病毒,甚至很多细胞生物的进化历史都很可能被重写。「我们将用新一代工具重新讲述它们的故事。既然我们现在能看得更远
2024-09-19 13:39:00
生成式AI大模型:有望实现生命从头设计
...安卓设备上原生离线运行。谷歌首席执行官将其描述为“人工智能模型的一次巨大飞跃”。而最近发表在国际顶级期刊《自然》上的论文《用可编程生成模型理解蛋白质空间》也引起科技界轰动。这
2023-12-25 05:45:00
分子之心公布达尔文大模型新进展
...模型NewOrigin(中文名“达尔文”)亮相。会上,汇聚各界人工智能领域高端人才、旨在推进多领域融合和协同创新的“AI百人会”成立,许锦波受聘任副会长。许锦波介绍,NewO
2023-09-22 11:08:00
...因表达的必需过程。研究人员表示,一般来说,单个人类蛋白质由单一基因编码,密切相关的蛋白质可能由位于不同染色体位置的不同基因编码。然而,就ELOA3而言,位于同一基因位点的多个
2023-11-28 02:47:00
分子生物学界核弹级消息!全球首个基因编辑器开源,AI成功编辑人类DNA【附基因编辑行业前景】
...引来了一个核弹级消息,AI 成功改写人类 DNA。近年来,人工智能领域的飞速发展为基因编辑器的进化带来了新的可能性
2024-04-26 10:13:00
上海交大团队研发通用人工智能,解决传统蛋白质工程难题
...础科研人员,当我第一次看到我们研发的蛋白质工程通用人工智能技术,实现面向功能的蛋白序列设计,并被湿实验验证成功之时,心中涌起的激动是无与伦比的。”上海交通大学自然科学研究院&
2024-05-07 09:24:00
...:科技日报科技日报北京6月27日电 (记者陆成宽)基于人工智能预测的蛋白质结构,我国科研人员建立起全新的大规模蛋白质聚类方法,并成功开发出具有自主知识产权的新型碱基编辑工具。
2023-06-28 02:55:00
蛋白质生成大模型NewOrigin亮相WAIC!许锦波:将满足蛋白生成全流程需求
7月7日,在2023世界人工智能大会(WAIC)上,业界首个AI蛋白质生成大模型“NewOrigin”(中文名为“达尔文”)正式亮相
2023-07-09 01:00:00
更多关于科技的资讯: