• 我的订阅
  • 科技

全球首个百亿级人类基因组基础模型Genos发布!

类别:科技 发布时间:2025-10-24 13:21:00 来源:海外网

在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。

10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

全球首个百亿级人类基因组基础模型Genos发布!

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。

据悉,Genos的相关成果已发表于国际学术期刊GigaScience。

全球首个百亿级人类基因组基础模型Genos发布!

文章截图(https://doi.org/10.1093/gigascience/giaf132)

广度、深度、效率兼具,一款真正具有生产力的基因组大模型

要读懂“生命之书”,首先需要一本完整的“字典”。

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。

共有、共为、共享,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。

全球首个百亿级人类基因组基础模型Genos发布!

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。

值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。

此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。

责编:李磊、王瑞景

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-10-24 14:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...科学家在一起,花7个月时间做出了全球首个百亿级人类基因组基础模型。之江实验室总工程师赵志峰把他们称为“硬盘侠”和“键盘侠”:前者负责筛选并且把装有专业数据的硬盘背到实验室,交
2025-12-19 07:22:00
...施,面向世界科技前沿和人民健康需求,牵头发起灵长类基因组计划和灵长类ENCODE计划,旨在建立表型精准度量体系,全面解析灵长类表型形成的遗传基础。目前,该平台正承担“十四五”
2023-07-13 05:56:00
我们为何没有尾巴?大脑为何如此发达?
...索可能藏在基因里。2018年,我国科学家牵头发起灵长类基因组计划,来自中、美、德、英等国的100多位科学家参与其中。不久前,《科学》杂志以专刊形式发表了8篇灵长类基因组计划的
2023-08-22 16:58:00
国内首个心血管疾病多基因风险评分模型MetaPRS在上海落地
...据、大样本中国、东南亚和欧美人群的高脂血症和冠心病基因组研究资料;并纳入了冠心病、脑卒中以及血脂、血压、血糖、肥胖等危险因素相关的600多个遗传变异,分别建立了适合中国人群的
2023-06-12 00:52:00
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...来直接训练任务模型。但它却拥有着海量未标注数据,像基因组数据,蛋白质序列等,这些数据非常适合用来做预训练基础大模型。大模型基于这些数据预训练之后,再结合少数标注过生物实验室数
2024-11-07 09:50:00
...使用人工智能(AI)模型揭示了可能影响人类认知进化的基因组突变。这项人类基因组学的开创性研究可能会促进发现复杂脑部疾病的新疗法。该研究发表在新一期的《科学进展》上。认知是人类
2023-02-22 01:36:00
...,以及从DNA双螺旋发展起来的“生命登月”工程——人类基因组计划。前两者都是美国独自完成的,后者有了中国科学家的身影。20世纪是遗传学发展最迅速、变化最激烈的一个时期。190
2023-02-24 02:06:00
让“生命天书”更具全球代表性
本文转自:科技日报人类泛基因组首个草图发布让“生命天书”更具全球代表性视觉中国供图人类泛基因组的研究进展有助于促进全球医疗公平。泛基因组吸纳了更多不发达地区人类个体的样本,这意味
2023-05-30 02:37:00
中美团队合作开发基因遗传信息新模型 精准预测冠心病患病风险
本文转自:中国新闻网记者7日从中国科学院北京基因组研究所(国家生物信息中心)获悉,为实现对个体未来罹患冠心病风险的精准预测,该所汪敏先团队与美国博德研究所Amit V. Kher
2023-07-08 09:58:00
更多关于科技的资讯:
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00
大河网讯 这一年,我们没有走遍世界,但世界,走进了《Global Talk》。2025年,《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事
2025-12-31 22:33:00
近日,上药控股山东总部携手浪潮智慧建筑,构建涵盖16大智能化系统的智慧园区体系,以智慧云平台为中枢推进全要素数字化升级
2025-12-31 22:59:00
石家庄二中新添“AI学伴”,有道AI答疑笔以“引导式答疑”助力启发式教学
河北新闻网讯 为推动教育资源均衡发展,让智能科技惠及更多青少年,12月18日,石家庄市“希望工程”事业发展中心、石家庄市青少年发展基金会联合网易有道
2025-12-31 17:18:00
中国消费者报福州讯(记者张文章)12月31日,福建省消费者权益保护委员会聚焦“科技+消费”核心场景发布消费提示,提醒广大消费者警惕伪智能陷阱
2025-12-31 17:33:00
中国消费者报海口讯(记者黄劼)2025年12月30日,三亚海旅免税城迎来开业五周年。海旅免税以“High Five 5•五周年狂欢庆典”为主题
2025-12-31 17:33:00
麦当劳中国第4400家LEED认证绿色餐厅落户福州
福州新华都大厦餐厅盛大开业,“开心书屋”全国首发麦当劳中国第4400家LEED认证绿色餐厅落户福州辞旧迎新之际,麦当劳中国第4400家LEED认证绿色餐厅“福州新华都大厦(五四路)餐厅”盛大开业
2025-12-31 17:49:00
“艾白”来了!12月31日,福州日报社首位机器人员工正式上岗!
2025-12-31 17:49:00
嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》
河北新闻网讯(记者 李春炜)12月31日,嘀嗒出行发布《2025职场顺风车用户画像及体验洞察报告》,基于嘀嗒顺风车大数据和近万名嘀嗒顺风车用户调研
2025-12-31 18:04:00
中新经纬12月31日电 “市说新语”微信号31日消息,2026年1月1日起,婴幼儿及儿童家具安全、光伏组件报废、汽车维护检测和诊断
2025-12-31 18:57:00
河北天翼农担业务系统实现关键技术突破
图为国和公司办公大楼。河北新闻网讯(吴建春)近日,河北天翼科贸发展有限公司(简称“河北天翼”)为某农担公司量身打造的担保业务系统业务提报模块
2025-12-31 19:36:00
冬虫夏草产业进入供给侧重构期,东阳光鲜虫草以成熟生态繁育技术,形成产业化优势
在大健康消费持续增长的大背景下,滋补品类正在经历结构性调整,其中冬虫夏草行业尤为突出。长期依赖野生采挖的供给模式,使行业在产量
2025-12-31 14:26:00
猿编程亮相2025新华网教育论坛,创始人李翊:以“4C体系”重塑未来AI教育
2025年12月11日,以“凝聚时代智慧 引领教育创新”为主题的第十六届新华网教育论坛在京举办。教育部相关司局负责人、全国知名高校及中小学代表
2025-12-31 14:26:00
新年礼赠 “去包装化”,驼奶粉成营养市场现象级单品
岁末年初的礼赠市场,正悄然发生一场“价值回归”。曾经风靡的贵价包装礼品逐渐遇冷,而“长期实用、精准营养”的实用型礼品成为新主流
2025-12-31 14:28:00