• 我的订阅
  • 科技

全球首个百亿级人类基因组基础模型Genos发布!

类别:科技 发布时间:2025-10-24 13:21:00 来源:海外网

在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。

10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

全球首个百亿级人类基因组基础模型Genos发布!

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。

据悉,Genos的相关成果已发表于国际学术期刊GigaScience。

全球首个百亿级人类基因组基础模型Genos发布!

文章截图(https://doi.org/10.1093/gigascience/giaf132)

广度、深度、效率兼具,一款真正具有生产力的基因组大模型

要读懂“生命之书”,首先需要一本完整的“字典”。

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。

共有、共为、共享,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。

全球首个百亿级人类基因组基础模型Genos发布!

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。

值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。

此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。

责编:李磊、王瑞景

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-10-24 14:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...科学家在一起,花7个月时间做出了全球首个百亿级人类基因组基础模型。之江实验室总工程师赵志峰把他们称为“硬盘侠”和“键盘侠”:前者负责筛选并且把装有专业数据的硬盘背到实验室,交
2025-12-19 07:22:00
...施,面向世界科技前沿和人民健康需求,牵头发起灵长类基因组计划和灵长类ENCODE计划,旨在建立表型精准度量体系,全面解析灵长类表型形成的遗传基础。目前,该平台正承担“十四五”
2023-07-13 05:56:00
我们为何没有尾巴?大脑为何如此发达?
...索可能藏在基因里。2018年,我国科学家牵头发起灵长类基因组计划,来自中、美、德、英等国的100多位科学家参与其中。不久前,《科学》杂志以专刊形式发表了8篇灵长类基因组计划的
2023-08-22 16:58:00
国内首个心血管疾病多基因风险评分模型MetaPRS在上海落地
...据、大样本中国、东南亚和欧美人群的高脂血症和冠心病基因组研究资料;并纳入了冠心病、脑卒中以及血脂、血压、血糖、肥胖等危险因素相关的600多个遗传变异,分别建立了适合中国人群的
2023-06-12 00:52:00
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...来直接训练任务模型。但它却拥有着海量未标注数据,像基因组数据,蛋白质序列等,这些数据非常适合用来做预训练基础大模型。大模型基于这些数据预训练之后,再结合少数标注过生物实验室数
2024-11-07 09:50:00
...使用人工智能(AI)模型揭示了可能影响人类认知进化的基因组突变。这项人类基因组学的开创性研究可能会促进发现复杂脑部疾病的新疗法。该研究发表在新一期的《科学进展》上。认知是人类
2023-02-22 01:36:00
...,以及从DNA双螺旋发展起来的“生命登月”工程——人类基因组计划。前两者都是美国独自完成的,后者有了中国科学家的身影。20世纪是遗传学发展最迅速、变化最激烈的一个时期。190
2023-02-24 02:06:00
让“生命天书”更具全球代表性
本文转自:科技日报人类泛基因组首个草图发布让“生命天书”更具全球代表性视觉中国供图人类泛基因组的研究进展有助于促进全球医疗公平。泛基因组吸纳了更多不发达地区人类个体的样本,这意味
2023-05-30 02:37:00
中美团队合作开发基因遗传信息新模型 精准预测冠心病患病风险
本文转自:中国新闻网记者7日从中国科学院北京基因组研究所(国家生物信息中心)获悉,为实现对个体未来罹患冠心病风险的精准预测,该所汪敏先团队与美国博德研究所Amit V. Kher
2023-07-08 09:58:00
更多关于科技的资讯:
“十五五”开局看河北|玉锋集团把玉米价值链越拉越长
从一粒粮到38种产品玉锋集团把玉米价值链越拉越长1月16日,宁晋县玉锋实业集团有限公司员工在生产车间巡检。 河北日报记者 赵永辉摄从2026年第一天起
2026-01-23 08:12:00
近日,海亮科服引爆关注——来自海亮致远书院的徐同学、寿同学双双重磅斩获牛津大学录取通知书!当大多数家庭还在高中才仓促启动升学规划
2026-01-23 10:02:00
《创投新势力》即将开播!一起见证中国科技创新的澎湃力量
鲁网1月23日讯从广州云宏信息在国产服务器虚拟化领域的技术攻坚,到主线科技实现自动驾驶物流系统的规模化落地;从智慧能源企业的清洁技术革新
2026-01-23 10:13:00
厦门游戏产业规模超百亿元 聚集近200家游戏企业
全市聚集近200家游戏企业厦门游戏产业规模超百亿元2025金海豚动漫游戏嘉年华在厦开幕。(记者 沈威/图)东南网1月22日讯(海峡导报记者黄奕琳)日前
2026-01-23 10:16:00
在黄金珠宝行业消费端承压、部分品牌闭店收缩的背景下,潮宏基实业股份有限公司交出了一份亮眼的年度成绩单。公司最新披露的2025年度业绩预告显示
2026-01-23 10:19:00
出门订酒店、选咖啡机、挑电动牙刷,当生成式人工智能从实验室走向日常生活,“问问AI”正取代“搜索一下”成为新的决策习惯
2026-01-23 12:14:00
国家明令禁售的育发、除臭等五类原特殊用途化妆品,在过渡期结束后,其生产与销售本应在法律层面画上句号。然而,媒体调查却揭示了一幅截然不同的图景
2026-01-23 12:14:00
从吉林智造,到全球领先!金赛药业做中国创新药攀登者
冬日寒风凛冽,却挡不住生物医药领域涌动的创新热潮。在吉林省这片产业沃土上,长春金赛药业有限责任公司(以下简称金赛药业)茁壮成长
2026-01-23 13:23:00
以人才战略为核心,持续夯实组织能力与长期发展基础,开启三十周年后的新起点[2026.1.23] 上海 ——ADM 中国宣布
2026-01-23 13:35:00
新浪新闻斩获TBI杰出品牌创新奖金奖,脱口秀梗式营销引爆传播
近日,TBI杰出品牌创新奖正式揭晓。新浪新闻为美的品牌量身打造的“美美生活奇妙夜暨美的全球美粉盛典”凭借梗式营销与情感赋能的创新融合
2026-01-23 13:37:00
星河聚北邮,AI赋气象 :NovaClub星河俱乐部北邮专场的思想碰撞与技术探索
当AI的创新算法遇上气象预报的精准需求,一场聚焦 “AI + 气象” 的深度对话在校园里焕发光彩。近日,上海科学智能研究院(下称上智院)主办的NovaClub星河俱乐部走进北京邮电大学(下称北邮)
2026-01-23 13:05:00
千亿市场规模下,AI医疗如何以生态化转型破解资源不均痛点
当OpenAI、蚂蚁集团等中外巨头纷纷躬身入局,当十年43.1%的复合增长率勾勒出千亿赛道蓝图,AI医疗正迎来百川智能创始人兼CEO王小川口中的“爆发时刻”
2026-01-23 11:20:00
新年“智”有安排!苏宁易购AI家电抢占年货C位
鲁网1月23日讯春节临近,年味渐浓,家家户户都在忙着置办年货,越来越多年轻人成为“过年主理人”,为家电市场注入智能与潮流的新动能
2026-01-23 11:19:00
近日,商务部等九部门发布《关于实施绿色消费推进行动的通知》(下称《通知》),提出将消费品以旧换新作为推动绿色消费的重要抓手
2026-01-22 23:19:00