• 我的订阅
  • 科技

全球首个百亿级人类基因组基础模型Genos发布!

类别:科技 发布时间:2025-10-24 13:21:00 来源:海外网

在生命科学的前沿探索中,我们早已能高效“读出”生命的序列,但如何从30亿碱基对中“读懂”生命奥秘,长期以来都是一项巨大挑战,如同在没有地图的荒野中寻找路径。

10月23日,在第二十届国际基因组学大会(ICG-20)上,华大生命科学研究院与之江实验室联合发布了全球首个百亿参数人类基因组通用基础模型——Genos。这一针对人类基因组深度优化的基因组基础模型,可支持高达百万碱基对的超长上下文分析,并实现单碱基分辨率的精准识别。

全球首个百亿级人类基因组基础模型Genos发布!

Genos的推出标志着基因组研究从“读出”碱基序列迈向“读懂”生命底层逻辑的一次关键转折,有望为临床疾病诊断、个人基因组解读及前沿科学研究带来突破性变革。

据悉,Genos的相关成果已发表于国际学术期刊GigaScience。

全球首个百亿级人类基因组基础模型Genos发布!

文章截图(https://doi.org/10.1093/gigascience/giaf132)

广度、深度、效率兼具,一款真正具有生产力的基因组大模型

要读懂“生命之书”,首先需要一本完整的“字典”。

基因组学领域内的现有模型大多基于一到两个参考基因组进行训练,难以捕捉人类丰富的遗传多样性。而Genos则系统整合了人类泛基因组参考联盟(HPRC)、人类基因组结构变异图谱计划(HGSVC)等多个权威公开资源,首次汇聚了全球范围内636个“端粒到端粒”(T2T)级别的高质量人类基因组作为训练数据。这些数据覆盖了全球不同人群,旨在从源头减少数据偏见,更全面地代表人类遗传多样性。

基因组的语言极其复杂,一个微小的单碱基突变,其影响可能由百万碱基之外的“遥远”调控元件决定。这要求模型既要有“显微镜”般的单碱基精度,又要有“广角镜”般的百万级超长上下文理解能力。

如同阅读一部鸿篇巨著,既能一字不差地记住细节,又能洞悉全局的宏大叙事。Genos通过混合专家(Mixture-of-Experts, MoE)架构,巧妙地解决了这一挑战。MoE架构如同一个拥有众多顶尖专家的智慧团队,面对任务时,总能精准调度最相关的几位专家协同处理,而不是调动所有人全部待命。这一“按需激活”的机制,让Genos在拥有百亿级参数的庞大知识总量的同时,推理成本和资源消耗却远低于同等规模的模型,真正实现了“既强大,又好用”。

为了全面验证模型的性能,研发团队进行了一系列测试。在基因组元件识别、远程调控预测、突变致病性预测等经典评测任务里,Genos在超过一半的任务里比所有现有模型都表现更好,而且长序列评测任务里,如突变热点识别和族群分类上,Genos的表现远超同类模型,展现了其强大的上下文分析能力,有效破译基因组中的“暗物质”。

更重要的是,Genos在直接面向临床应用的致病性突变解读任务中,实现了92%的准确性,当结合021科学基础模型后,准确率更是高达98.3%,为临床诊断提供了全新的高效工具。综合多项评测结果,Genos在各项核心任务中的表现均全面超越了现有最佳水平(SOTA),证明了其卓越且全面的能力。

共有、共为、共享,让前沿科技触手可及

一个模型无论多么强大,如果不能被方便地部署和使用,其价值便大打折扣。目前,全球基因组学领域尚无一款能够被开发者和研究者直接部署、用于下游应用的百亿级人类基因组基础大模型。而Genos的发布,则填补了这一空白。它是一个可以走向临床、走向个人、走向每一个实验室的“实践先锋”,为无限的下游应用创新提供了坚实的地基。

全球首个百亿级人类基因组基础模型Genos发布!

今年是人类基因组草图绘制完成25周年。“共有、共为、共享”,既是人类基因组计划的精神传承,也是Genos与生俱来的核心理念。

发布会上,华大生命科学研究院宣布,Genos模型将全面、彻底地开源开放,且同时提供12亿和100亿参数两个版本,满足不同应用场景的需求。目前,两个版本的模型权重、架构细节与完整训练流程,均已在GitHub、Hugging Face、魔搭等平台依据MIT开源协议公开发布,供全球开发者和科研人员自由使用。同时,在之江实验室的开放平台Zero2X也已发布。

另外,考虑到并非所有使用者都拥有强大的算力资源,该模型已被深度整合进DCS Cloud云平台。用户无需进行复杂的安装配置,即可一键调用Genos,平台为每个账户提供了高达10万次的免费推理服务,极大地降低了基因组智能分析的门槛。

目前,在科研领域,Genos模型通过与DCS cloud结合,能仅凭DNA序列“秒级”预测RNA表达谱,将过去数周甚至数月才能完成的生物信息分析流程极大提速。此外,Genos模型也已整合进生命科学数据库CNGBdb,可帮助用户精准预测细胞表达量,高效筛选和验证关键候选基因,大幅加速科研发现。

在临床应用领域,Genos模型与华大已发布的GeneT深度思考模型结合,能为遗传疾病诊断提供专家级的多模态解读。而在个人健康领域,目前Genos模型已整合进BGE平台,将赋能个人基因组报告解读,把复杂的生命代码翻译成每个人都能读懂的、个性化的健康“说明书”。

值得一提的是,Genos的诞生,源自一次大胆的跨界融合与人才培养实践。该模型的核心研发团队,来自华大生命科学研究院与之江实验室联合发起的“大模型种子班”。这个汇聚了生物信息专家与计算科学骨干的精英团队,依托“以问题导向实训、以任务驱动创新”的模式,正推动生命科学研究从“数据挖掘”迈向“智能涌现”的新纪元。也正是这种跨界碰撞,为Genos的颠覆性创新注入了最核心的动力。

此次Genos的发布,标志着一个新时代的开启:一个基因组智能分析的时代,一个人人都能读懂自己生命天书的时代,正加速到来。为持续推动模型迭代,华大生命科学研究院近期还联合国内外多家单位共同发起了“十万长读长大人群联盟(Long100K Genomes Consortium)”和“百亿细胞计划(10BC)”两项大科学计划。其中,“十万长读长大人群联盟”将依托最新的Cyclone长读长测序技术,完成10万人的“端粒到端粒”级别完整基因组测序,为基因组大模型提供高质量的训练数据。而“百亿细胞计划”则将依托Stereo-Cell超高通量细胞组学技术,完成百亿细胞测序,助力基因和细胞的融合大模型开发。从基因组到多组学,一个更强大的生命科学基础模型正在孕育之中。

责编:李磊、王瑞景

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2025-10-24 14:45:02

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

...科学家在一起,花7个月时间做出了全球首个百亿级人类基因组基础模型。之江实验室总工程师赵志峰把他们称为“硬盘侠”和“键盘侠”:前者负责筛选并且把装有专业数据的硬盘背到实验室,交
2025-12-19 07:22:00
...施,面向世界科技前沿和人民健康需求,牵头发起灵长类基因组计划和灵长类ENCODE计划,旨在建立表型精准度量体系,全面解析灵长类表型形成的遗传基础。目前,该平台正承担“十四五”
2023-07-13 05:56:00
我们为何没有尾巴?大脑为何如此发达?
...索可能藏在基因里。2018年,我国科学家牵头发起灵长类基因组计划,来自中、美、德、英等国的100多位科学家参与其中。不久前,《科学》杂志以专刊形式发表了8篇灵长类基因组计划的
2023-08-22 16:58:00
国内首个心血管疾病多基因风险评分模型MetaPRS在上海落地
...据、大样本中国、东南亚和欧美人群的高脂血症和冠心病基因组研究资料;并纳入了冠心病、脑卒中以及血脂、血压、血糖、肥胖等危险因素相关的600多个遗传变异,分别建立了适合中国人群的
2023-06-12 00:52:00
大模型重构生命科学!最大基础模型面世,解锁DNA超长序列
...来直接训练任务模型。但它却拥有着海量未标注数据,像基因组数据,蛋白质序列等,这些数据非常适合用来做预训练基础大模型。大模型基于这些数据预训练之后,再结合少数标注过生物实验室数
2024-11-07 09:50:00
...使用人工智能(AI)模型揭示了可能影响人类认知进化的基因组突变。这项人类基因组学的开创性研究可能会促进发现复杂脑部疾病的新疗法。该研究发表在新一期的《科学进展》上。认知是人类
2023-02-22 01:36:00
...,以及从DNA双螺旋发展起来的“生命登月”工程——人类基因组计划。前两者都是美国独自完成的,后者有了中国科学家的身影。20世纪是遗传学发展最迅速、变化最激烈的一个时期。190
2023-02-24 02:06:00
让“生命天书”更具全球代表性
本文转自:科技日报人类泛基因组首个草图发布让“生命天书”更具全球代表性视觉中国供图人类泛基因组的研究进展有助于促进全球医疗公平。泛基因组吸纳了更多不发达地区人类个体的样本,这意味
2023-05-30 02:37:00
中美团队合作开发基因遗传信息新模型 精准预测冠心病患病风险
本文转自:中国新闻网记者7日从中国科学院北京基因组研究所(国家生物信息中心)获悉,为实现对个体未来罹患冠心病风险的精准预测,该所汪敏先团队与美国博德研究所Amit V. Kher
2023-07-08 09:58:00
更多关于科技的资讯:
视频摄制:冯阳 霍艳恩 赵新宇 王思宁
2026-03-07 10:02:00
中国青年医师IP孵化计划在杭州启动
2026年3月5日,以“AI链全球 生态共生”为主题的中国青年医师IP孵化计划在杭州启动。本次活动来自全国多所医院的专家
2026-03-07 10:40:00
租金两块钱一分钟 “共享机器人”即将入驻杭州商场、电影院
星枢智能的“机器人家族” 记者 杨亦淇 摄一台售价20多万元的春晚同款人形机器人,现在花5000元就能租一天;如果是基础款
2026-03-07 08:05:00
摘要:随着信息技术的快速发展,人工智能技术逐渐渗透金融机构的各类业务与管理环节,对传统金融运作模式产生了深刻影响。金融机构在激烈竞争和成本约束的背景下
2026-03-07 05:46:00
近日,省应急管理厅举行“AI+工业企业火情预警(火眼哨兵)”“AI+烟花爆竹监管(烟花卫士)”应用上线发布仪式。浙江拥有30余万家工业企业
2026-03-07 07:34:00
视频摄制:张晶、赵新宇、朱泊宇
2026-03-07 07:47:00
今年的全国两会上,“一人公司”(One Person Company,简称OPC)成为代表委员们热议的话题。全国人大代表
2026-03-07 07:04:00
2026年全国两会正式开幕,全国政协委员、京东集团技术委员会主席、京东云总裁曹鹏围绕人工智能产业发展建言献策。他建议,推动我国AI产业实现从规模扩张到效能提升
2026-03-06 22:56:00
编者按:从生力军天创机器人开始,《大众证券报》明镜财经工作室记者将陆续探访在各种应用场景解决着实际问题的南京机器人企业
2026-03-06 22:56:00
从平台赋能到标杆涌现:青岛崂山区打造OPC创业首选地
鲁网3月6日讯2026年,是“一人公司”(OPC)从概念走向规模化实践的关键之年。当这一新型创业范式成为科创发展新风口
2026-03-06 20:12:00
【宅男财经|专家面对面】据央视新闻报道,十四届全国人大四次会议今天(6日)举行经济主题记者会。商务部部长王文涛在会上表示
2026-03-06 21:54:00
从手工“制茶”到数据“智茶”:竹叶青展现AI时代品质新解法
在中国古老的传统产业版图中,茶产业无疑是最具代表性,却又最难被现代化改造的堡垒之一。长期以来,非标化、依赖人工经验、产业链条冗长等痛点
2026-03-06 17:21:00
全球AI迈向“办事时代”,千问持续推进AI生活服务落地
3月6日,千问宣布持续投入“AI办事”,用户可以让AI一句话下单各类生活服务,享受AI办事带来的便捷和立减实惠。进入2026年
2026-03-06 18:54:00
三联家电洪楼店店庆盛典3.07火热开启!
鲁网3月6日讯春暖花开,焕新正当时!一年一度,三联家电洪楼店将于3月7日至3月15日隆重举办店庆盛典,为广大消费者带来一场诚意十足
2026-03-06 17:08:00
2025ITEC颁奖典礼在京举行 半导体AI创新成果引关注
2月4日,第十三届朝阳国际人才创业大会(ITEC2025)创新峰会在北京举办,大会全球创业赛获奖名单同期正式揭晓——“人工智能在半导体制造的应用与研究”项目凭借核心技术突破与产业化落地实效
2026-03-06 14:10:00