我们正处于一个信息大暴发的时代,每天都能产生数以百万计的新闻资讯!
虽然有大数据推荐,但面对海量数据,通过我们的调研发现,在一个小时的时间里,您通常无法真正有效地获取您感兴趣的资讯!
头条新闻资讯订阅,旨在帮助您收集感兴趣的资讯内容,并且在第一时间通知到您。可以有效节约您获取资讯的时间,避免错过一些关键信息。
本文转自:人民日报客户端
张研吟
在医疗图像数据生成领域,伴随大模型的快速发展,Model as a Service(MaaS,模型即服务)概念也日渐兴起。MaaS的大模型需要从海量的、多类型的数据中学习通用特征和规则,从而具备较强的泛化能力。然而,现有医疗大模型训练中常遇数据量不足的瓶颈。
近日,商汤科技联合行业合作伙伴,结合生成式人工智能和医疗图像数据的多中心联邦学习发表的最新研究成果《通过分布式合成学习挖掘多中心异构医疗数据》(Mining Multi-Center Heterogeneous Medical Data withDistributed Synthetic Learning),登上国际顶级学术期刊《自然》(Nature)子刊《自然-通讯》(Nature Communications)。

论文收录结果公布
论文提出一个基于分布式合成对抗网络的联邦学习框架DSL(Distributed Synthetic Learning),在保护数据隐私的同时利用多中心的多样性医疗图像数据联合学习图像数据的生成,帮助MaaS大模型训练,打造“医疗大模型工厂”。DSL通过学习得到一个图像数据生成器,它可以更灵活地生成数据,这些生成数据可以替代多中心的真实数据,用于下游具体机器学习任务的训练,并具备较强的可扩展性。
深度学习模型需要大量且多样性的数据“喂养”,但医疗领域对用户个人隐私保护有着极高的要求,这使得多样高质的医疗数据收集和医疗AI模型的开发迭代面临较大的挑战。联邦学习作为一种分布式的机器学习方法, 可以在不共享数据的情况下对多中心的数据进行联合建模,在保证数据安全的同时联合学习某一特定应用模型。
DSL框架由一个位于中央服务器的数据生成器和多个位于不同数据中心的数据鉴别器组成。在学习过程中,中央生成器负责生成“假”的图像数据,并发送给各个数据中心,各个数据中心用本地的真实数据和收到的“假”数据进行对比后将结果回传给中央服务器。中央生成器可以作为“数据生产工厂”,根据反馈结果及给定的约束条件(标注)生成高质量仿真图像数据,从而得到一个由生成数据组成的数据库。
该数据库可以替代真实数据,用于下游具体任务的学习,使下游模型的更新迭代不再受到真实数据可访问性的制约。同时,该方法通过分布式架构和联邦学习方式保证中央服务器无需接触数据中心的真实数据,也不需要同步各中心的鉴别器模型,有效保障了数据安全和隐私保护。
DSL框架已通过包括大脑多序列MRI图像生成及下游的大脑肿瘤分割任务等多个具体应用的验证,具有较强的可扩展性支持多模态数据中缺失模态数据的生成、持续学习等不同场景。
在瑞金医院的展区,SenseCare®肝脏手术智能规划系统凭借高效精准的病灶检出、三维重建、手术规划等功能,吸引不少观众驻足。从二维的肝脏CT影像,变为一目了然的三维立体模型,只需短短几分钟。轻轻拖动鼠标,就可在模型上自定义切面、角度、血管离断位置等,帮助医生几分钟内完成精准的肝脏手术规划。
DSL框架的构建,也有利于推动MaaS服务模式的发展。MaaS的医疗大模型在数据学习过程中,同样会遇到医疗数据隐私安全保护的问题,而基于DSL框架,可以有效地从多中心多样性数据中建立数据集仓库,通过生成数据,在保障数据安全和隐私的同时为大模型的开发迭代提供创新思路。细化到具体应用场景,DSL框架可助力医疗机构高效开展跨中心、跨地域模型训练工作。
随着DSL框架的推出,医疗大模型的训练将有望突破“数据孤岛”的桎梏,一定程度上降低了医疗大模型的训练门槛,有助于加速模型开发迭代,使医疗大模型的应用范围得以进一步延伸,覆盖更多临床医疗问题。
以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。
快照生成时间:2023-09-14 21:45:01
本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。
信息原文地址: