• 我的订阅
  • 科技

清华大学丘成桐团队合作推出高维数据非传统去噪新方法

类别:科技 发布时间:2024-02-01 10:58:00 来源:大可数学人生工作室

在过去几十年里,随着数据收集与处理能力的显著提高,各行各业都在面对由海量高维数据带来的机遇与挑战。然而,在处理这些高维数据时,传统的数据分析方法往往过分依赖于特征间的线性相关性。尽管这些线性方法能够简化数据的表示形式,但它们在捕捉数据中的复杂模式方面却显得力不从心。一个典型的例子是,高维数据往往聚集在低维流形附近,而这些特征无法有效地通过低维线性结构来表达。

针对这一问题,流形学习技术成为一种具有前景的解决方案。然而,现有的流形学习方法,如基于流形结构的嵌入和去噪算法,因缺乏深入的几何理解和坚实的理论基础而受到限制。此外,在处理极大规模数据集时,这些技术常面临着计算效率和精度的双重挑战,特别是在生物信息学、金融分析和社会网络数据等应用领域中。

为了深入研究高维数据中的非线性结构,新加坡国立大学统计与数据科学系的研究团队和清华丘成桐数学中心团队提出了一种新算法。该算法基于数据统计分布和隐含几何结构,旨在从高维环境空间中的离散样本点恢复出光滑的低维流形结构。研究人员将高维空间中的观测样本视为未知流形的隐藏信息与环境噪声的混合体。他们通过利用数据中的几何平滑特征及统计收敛性质,估计样本点到流形的距离,并据此给出未知流形的估计及样本点到其上的投影。这种对流形的估计被证明具有给定维数的光滑流形特性,且其估计误差和收敛速度均优于现有方法。

此外,为了应对数据维度和数据量的计算挑战,研究人员将此方法与深层生成对抗网络(GANs)结合(如图1(c) 所示),通过循环生成对抗网络学习高低维空间之间的连续映射,来估计隐藏流形的指对数映射,并利用这些映射实现对隐藏流形的初步估计。团队已将该方法应用于欧式空间中的几何模型、卡拉比-丘流形,以及一系列图像数据(图1 (a, d)),并正在尝试处理分析更高维度的前沿实验数据,例如单细胞RNA序列数据。这项工作预计将极大地改变我们处理高维复杂数据集域的效率,并提供潜在的新的视角。

清华大学丘成桐团队合作推出高维数据非传统去噪新方法

该研究中的部分成果近日以“利用循环生成对抗网络进行流形拟合(Manifold Fitting with CycleGAN)”为题,被《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the United States of America)期刊接收。该研究的完成单位是新加坡国立大学和清华大学丘成桐数学科学中心。该论文的第一作者为新加坡国立大学教授姚志刚,通讯作者为姚志刚与清华丘成桐数学科学中心教授丘成桐,论文作者贡献相当。论文部分研究结果来自于姚志刚在哈佛数学和应用中心访问期间完成的工作。研究得到了新加坡教育部研究基金的支持。

论文链接:

https://www.pnas.org/doi/10.1073/pnas.2311436121

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-02-01 16:45:07

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

数学与海南“陆海空”合作实现零突破
...究院研究员邬荣领说,数学模型可帮助理解植物生长受到高维基因相互作用的影响,与环境存在非线性网络关系,基因与终点表型之间存在复杂的基因调控网络。通过现代统计物理理论与方法、AI
2022-12-22 19:45
《麻省理工科技评论》中国智能计算创新人物峰会圆满落幕
...系计算所、物理所背景的入选者最多,占到 1/6,其次是清华大学、北京大学、上海交大、浙江大学,覆盖我国最顶尖的理工院校。这些来自不同背景的人才,一起构成了推动智能计算领域不断
2024-04-29 10:09:00
...转自:宁夏日报本报讯 (记者 杨志挺)4月18日至22日,清华大学17名在读学生、在职学生和老师来到吴忠市红寺堡区开展助教兴教活动。活动期间,17名青年人才分组前往红寺堡区4
2024-04-24 07:17:00
...:嘉兴日报■记者 何金妹 通讯员 徐晓杰本报讯 近日,清华大学柔性电子技术实验室、清华大学航天航空学院冯雪教授团队在三维曲面电子制造方法上取得重要进展。研究团队提出了一种包裹
2023-08-30 07:10:00
校地合作 清华大学、自贡荣县联手打造“荣县样板”
...:人民网-四川频道开展支教活动。丁文君供图去年8月,清华大学乡村振兴工作站四川荣县站项目入驻发布会在荣县举行;去年12月底,清华大学—荣县乡村振兴工作站正式投用;截至目前,共
2023-02-17 09:58:00
智IN共创 境界无限:2024英特尔中国学术峰会开幕
...景下,绿色计算成为今年活动的重点。中国工程院院士、清华大学教授郑纬民,中国科学院院士、武汉大学动力与机械学院院长、工业科学院执行院长刘胜,荷兰工程院院士张国旗等嘉宾出席了本次
2024-08-30 13:46:00
2024年8月12日,由清华大学主办,黄奕聪慈善基金会、美国CARHAR Philanthropies Inc、清华大学体育部
2024-08-17 22:13:00
颜宁团队国际顶刊发文:Yan Lab探索“暗物质”第一步
...聚糖分子的代表性电镜密度 该研究论文共同通讯作者为清华大学讲席教授、北京生物结构前沿研究中心研究员、深圳医学科学院创始院长颜宁,清华大学生命科学学院副教授、北京生物结构前沿
2024-03-29 16:46:00
清华团队提出大模型“密度定律”;足球领域首个视觉语言基础模型
...种扩展趋势正变得越来越不可持续。在这项工作中,来自清华大学和面壁智能的研究团队提出了“容量密度”(capacity density)的概念
2024-12-10 09:53:00
更多关于科技的资讯: