• 我的订阅
  • 科技

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

类别:科技 发布时间:2023-04-25 13:00:00 来源:砍柴网

智能化正在不断颠覆传统生产力。随着数智时代的到来,AI技术在提升管理效率、降低运维成本等方面发挥着越来越重要的作用。当DB与AI相结合,数据库产品也变得更加智能化。目前智能数据库技术是业内的研究热点,openGauss 作为国内数据库根技术的重要一支,在这一领域取得了哪些成就?未来有哪些发展规划?

2023年4月7-8日,由中国DBA联盟(ACDU)和墨天轮社区联合主办的第十二届“数据技术嘉年华”(DTC 2023)在北京新云南皇冠假日酒店成功召开。华为openGauss数据库AI领域负责人李士福在【数智趋势:智能运维与自治】专题论坛发表了题为 《openGauss:自驾驶数据库内核》 的演讲。本文根据演讲实录整理而成。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

(嘉宾简介:李士福,15年数据库内核开发经验,2014年加入华为高斯部,曾在Teradata研发中心从事分布式MPPDB数据库研发。目前其主要负责GaussDB(含openGauss)自治数据库内核的研发工作,包括DBMind自治运维系统、DB4AI库内AI引擎和自学型内核;同时作为openGauss社区TC成员支撑openGauss社区拓展。)

一、openGauss自驾驶内核整体介绍

李士福表示,openGauss自驾驶内核整体上主要包含两个子系统:AI4DB自治系统和DB4AI库内AI引擎。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

AI4DB自治系统主要又包含两大部分:一个是DBMind自治运维系统,是给用户、主要是DBA做自监控、自诊断、自由化和自安全,其主要目标是方便用户做系统的运维诊断,让系统更高效、可靠运行;另一个是把AI技术嵌到数据库内核之中,实现智能查询重写、代价估计、行数估计、计划自适应选择、负载自适应调度、自学习索引、缓存自适应淘汰等。

DB4AI库内AI引擎则是指在数据库内置很多AI算法,把AI能力直接内嵌到数据库中,通过训练和推理SQL语法、训练语句执行计划及代价为数据库提供AI能力,这样能方便用户使用训练和推理的语句。同时DB4AI还可以提供算法API接口,供学习型内核组件调用,从而为库内组件加速。

二、DBMind运维管理系统架构和应用

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

李士福指出,DBMind整体运维架构主要涵盖四个方面:数据采集层作为底座,主要负责在数据库运行节点上部署Agent采集节点,从而采集数据库指标和OS指标,同时还负责执行AI Service下发的运维管理命令。在数据计算层,数据库外的节点可以在备机部署AI Service服务节点,同时有一些存储的引擎,来实现数据计算存储。自治服务层主要提供三大方面的自治服务:其一是SQL诊断调优,包括慢SQL诊断、发现以及索引优化等;其二是安全,提供异常行为检测、敏感数据发现;其三是运维,即整个系统的运维诊断,包括参数调优、系统分析诊断等。最顶层是监控,通过端到端的监控诊断、运维还有优化,实现了从问题发现、问题诊断到问题优化的全流程管控,对用户来说是无感知的。

在DBMind自治运维系统层层严密的架构下,其有广泛的应用。李士福透露,DBMind自治运维系统的应用主要聚焦于三个方面:索引推荐能力、慢SQL诊断和建议、多指标关联分析。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

索引推荐能力是指在数据库内核中内置单条索引的推荐能力,来实现单条索引推荐,从而让用户很容易对一条语句实现索引加速。由于单条索引很难对整个系统有效,因此openGauss DBMind额外增加了对整个系统负载的索引推荐,通过对批量workload的采集、处理、压缩后再进行单条索引推荐,从而降低索引推荐比例、提升整体效率。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

慢SQL诊断和建议是在openGauss中集成的能力之一。在数据库中,openGauss会识别哪些语句是慢SQL,然后采集慢SQL和它的相关指标特征。同时结合当前系统的运行状况,比如CPU使用率和IO使用率等指标,把这些信息作为统一的集合进行训练。训练后形成的特征库,可用于与之后遇到的慢SQL语句境进行智能匹配,最后把根因结果在界面上展示,同时给出优化建议。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

多指标关联分析可以帮助我们快速发现问题。我们都知道,采集的指标是多种多样的,一个指标的变动可能联动其他指标也发生变化。目前openGauss施行了多种异常检测算法,例如:持续增长、毛刺、周期性等。基于这些检测算法观察环境指标,可以发现指标间的关联关系,从而确定影响关键指标的变化因素有哪些。

三、库内AI引擎架构和应用

对DBMind整体运维架构进行了详细的介绍后,李士福还分享了库内AI引擎架构和应用方面的知识点。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

DB4AI库内AI引擎架构中,基于优化路径,openGauss可以展示当前AI算子的执行路径,让用户可以查看执行计划。其次是全流程业务管理,除了常见的模型管理,openGauss数据库还支持通过系统表存储管理模型。此外,还支持数据集管理,在数据更新变化的情况下,不影响当前训练的模型。李士福透露,研发团队还在做模型的漂移,去保证模型的新鲜度;进一步还将结合异构计算能力,将执行算子下推到GPU去做稳定训练加速,从而构建起完整的DB4AI引擎架构。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

DB4AI与不同的应用相结合,能帮助开发者提升工作效率。“在应用上,DB4AI给用户提供交互式的界面,例如结合Jupyter做交互式的分析。因此,我们提供DB4AI Python库,结合这个命令可以很容易地在交互界面上给用户展示相关信息。这种可以使用Python的方式让用户很容易上手。”李士福说道。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新
DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

目前DB4AI也积累了丰富的案例,例如库内AI高效训练和推理、模型自适应漂移。通过机器学习算法,完成可解释模型;每个月采2000个样板信息完成模型漂移,解决了模型与当前业务不拟合等问题。openGauss 在DB4AI方面的应用能极大地节省人力,降低成本。

DTC 2023精彩回顾|李士福: openGauss自驾驶数据库内核在AI领域的探索和创新

此外,李士福还就智能优化器架构做了简要介绍。openGauss数据库的智能优化器主要完成四项任务:智能基数估计、自适应计划选择、智能代价模型、智能计划探索。其中,他重点介绍了智能基数估计、自适应计划选择这两项任务。智能基数估计是指结合AI算子对数据做分析和处理,改善了基于神经网络算法的传统方法很难落地的情况;自适应计划选择主要解决的是缓存计划的使用问题。

在演讲尾声,李士福总结指出,AI与DB的结合其实是一个新兴领域,目前openGauss在这一领域投入很多。AI与DB相结合能解决当前运维场景效率的问题,还可以提升用户使用价值。后续,华为将持续深耕这一领域,并将研究成果持续应用至社区。返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-04-25 13:45:13

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

圆满结束!带你回顾华为在2023开放原子全球开源峰会的精彩时刻
...智能、开源安全、开源法律、开源社区治理与运营、开源数据库、开源及供应链安全产业、软件物料清单、开源大模型、云原生、开源安全技术与实践、开放科学和开源教育、开源项目生命周期等领
2023-06-21 13:00:00
大咖齐聚,2023世界人工智能大会-图技术激活数据要素论坛重磅来袭!
...邀请《金融电子化》杂志社领导独家深度解读《金融业图数据库建设发展调研报告》核心内容,带来图数据库在金融行业应用发展驱动要素、主流趋势、未来前瞻等方面的前沿洞察,与参会嘉宾一起
2023-06-30 16:01:00
【数智的力量】2024数势科技产品发布会 现场精彩回顾
3月28日,【数智的力量】数势科技客户大会暨2024大模型增强的数据分析产品发布会在深圳市福田香格里拉大酒店隆重举行。本次大会汇聚了行业领袖、技术专家和企业数字化转型负责人,共同
2024-03-29 16:30:00
上海爱可生发布基于OceanBase开源内核的商业发行版ActionDB
...海爱可生信息技术有限公司(以下简称“爱可生”)召开数据库新品发布会,正式发布面向国产化时代的企业级数据库ActionDB
2023-05-21 06:00:00
链接全球,护航生命科学企业全球化展业
...用Llama、Alpaca等模型,将企业内部数据做向量化,建立向量数据库,再与大模型校准,从而为用户生成相对精准的答案,训练成本远低于直接在大模型上做微调。这种应用不仅满足企
2024-04-24 15:55:00
看看都有哪些重磅大咖!这份掘金年度技术演讲指南请收好
...分重磅嘉宾公布将在主论坛带来分享的嘉宾是:字节跳动数据库负责人张雷,华为诺亚方舟实验室语音语义首席科学家刘群,Datastrato Founder &
2024-01-04 15:00:00
“数字中国,智慧未来”,数字经济(中国)100人论坛——江苏沿海峰会在盐城成功举办
...流拓客。多客数智屏还能够锁定私域流量,建立私域流量数据库,将流量转化为财产,为商家创造更大的价值。周金国董事长的演讲得到了现场观众的广泛认可和高度评价,大家纷纷表示对多客数智
2024-12-02 12:08:00
深耕文档型数据库12载,SequoiaDB再开源
1月15日,巨杉数据库举行SequoiaDB新特性及开源项目发布活动。本次活动回顾了巨杉数据库深耕JSON文档型数据库12年的发展历程与技术演进
2024-01-16 12:00:00
海量数据亮相轨交大会,为行业数据库转型交出高质量答卷
...发展,如何让轨道交通更好赋能城市发展”展开谈论。 -数据库是轨交行业基础架构的核心-随着大都市圈、城市群多层级交通规划的全面实施,轨道交通规模持续扩大,数据不断累积,面临业务
2024-03-13 15:30:00
更多关于科技的资讯:
新年第一天 燕赵沐朝晖|“雄安一号”星 测试太阳翼
编者按岁序更替,华章日新。2026年是“十五五”开局之年。锐始者必图其终,成功者先计于始。新年第一天,燕赵大地欣欣向荣
2026-01-02 07:05:00
注意缺陷与多动障碍 这个疾病越来越常见 都说长大就好了 为何缠上成人?
2025年12月31日凌晨,罗永浩在微博发文回应“科技春晚”发布会迟到40分钟事件,首次公开坦承自己受注意缺陷与多动障碍(ADHD)困扰多年
2026-01-02 08:06:00
近日,湘湖首部AI动画《湘湖漫游记》第五集上线,该系列作品正式收官。本片不仅是杭州湘湖(白马湖)研究院在“文化+科技”融合上的一次重要突破
2026-01-02 06:35:00
在杭州湖滨银泰in77的B区、D区之间,复古的国王十字车站、9站台出现在现场,仿佛下一秒就有巫师推着行李箱穿墙而过;一辆编号5972的霍格沃茨特快列车静静停靠在街区中央
2026-01-02 06:35:00
2025年度票房破518亿元 动画电影成亮点 安徽全国排名第十
大皖新闻讯 国家电影局2026年1月1日公布,2025年电影票房为518.32亿元,同比增长21.95%,城市院线观影人次为12
2026-01-01 17:14:00
免费抢鲜体验!香飘飘魔芋啵啵奶茶快闪体验活动空降临沂泰盛广场 健康爆款掀起跨年打卡热潮
鲁网1月1日讯 (记者 李文静)2025年12月31日晚,国民奶茶品牌香飘飘携新品“魔芋啵啵”奶茶,在山东临沂泰盛广场开启奶茶快闪体验活动
2026-01-01 15:52:00
厦门动漫嘉年华启幕 众多热门国漫IP集中参展
厦门动漫嘉年华各项活动精彩纷呈。(记者 林铭鸿 摄)厦门网讯(厦门日报记者 林露虹)展览面积超5万平方米,汇聚众多热门国漫IP
2026-01-01 08:41:00
助力低空应急产业发展——三明市应急管理局引进低空防御项目
东南网1月1日讯 2025年12月30日,由三明市应急管理局引进,南京云麒防务科技有限公司投资的福建鹏鑫智能科技有限公司
2026-01-01 09:33:00
近日,太长高速太原收费站智慧化升级改造全面完成并投入运营。项目以数字化转型为核心,围绕高峰期通行效率低、车辆拥堵等运营痛点
2026-01-01 07:17:00
沈洁任蓟州区代理区长 扫码阅读手机版
据“掌上蓟州”微信公众号消息,天津市蓟州区第二届人民代表大会常务委员会第三十五次会议决定:沈洁为天津市蓟州区人民政府代理区长。
2025-12-31 23:10:00
东南网12月31日讯(本网记者 卢金福)元旦佳节将至,消费市场迎来新一轮热潮。面对促销活动纷至沓来、消费场景多元拓展的新形势
2025-12-31 23:29:00
皖企长鑫科技向上交所递交IPO招股书
大皖新闻讯 2025年12月30日,总部位于合肥的长鑫科技集团股份有限公司(以下简称“长鑫科技”)正式向上海证券交易所递交招股书
2025-12-31 21:33:00
大河网讯 这一年,我们没有走遍世界,但世界,走进了《Global Talk》。2025年,《Global Talk》结识了来自全球近30个国家和地区的朋友——他们带着各自的故事
2025-12-31 22:33:00
近日,上药控股山东总部携手浪潮智慧建筑,构建涵盖16大智能化系统的智慧园区体系,以智慧云平台为中枢推进全要素数字化升级
2025-12-31 22:59:00
石家庄二中新添“AI学伴”,有道AI答疑笔以“引导式答疑”助力启发式教学
河北新闻网讯 为推动教育资源均衡发展,让智能科技惠及更多青少年,12月18日,石家庄市“希望工程”事业发展中心、石家庄市青少年发展基金会联合网易有道
2025-12-31 17:18:00