• 我的订阅
  • 科技

双向赋能:AI与数据库的修行之道

类别:科技 发布时间:2024-06-28 23:46:00 来源:爱云资讯

在这个数据为王的时代,数据是人工智能的三大支柱之一,其重要性不言而喻。最近,OpenAI收购了数据库初创公司Rockset,迅速引起了业内外的广泛关注。OpenAI早已在算法和计算能力方面遥遥领先,通过这次战略性的收购,OpenAI将在其产品中融合Rockset的先进数据索引和查询技术,帮助OpenAI将数据转化为“可操作智能”。

现代数据库与人工智能(AI)的融合,正如同一场席卷全球的技术革命,深刻地重塑着技术与产业的格局。

一方面,数据库技术的技术迭代需要更好地支持人工智能应用工作负责,比如向量数据库,也就是DBforAI;另一方面人工智能技术也更好地让数据库运维更方便,实现自动化和智能化,也就是AIforDB。

在这一个变革过程中,数据库产业正面临诸多挑战,比如海量数据高性能和大并发、大量数据库实例智能优化、保障数据安全防篡改的防护等。面对这种情况,企业如何通过技术创新和生态协同应对挑战并抓住其中的机遇呢?

作为数据库领域的领头羊,东方国信、PingCAP、云和恩墨通过自身的技术与产品实践给出了他们的答案,同时他们与英特尔的协同创新,也让我们看到了数据库生态的蓬勃生机。

新需求催生新挑战

在AI大模型时代,由于数据库的使用人数和数据量的爆炸性增长,数据库系统的并发度会极大提升。云和恩墨联合创始人兼CTO杨廷琨强调,数据量爆发性增长带来压力的同时,硬件技术的快速发展也促进了算力提升,为提升处理能力和性能提供了可能性。这时候,数据库厂商需从两方面着手应对:一方面增强单机性能,另一方面通过架构设计实现平滑扩展,以满足海量数据的处理需求。

同时,数据量的爆炸性增长也会带来极大的数据冗余。在此挑战下,用户从需求侧又提出了很多新的要求,东方国信副总裁兼CTO查礼表示:用户往往会希望数仓既能做数据加工,又能做分析和查询,这要求数据库系统具有高度灵活性和多功能性。

数据来源多样化和用户需求复杂化催生了对硬件越来越高的需求,数据库要保持高性能、高稳定性,开发和运维人员又需要简化数据库的使用,这构成了一种“悖论”。

为解决数据库行业“既要、又要”的问题,越来越多的数据技术公司让AI“入局”,让数据库越跑越“聪明”。PingCAP服务总经理林景旭表示,他们正探索利用AI技术增强数据库功能,同时简化用户操作。作为一家分布式数据库厂商,PingCAP提供的开源分布式数据产品与解决方案,通过分布式数据库架构,实现计算和存储分离,以动态扩展满足不同用户需求,这其中便可以通过AI算法来优化资源使用和性能评判。

数据库产业需要不断创新,开发更加高效、可靠、智能的数据库技术,才能满足新需求的挑战。同时,数据库产业链也需要紧密合作,共同推动数据库技术的发展,为数字经济的发展提供更加坚实的基础。

生态协同推动产业变革

数据库产业面临的挑战是多方面的,这些挑战并非单个企业能够独自解决,需要整个产业的协同合作,才能共同应对挑战,并抓住其中的机遇。

凭借先进的处理器技术、开源合作策略以及对客户需求的深刻理解,英特尔与数据库领域的合作伙伴一起构建了一个开源开放、合作共赢的生态环境,助力数据库技术的持续创新和应用落地。

英特尔中国云创中心技术总经理张晓军介绍说,第四代和第五代英特尔®️至强®可扩展处理器内置了多项面向数据库优化的技术,例如英特尔®QAT(英特尔®数据保护与压缩技术)用于数据压缩解压缩,以及英特尔®IAA(英特尔®存内分析加速器)加速数据分析。在数据安全方面,英特尔也能通过英特尔®TDX(英特尔®信任域扩展)和SGX(英特尔®软件防护扩展)为使用中的数据提供端到端硬件级防护能力。

此外英特尔至强6处理器已于近期发布,提供了两种不同的CPU微架构版本,分别为性能核(P-core)和能效核(E-core),让多种工作负载的性能和能效表现再创新高。其全新功能和内置加速器为目标工作负载带来进一步助力,实现了更高的性能和能效。

双向赋能:AI与数据库的修行之道

基于英特尔®架构的加速器与软件工具

众多的合作伙伴正在借助至强处理器和加速器及软件工具增强自身的产品竞争力。

比如PingCAP推出的TiDB开源分布式数据库就得益于第四代英特尔®至强®可扩展处理器卓越的代际性能,其数据库的只读性能与读写性能分别达到基准配置的1.62倍与1.43倍。

双向赋能:AI与数据库的修行之道

此外TiDB利用至强®️可扩展处理器搭载的英特尔®️IAA提供的出色吞吐量压缩和解压缩功能,在不影响性能的前提下,提升了数据压缩率,节约了存储空间。PingCAP采用英特尔®️IAA代替LZ4之后,TiDB压缩率为LZ4无损压缩算法的1.4倍。

双向赋能:AI与数据库的修行之道

并结合CPU的迭代,性能提升可达到原配置的1.56倍,有助于客户化解数据压缩所带来的性能困扰。

双向赋能:AI与数据库的修行之道

虽然硬件性能的提升为数据库处理海量数据提供了基础,但要真正发挥这些算力,需要对数据库内核进行深度优化。云和恩墨通过改进数据库内核,使之更好地适应现代硬件,如多核CPU、大内存和高速IO子系统,从而实现单机性能的显著提升。

根据其透露的测试结果,在一颗至强®️双路服务器架构上,以50G内存配置,再加上一个NVMe的SSD闪存,云和恩墨达到了700万TPCC的指标,可以说是极大提高了单机能力。

东方国信适用于超大规模数据存储和在线分析的大数据BEH平台企业版通过集成Gluten与VeloxBackend向量化执行引擎,为Spark注入了原生矢量化执行的能力,同时结合第四代英特尔®至强®可扩展处理器,以及处理器集成的英特尔®QAT加速器,显著优化了Spark批处理计算、SparkSQL计算、SQL查询服务的执行效率。经测试,在相同硬件环境下,配合英特尔®QAT的加成,Spark计算性能可提升高达2.9倍。

双向赋能:AI与数据库的修行之道

除了硬件之外,英特尔还强化了在软件及数据库生态方面的投入。张晓军还强调了英特尔在开源领域的贡献,如Apache社区的Gluten项目,已经在很多客户系统里得到了广泛应用,相比传统的Spark,性能可以提高2-3倍,如果其运行在英特尔的硬件上预计取得更优性能,显著提升大数据处理效率。·

数据库与AI深度融合

随着大数据时代的到来,数据量及系统数量都呈指数级增长,数据类型也由结构化数据逐渐演变成了非结构化数据和半结构化数据,这就对数据库系统的稳定性和能力提出了更高的要求,数据库技术和人工智能技术相结合成为当前热门的研究主题之一。

在AI时代,数据已成为驱动企业发展的核心要素,而数据库作为存储、管理和分析数据的重要基础设施,与AI技术的深度融合将是大势所趋。这种融合不仅能够提升数据库的性能和智能化水平,还能够推动AI技术的应用落地。

数据库厂商在不同维度上探索和应用AI,东方国信正在利用AI技术,尤其是在智能取数方面,通过自然语言处理生成SQL语句,提高数据提取的灵活性和效率。同时,他们也在探索智能建仓,尝试通过AI技术自动化数据仓库的构建和维护流程,旨在实现数据仓库的自动化和智能化。

查礼表示,公司正积极研发解决方案,旨在通过AI辅助减少人工介入,提高效率,预计通过AI技术的引入,数仓维护成本能降低60%。

PingCAP利用AI算法进行资源管理,让数据库更适应复杂多变的业务场景。林景旭强调,通过集成AI技术,比如利用AI优化数据库内部管理,提升数据库本身的智能水平,使其在满足复杂业务场景的同时,降低使用门槛。这意味着数据库不仅要有强大的数据处理能力,还需具备自我管理和优化的能力,确保在面对日益复杂的业务需求时,能更加自主、高效地运行。

云和恩墨则推动自身“AIforDB”和“DBforAI”的双向促进,杨廷琨指出,云和恩墨利用AI提升数据库性能,尤其是在数据库智能资源管理、智能监控、智能根因追踪、智能参数调优、SQL智能优化以及自动驾驶等方面的应用潜能。

结语

现代数据库与人工智能的结合不仅对处理能力、架构灵活性和用户体验提出了更高要求,也为数据库产业带来了前所未有的发展机遇。随着技术的不断进步和生态合作的深化,未来数据库将更加智能、灵活和强大,为数字经济的发展提供坚实的基础。英特尔与数据库领域的合作伙伴将一起共同推动数据库产业向智能化、高效化转型,满足客户的业务创新需求。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-06-29 06:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

ChatGPT爆火后,如何跳脱算力困局?
...集型工作负载数据移动和转换性能提升至1.7倍;面向内存数据库和大数据分析工作负载的英特尔®存内分析加速器(英特尔®IAA),能显著优化数据分析工作负载内存占用和查询吞吐量,性
2023-02-22 17:40:00
英特尔至强w9-3595x现身基准测试数据库
...作站处理器旗舰型号至强W9-3595X近日现身Geekbench基准测试数据库,测试信息显示其仍隶属SapphireRapids家族
2024-02-02 16:19:00
最前线|CPU AI性能提升10倍!英特尔推第四代至强可扩展处理器,以及超1000亿晶体管GPU
...现更优性能。存内分析加速器(英特尔IAA),适用于内存数据库、开源数据库以及RocksDB和ClickHouse等数据存储工作
2023-01-11 22:21:00
英特尔宣布更新C++文件库:数据排序性能增加17倍
...MD指令集的说法,英特尔处理器可以实现对于16位以及64位数据库的快速排序,比如说在英特尔11代酷睿移动处理器也就是Tiger Lake上
2023-02-23 07:00:00
全新英特尔 至强 可扩展处理器,打破数智化变革瓶颈的一板利斧
...体及其他数字化服务带来更低的成本和更优的性能;而在数据库和数据分析方面,五代至强® 可扩展处理器通过更大的三级缓存、更快的内存和英特尔® 数据分析引擎,可以高速运行 CRM、
2023-12-20 19:21:00
专访英特尔数据中心与人工智能集团副总裁兼中国区总经理陈葆立
...体分析。这具体取决于应用方向是人工智能、搜索引擎、数据库还是一些电信网络的服务。陈葆立表示:“英特尔得益于多年的积累,对于众多应用有着不同的加速器,这带给用户的性能将会比纯粹
2023-01-22 08:00:00
最强服务器CPU来了!AI性能直接翻倍
...在得到如此丰沛的内核资源支持后,也依然是科学计算、数据库和AI任务中的矢量计算担当。 这些加速器的升级与焕新带来的成果就是下图这种多负载性能表现普遍倍增的现象,在AI领域,
2024-09-27 20:45:00
...里云采用第五代至强实现八代实例g8i算力再升级,推理和数据库性能双双提升25%;火山引擎第三代弹性计算实例,基于第五代至强进行全系升级,相较于升级前整机算力提升39%,应用性
2023-12-19 15:43:00
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
...数据一致性问题;也有人提出最大的问题应该是出现在了数据库。但总而言之,这并非是纽交所今年来第一次出现的故障,而是众多里的一个: 甚至某开源数据库联合创始人Jason直言不讳地
2024-06-28 23:00:00
更多关于科技的资讯:
浙江日报讯 (记者 孟琳) 近日,在位于湖州市吴兴区的微仪光电(浙江)有限公司内,技术人员正对超分辨光学显微镜进行调试
2026-02-28 08:44:00
孙小荣:为什么出现“文旅热,经营难”的悖论?
在“流动性”的状况下,一切都有可能发生,但一切又都不能充满自信与确定性地去应对。——齐格蒙特·鲍曼如今,除了在家跟孩子们一起追剧
2026-02-28 09:18:00
孙小荣:从“合川杀猪”看液态运营的四大策略
在我构思这篇文稿时,合川女孩“呆呆”的一条社交媒体求助意外带火了家乡。临近年关,她因担心父亲按不住猪,发帖求助帮手杀猪
2026-02-28 09:50:00
“在‘十五五’开局在即之际,我们正式推出‘兴火科技’品牌,就是希望抢抓新一轮科技革命和产业变革机遇,坚持深耕现代化产业体系
2026-02-28 10:07:00
从一次合作到长期回购,擅长化工行业的奔日阀门与客户共成长
近日,某化工企业再度与奔日阀门展开合作,一次性采购近百台奔日控制阀,用于其核心化工管道改造项目。此次批量采购,既是双方五年深度合作的见证
2026-02-28 10:08:00
孙小荣:五大特征三重驱动,重构文旅超级体验
当代消费者社会的文化受这样一条信条支配,“如果你能做到,你就必须做到。”——齐格蒙特·鲍曼即便面临经济下行、消费紧缩等多重变量
2026-02-28 09:18:00
2月26日,山西移动首条万兆全光网络在晋源区数智流量园正式开通。从施工到交付,仅用不到一个月时间,实现了4.7万平方米园区万兆网络全覆盖
2026-02-28 07:19:00
最近,小区里不少居民都注意到了一位新“伙伴”——一个四四方方、能自己“走动”的充电宝。“真有意思,充电宝自己开过来了!”有居民这样形容它
2026-02-28 07:43:00
1秒3亿元,单日突破10亿元!老铺黄金调价前夕,“买金热”太猛了
“手一慢,就错过。”这两天,抢完了春节红包的网友们,开始了马年的新一轮拼手速——“抢黄金”。今年以来,多个黄金品牌“先涨为敬”
2026-02-28 07:44:00
正月初九,新年正式开工的第二天,杭州泓森智航科技有限公司创始人胡方扬就被客户长龙航空“请”进了公司——主要是为空中安保执勤的执法仪装上实时预警的“眼睛”和“大脑”
2026-02-28 07:44:00
“到杭州了,正式开门接客!年前的预约和没来得及回复的朋友们,随时滴滴。”庞昊洋坐在电脑前,发出了这条朋友圈,屏幕上是正在打磨的剧本
2026-02-28 07:44:00
■赵磊摘要:随着人工智能技术在营销领域的广泛应用,品牌内容生成方式正发生深刻变革。基于人工智能的内容生成工具,能够在短时间内大规模生产多样化的品牌传播内容
2026-02-28 04:57:00
随着新一轮科技革命与产业变革的深入推进,人工智能、大数据、元宇宙等数字技术的快速发展,正在深刻重塑人们的生产模式与日常生活方式
2026-02-28 04:57:00
■王晓静摘要:随着数字平台在服务业中的广泛渗透,医疗美容行业逐渐由以单体机构为中心的线下运营模式,转向以平台为枢纽的网络化运营结构
2026-02-28 04:57:00
具身智能“百亿俱乐部”崛起 河南凭啥成为下一个重仓地?
大河网讯 当中国具身智能领域迎来爆发式增长,以银河通用、智元机器人、宇树科技、千寻智能、星海图、智平方等企业组成的“百亿俱乐部”强势崛起
2026-02-27 20:11:00