• 我的订阅
  • 科技

NFTScan x TiDB 一栈式 HTAP 数据库为Web3业务提供毫秒级多维查询

类别:科技 发布时间:2023-02-25 10:00:00 来源:中关村在线

2023-02-24 17:52:10 作者:宋均益

NFTScan 成立于 2021 年 4 月,是一个多链 NFT 数据基础设施服务商,截止到 2023 年 1 月份,NFTScan 已经支持了 11 条区块链网络,包括 Ethereum、Solana、BNBChain、Moonbeam、Polygon、Arbitrum、Optimism、Avalanche、Fantom、Cronos、PlatON 网络。

NFTScan 旗下有 2 个核心业务:NFTScan.COM 多链 NFT 数据浏览器平台和 NFTScan OpenAPI 开发者平台。NFTScan 主要为 Web3 用户提供高效简洁的 NFT 资产搜索查询服务,以及为 Web3 开发者和新一代金融科技公司提供专业的 NFT API 数据服务。

NFTScan x TiDB 一栈式 HTAP 数据库为Web3业务提供毫秒级多维查询

目前,NFTScan 数据库收录了 100万+ 个 NFT 合约地址,7 亿多枚 NFT 资产数据,17 亿多链 NFT 链上交互记录。并且这个数字还在以每日 3000 个 NFT 合约地址和 200 万个 NFT 资产的速度在递增。从上述数据可以看出,NFTScan 有着增量大,活跃度高两大特点。这样的业务特点决定了 NFTScan 对数据库技术架构要求极高,需要具备全面、实时、高效等特性,并满足高并发、低延时等需求。选择一个合适的,能满足业务需求的数据存储体系对 NFTScan 来说至关重要。

NFTScan x TiDB 一栈式 HTAP 数据库为Web3业务提供毫秒级多维查询

以前的 MySQL 解决方案的挑战

此前,NFTScan 使用 Amazon Web Services (AWS) 上的 MySQL 和 Elasticsearch 作为其核心数据库解决方案。MySQL 存储了所有业务数据,包括来自 B 端和 C 端用户的用于分析和处理的数据。其中,NFT 的交易记录和资产记录是核心的业务数据模型,B 端和 C 端的查询也大部分是围绕这两类核心数据展开的。由于 NFT 数据每天都在持续增长,多维度查询会存在一些分布不均匀的现象,NFTScan 将 NFT 交易和资产相关数据以全索引方式同步到 Elasticsearch,以近乎全字段索引的方式响应多维度 NFT 数据查询,从而解决 MySQL 在多维度检索海量数据方面的性能与效率瓶颈。

该解决方案在使用半年后, NFTScan 逐渐发现其无法满足业务的快速增长,存在以下缺陷:

可扩展性差,存储和维护成本高。每天新的区块链数据量急剧增加,但 MySQL 无法自动横向扩展以应对不断增加的工作负载。NFTScan 不得不手动对表进行分片并新增 MySQL 的主备集群,来分摊和均衡 CPU 和内存资源的使用,这大大增加了存储和维护成本。

随着成本的增加,使用率下降。Elasticsearch 部署在 AWS 上,由于 AWS 原生集群配置的限制,NFTScan不得不增加更多的 Elasticsearch 高配置数据节点来提供在线查询服务,这导致成本上升和使用率降低。

反复出现的精度错误。Elasticsearch 数据库更多的是为搜索而设计的,而不是为计算设计,所以在聚合计算中存在精度误差。

为什么选择 TiDB?

经过近一个月的调研和测试,NFTScan 最终选择了 TiDB 来作为核心数据架构,替代原有数据库系统。NFTScan 研发团队在调研中选择 TiDB 主要有以下几点考量因素:

高度兼容 MySQL :TiDB 在传输协议和 SQL 语法等方面与 MySQL 高度兼容,NFTScan 可以轻松地将数据迁移到 TiDB,MySQL 兼容性大大减少了研发团队使用新数据库的学习成本、时间和精力,同时也能加速数据库架构的迁移工作;

弹性伸缩:TiDB 采用计算和存储分离的分布式架构以及底层分布式存储数据的设计机制,NFTScan 可以根据读写流量的实时变化灵活伸缩计算存储资源,最大限度地提高了资源使用率,并大幅降低了成本;

一体化 HTAP 架构:TiDB 的 HTAP 能力可以同时处理事务和分析工作负载,一套数据库即可满足事务型数据库和分析型数据库的需求,不仅完美地满足了 NFTScan 不断增长的业务需求,还降低了整体运营成本;

高可用性:TiDB 本身的数据副本同步机制和内置的灾备方案,保证了整体数据库服务的高可用性。

迁移方案

经过两个月的时间,NFTScan 完成了将底层数据库系统全部切换到 TiDB 的工作,通过部署 2 台 TiDB 服务器、9 台 TiKV 服务器和 2 台 TiFlash 服务器,并在同一 region 下,跨三个可用区(AZ) 进行部署,保证了整体架构的高可用性。

截至 2022 年 11 月,NFTScan 的 TiDB 数据库存储了大约 6TB 的业务数据,QPS 达到 5000,平均查询时长40ms,各种应用在 TiDB 上运行稳定。

流畅的迁移体验

在整个迁移过程中,NFTScan 对 TiDB 的性能与数据迁移的流畅性印象深刻。

TiDB 提供了 Dumpling、TiDB Data Migration (DM) 等一系列数据同步套件,帮助 NFTScan 将历史数据从 MySQL 迁移到 TiDB。比如 NFTScan 的一些业务数据是不能直接迁移到 TiDB 的,必须在迁移前先进行调整。在这种情况下,TiDB 的同步工具可以并发写入大量数据。在解析存储实时 NFT 数据时,执行效率较之前的存储方案提升了约 30%。

同时,TiDB 的 online schema update (在线 schema 更新)设计,使得 NFTScan 可以在迁移过程中进行异步更改字段和异步添加索引等数据定义语言 (DDL) 操作,而不会阻塞整个表的读写,这大大提高了业务逻辑调整时数据模式的灵活性。迁移完成后,NFTScan 对 B 端、C 端各类应用程序的数据查询进行了改造,经过充分调优和测试后,逐步将生产环境的应用全部切换到 TiDB。

用户收益

TiDB 支持多维实时查询,查询时间短。TiDB 完美地满足了 NFTScan 高吞吐量和低延迟的核心要求。以业务端的 API 服务为例,平均查询时间从 10-100 毫秒下降到 10 毫秒或更少。即使处理 1,000 QPS,这样的查询速度也能保持稳定。

TiDB 的列式存储引擎 TiFlash ,可以高效地处理分析工作负载。例如,在对某张具有数亿行的表执行复杂查询时,可以在几秒钟内获得结果。

TiDB 的智能 SQL 优化器可以根据数据的分布情况选择最具性价比的数据查询执行计划,让开发者可以灵活调整和优化 SQL 执行计划。 返回搜狐,查看更多

责任编辑:

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-02-25 10:45:09

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

博奥智源,重点项目管理系统开发功能及系统架构分析
...间,现有重点建设项目系统将不再使用,需要将现有系统数据库中的所有业务数据迁移割接至新建系统的数据库,通过数据治理服务,对抽取的相关业务数据,按照发改局相关业务规则要求,制定数
2023-02-01 10:00:00
发挥AI势能,实现价值替代,国产多维数据库有戏
...贞发演示的是一个典型的数智员工场景,它以底层的多维数据库为支撑,再加上数据分析与AI分析,以实现财务智能化,从而为我们打开了一个无人值守的财务管理新世界。多维数据 加速数据决
2023-05-17 12:00:00
睿帆科技雪球数据库Snowball助力北京移动构建运营商数据
...据源种类的变化和用户日益增长的通信需求,数据中心对数据库的实时性、可用性、安全性等能力提出了更高的要求。为进一步优化平台架构、提升O域数据处理能力与管理水平,北京移动2022
2024-03-28 21:50:00
星环科技分布式向量数据库Transwarp Hippo正式发布
...些数据的处理能力较为有限,如使用文件系统、多类不同数据库存储上述数据,在数据存储管理、查询分析效率、数据价值挖掘等方面都存在一定的瓶颈,例如传统数据库查询是点查和范围查的一种
2023-06-16 16:00:00
浪潮KaiwuDB 携手奇瑞超级工厂打造数字能源新标杆
...存储难、数据查询响应慢等一系列掣肘问题层出不穷,对数据库能力提升提出了崭新诉求:• 海量数据存储难:厂区存在水、电、气、热、暖等多种能源监测设备,且数据存储需求在10年以上,
2023-05-10 03:00:00
商商查:以“不变”深耕风控,以“求变”破局商查
...力、偿债能力。“商商查的核心服务就是通过海量的基础数据库和专业的数据分析模型给出全面的商查报告,以及伴随整个商业合作的风险监管,这是商商查的整个价值体现。”商商查产品负责人王
2023-08-28 08:21:00
分布式时序数据库TimeLyre 9.1发布:海量存储、高效压缩、实时分析
...长,呈现出海量性、关联性、时效性、实时性等特征,对数据库写入、存储、分析性能以及实时性提出了更高的要求,如何管理海量的实时数据、从中挖掘价值,是时序数据库需要解决的重要问题。
2023-08-04 11:00:00
中后台产品实践:以智慧城市场景【数据融合治理平台】产品为例
...接口或其它数据入库方式(如kafka中间件、直接后台写入数据库等);在技术选型上,需要考虑支撑实时数据处理(流式、批处理等)、离线数据处理等多种场景。*(2)由于各类数据可能
2024-01-11 12:00:00
星环科技Sophon 3.2发布,通过“六易三仓两中心”实现新一代AI平民化
...据分析大模型SoLar求索,让业务人员在不需要学习和掌握数据库编程语言的前提下自由地按需查询数据。图:LLM平台阶段性演进图图
2023-05-31 16:00:00
更多关于科技的资讯: