• 我的订阅
  • 科技

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

类别:科技 发布时间:2023-08-29 10:59:00 来源:机器之心Pro

随着步入工业 4.0 时代,数字化和自动化的引入,生产环境变得更加高效。同时智能设备带来的海量数据的潜在价值被人们关注,可如何高效地存储智能设备产生的数据,如何更好地对海量数据进行分析成为了难题。传统的数据库模型和存储方式俨然已经无法适应这样的需求。于是有了时序数据库,旨在实现高效地存储、查询数据,帮助更好地发掘数据潜在的价值。

面对这样的状况,清华大学于 2015 年启动了 IoTDB 的研制。2020 年 9 月 23 日 Apache IoTDB 毕业成为 Apache 顶级项目 (Top-Level Project),是目前唯一由我国高校发起的 Apache 基金会顶级项目,也是 Apache 基金会旗下唯一物联网数据管理领域开源项目。2021 年 10 月,Apache IoTDB 核心团队创立了天谋科技,继续运营 IoTDB,帮助工业用户解决数据 “存、查、用” 难题。

对于 Apache IoTDB 研发的核心技术,几位参与者联合发表了一篇综述论文,对于 IoTDB 的设计进行了详细而完整的阐述。文章以一个需要管理上万台挖掘机的工业公司入手,描述了需求 “数据首先被打包到设备中,然后通过 5G 移动网络发送到服务器。在服务器中,数据被写入时间序列数据库,用于 OLTP 查询。最后,数据科学家可以将数据从数据库加载到大数据平台,用于复杂的分析和预测,即 OLAP 任务。”

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

论文重点讲述了如下几个部分:

1. 数据模型的设计:时间序列在逻辑层次上的组织方式和在物理模式中的存储;

2. TsFile 文件格式:自研的列式存储文件格式,同时满足写入、查询等的高效性;

3. IoTDB 引擎:主要包括存储引擎、查询引擎等;

4. 分布式解决方案。

接下来,对这几个重点部分做出更加详细的解读。

详细解读

1. 数据模型设计

(1)如下图,采用树的结构,满足极高强度的写入操作,并能够有效处理物联网场景中常见的延迟数据到达问题。

在树中,每一个叶子节点对应一个传感器,每个传感器都有其对应的归属设备,正如图中最下面两层所示,向上同理。

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

(2)前文阐述了逻辑结构,现在我们来看物理结构的实现,主要为时间序列 ( Time series )和序列簇( Series family )两部分组成。下图展现了每个时间序列是由时间和值两个属性组成,时间序列通过根节点到叶子节点的完整路径来定位。

上图中则展示了序列簇的概念,一个序列簇中可能包含多个设备,它们的数据将一起存储在 TsFile(一种文件结构,在后文中会讲解)中。

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

2. TsFile 文件格式的设计

TsFile 是 Apache IoTDB 自研列式存储文件格式。结构如下图:

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

TsFile 在设计过程中,研究团队主要解决的问题:

主要给出的解决方案:

3.IoTDB 引擎

在这部分,研究者们主要考虑了物联网场景下的延迟到达、高效查询处理、类 SQL 查询的设计。IoTDB 引擎结构如下图:

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

图中我们可以看到主要是用于处理 TsFile 的写入、读取、和管理的存储引擎部分,在这部分中运用了自动延迟分离技术(如下图):

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

对于大多数都在正常的 TsFile 中,没有时间范围重叠时,推荐使用延迟数据分离;对于大多数数据是无序的情况,延迟数据分离则不被推荐使用。

另一重要组成是查询引擎,这部分负责将 SQL 查询转换为可在数据库中执行的操作符。同时,为了适应工业物联网场景,Apache IoTDB 设计了对时间序列数据的丰富查询。

4. 分布式的解决方案

TsFile 可以分布在 HDFS 中,并由 Spark 操作。此外还提供了更好的数据分布和查询处理的原生解决方案,主要为分区复制、NB-Raft 复制和 DYNAMIC 读一致性。

对比结果

论文中提供了 TsFile 与 IoTDB 分别与工业中广泛使用的最先进的文件格式和时序数据库的比较结果,展现了 Apache IoTDB 在多个方面的优势,如下图:

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题
Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

以上两张图,展现了 TsFile 在写吞吐量、读取时间成本、同步的性能上,均优于目前广泛使用的方案。这主要是由于 TsFile 的物联网感知结构设计,避免了存储 deviceId 等冗余信息。

而磁盘占用之所以没有明显优势,则是因为构建了更加精细的索引,导致占用了更多空间,但是这样的牺牲可以在查询时间上带来非凡的改善,我们可以看到读取时间成本的明显优势。

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

上图中可以看到 IoTDB 在几乎所有测试中都表现出更好的性能,更高的写吞吐量和更低的写延迟。

Apache IoTDB:更适合工业物联网场景,存、查、用不再是难题

在上图的实验中,我们可以看到,当查询数据规模较大时,IoTDB 具有更好的性能,IoTDB 的优势在大规模数据聚合中尤为显著。

总结

该论文介绍了一款新的时序数据管理系统 Apache IoTDB ,其开放式架构专门设计用于支持物联网应用的实时查询和大数据分析。该系统包括一个新的时序文件格式,TsFile ,采用列存储的方式存储时间和值,以避免空值并实现有效的压缩。在 TsFile 的基础上,IoTDB 引擎采用类似 LSM 树的策略来处理极高强度的写入,并处理在物联网场景中非常普遍的延迟数据到达。丰富的可扩展查询,以及在 TsFile 中预计算的统计信息,使 IoTDB 能够在 OLTP 和 OLAP 任务中实现高效处理。

基于上述的这些技术,IoTDB 已经成为能够更好面对工业物联网场景的新型数据库。

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2023-08-29 12:45:01

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

分布式时序数据库TimeLyre 9.1发布:海量存储、高效压缩、实时分析
...联网、能源制造、金融量化交易领域等多种时序数据业务场景。近日,TimeLyre正式发布V9.1版本,通过原生分布式架构、5-20倍无损数据压缩能力、每秒千万级数据吞吐能力、优
2023-08-04 11:00:00
星环科技分布式向量数据库Transwarp Hippo正式发布
...调出来的行业模型,都存在着一定的局限性:* 实时性难题:模型训练需要很长的时间,可能需要半年或一年,实时资讯、新闻、市场行情等快速变化的信息,无法及时地内置到模型当中。* 长
2023-06-16 16:00:00
浪潮发布分布式多模数据库KaiwuDB,助力企业构建数据管理坚实基座
...探索,10秒完成500万记录数据15层下钻,切实保障物联网场景海量时序数据的高速入库、极速查询。“人”:以人为本,降本增效KaiwuDB贯彻“产品服务于人”的设计理念,并将其
2023-08-07 20:58:00
浪潮数据库受邀亮相IOTE2024国际物联网展
...众多观众表示无线分布式通信产品能够为其解决当下通信难题提供良好的解决思路。得益于互联网、物联网技术等带来的低成本感知、高速移动连接、分布式计算、智能化分析,我国工业系统正在进
2024-05-06 14:05:00
浪潮KaiwuDB 携手奇瑞超级工厂打造数字能源新标杆
...• 数据查询响应慢:产线能耗实时查询、聚合查询等多场景下的查询性能需达毫秒级,传统数据库难以满足需求;• 数据分析结果单一:能源管控涉及电力、气体、用水等多维度,单一数据分析
2023-05-10 03:00:00
探访北京新质生产力·走出实验室|旧瓶难装新酒,分布式数据库攻关传统运维难题
数据库,和芯片、操作系统一样,是现代信息技术的三大核心基础之一,是IT基础软件的“命门”。数据库的安全、稳定、可靠、性能、容量,对国计民生有根本性的影响,也直接影响数字化转型的进
2024-08-05 22:27:00
阿里云PolarDB斩获SIGMOD最佳论文,成功破解经典多主架构难题
...并发场景下,这些架构仍面临性能和数据融合效率低下的难题。阿里云首次提出基于“分布式共享内存和存储”的PolarDB多主架构,完成了全球首个大规模商用、基于共享存储的云原生多主
2024-06-13 16:57:00
...数据库在许多关键领域应用广泛,并适配于航天、工业等场景。作为入选Gartner《中国数据库管理系统市场指南》的浪潮KaiwuDB分布式多模数据库也将亮相2025数博会。该数据
2025-08-12 00:24:00
深信服重磅发布分布式存储EDS 501高性能版本!
...S 501高性能版本,破除存储业界在处理海量小文件时的性能难题,深入AI、医疗医院&生物科技、多媒体编辑&
2023-06-15 19:00:00
更多关于科技的资讯:
“组团作战”研发一种高品质汽车用钢创新联合体,解汽车制造业“痛点”日前,一个好消息从长城汽车股份有限公司传来:一种新研发的纯锌镀层热成形钢
2025-09-07 07:50:00
第六届金芦苇工业设计奖精品展开幕汇聚13个国家及地区的500余件佳作河北日报讯(见习记者李畅)9月1日,由雄安新区未来工业设计研究院主办
2025-09-06 08:32:00
近日,山大路街道山大社区联合芯赛博开展数码公益活动,围绕“免费、实用、贴心”,为居民提供0元贴膜、老旧照片AI修复、数码产品检测三项服务
2025-09-06 09:15:00
老乡鸡IPO:供应链协同力,食材管控体系获认可
近日,中式快餐品牌老乡鸡的IPO进程持续引发行业关注。作为门店数量超1500家的连锁餐饮企业,老乡鸡能在竞争激烈的快餐赛道站稳脚跟
2025-09-06 15:47:00
111大健康产业发展论坛走进北京同仁堂启动北京“店效王”孵化计划
当“健康中国2030”战略持续深化,大健康产业正迈向“品牌化、专业化、协同化”的新阶段。北京作为全国健康服务的前沿阵地
2025-09-06 15:49:00
解码鸿蒙有礼:华为砸下真金白银,花钱赚吆喝还是格局再打开?
9月4日,华为Mate XTs 非凡大师及全场景新品发布会在深圳召开,华为Mate XTs 非凡大师、华为智慧屏 Mate TV
2025-09-06 15:49:00
大皖新闻讯 九三阅兵期间,来自合肥高新区的四创电子提供了技术、设备、人员等多方面保障。他们分布在首都各区域,精准捕捉预测风
2025-09-06 17:26:00
从看砖头到看专利 贵阳市“科创积分贷”让科技型企业“知产”变现
“从提交申请到拿到贷款只用了两周多,申报材料比传统贷款少了三分之一,效率提高了50%!”近日,贵州捷众森建材有限公司董事长顾潘拿着“科创积分贷”到账凭证感慨道
2025-09-06 18:15:00
大河网讯 9月6日,细雨蒙蒙,湿润的空气中带着淡淡的江水气息,山城重庆显得格外宁静。可在重庆国际博览中心内却是另一番景象——2025世界智能产业博览会正在这里举办
2025-09-06 22:20:00
2025智博会“四链”融合对接暨“渝链通”发布活动成功举办 助力科创企业融资破局
大河网讯 9月6日,2025世界智能产业博览会“四链”融合对接活动——智能产业股权融资专题对接暨“渝链通”服务方案发布会在重庆国际博览中心圆满举行
2025-09-06 22:20:00
从茶叶到瓶装茶,小罐茶高香无糖茶加速传统茶企转型
健康消费升级持续推动市场扩容,无糖茶赛道正迎来众多品牌加码布局。尽管消费场景细分和产品升级带动无糖茶市场与受众不断扩大
2025-09-06 15:51:00
大河网讯 人工智能是新一轮科技革命和产业变革的重要驱动力量,对全球经济社会发展和人类文明进步产生了深远影响。9月5日,2025世界智能产业博览会在长江之畔重庆开幕
2025-09-06 13:08:00
国家级5G工厂,钟经开+1!
近日,工业和信息化部公示了《2025年5G工厂名录》钟楼经济开发区企业江苏电力装备有限公司成功入选成为继江苏精研科技股份有限公司后钟楼区第二家国家级5G工厂5G工厂是充分利用以5G为代表的新一代信息通信技术
2025-09-06 06:08:00
从玻璃到微纳新材料 从企业更名看龙口一家民企的转型跃迁
大众网记者 林晓冬 烟台报道说起玻璃大家都不陌生,餐桌玻璃、门窗玻璃都与我们的日常生活息息相关,但在烟台龙口有一家企业多年来持续在玻璃上“钻研”
2025-09-05 09:08:00
科创泉城 智启未来| “硬科创”需要“软传播”,网络达人共话“出圈”新思路
9月4日下午,在济南市委网信办联合山东省互联网传媒集团举办的“科创泉城 智启未来”知名网络达人济南采风活动的对话沙龙上
2025-09-05 09:51:00