• 我的订阅
  • 科技

深耕文档型数据库12载,SequoiaDB再开源

类别:科技 发布时间:2024-01-16 12:00:00 来源:爱云资讯

1月15日,巨杉数据库举行SequoiaDB新特性及开源项目发布活动。本次活动回顾了巨杉数据库深耕JSON文档型数据库12年的发展历程与技术演进,全面解读了SequoiaDB包括在高可用、安全、实时、易用性四个方向的技术特性,宣布了2024年面向技术社区的开源计划。此次发布活动不仅是对SequoiaDB性能的全面介绍,更是对十余年来始终坚守以JSON文档型数据库内核为技术底座的发展历程的深刻回顾。不忘来时路,方知向何行,巨杉数据库也将在2024年新年伊始,迎来新的篇章,开启新的征程!

稳健发展,行业影响力不断提升

回顾过去,巨杉数据库自2011年研发内核、2012年公司成立,至2013年推出SequoiaDBv1.0版本,再到如今已走过十二个春秋。历经12年的洗礼,巨杉数据库也取得了令人瞩目的成就。目前,巨杉数据库已经在超过100家大型银行及金融机构的核心生产业务规模应用,覆盖各行业的企业用户总数超过1000家。在金融行业,其客户群体涵盖国有银行、股份制银行、省级农信、城商行、保险、证券等金融机构,同时还积极扩展政府、汽车、新能源等多个行业客户,赢得了广泛的市场认可。其中超过50家企业的应用时间已超过6年,最长的系统运行时间甚至达9年。自成立以来,公司实现稳健发展,行业影响力不断提升,数据量及业务接入保持持续增长态势。

深耕文档型数据库12载,SequoiaDB再开源

守正创新,发展JSON文档型内核

巨杉数据库SequoiaDB以JSON文档型数据库内核为技术底座,通过分布式架构为众多客户提供了多元化的业务和全方位的支持。正是因为对技术创新的坚持以及对市场需求的洞察,巨杉数据库始终坚守JSON文档型内核,在持续迭代中实现创新发展。

在JSON基础能力方面,从最初v1版本,实现CURD原子性的操作以及基础的ACID支持,到v2版本逐步提升对LOB大对象的存储能力,标志着巨杉数据库具备“多模数据”处理能力,同时支持存储过程、聚集计算等特性。在v3.0版本中,进一步提供自增序列全文检索、基于时间点的数据恢复和兼容部分Mongo语法。跨越4.0版本,到v5.0版本,SequoiaDB着力提升稳定性能,对于统计信息、访问计划、存储等进行了大量优化,提供死锁检测等功能,并进一步地兼容Mongo3、Mongo4的语法。

在分布式管理方面,从基础的多分区原生分布式架构,逐步提供读写分离、主子表、策略访问、多中心容灾、精细化容灾等特性,持续增强分布式能力。

在安全性方面,涵盖从基础的鉴权、加密到信创的各类能力。此外,推出了SCM内容管理引擎,专注于非结构化数据和多模数据处理的统一数据生命周期管理。

在易用性方面,通过SAC运营的管理平台,全面提升DBA运维的便捷性。

十二年来,巨杉数据库基于JSON文档型数据底座和分布式架构的不断更新与迭代,为企业提供可靠的数据处理和存储解决方案,帮助企业优化业务效率,提升客户满意度。

深耕文档型数据库12载,SequoiaDB再开源

广泛拓展,基于文档型技术的应用场景

在中国乃至全球范围内,“CM场景”是文档型技术应用中重要且突出的场景。基于处理多变的数据结构和庞大的数据量的迫切需求,催生了“CM内容管理平台”,同时极大地推动了SequoiaDB技术的创新。巨杉数据库持续跟进客户需求,进行技术迭代,实现从1.0到5.0的跨越式发展。巨杉数据库为金融银行客户提供,稳定、可靠、可持续扩展的「CM内容平台」成为「银行影像平台」及「非结构化管理平台」的数据基础设施,目前已吸纳超过100家客户使用该场景。可以说,基于文档型技术并应用于“CM内容管理平台”场景是巨杉数据库取得的最为显著的成果之一,这一场景也持续为巨杉数据库贡献了超过85%的客户及营收,成为业务的主打业务场景。

此外,文档型数据库在在线业务系统、实时数据湖、IoT领域以及AGI人工智能等领域也得到广泛应用。JSON灵活的格式适合各种在线业务系统,尤其是面向需要快速迭代开发的各类APP的业务应用,基于文档型数据库的开发,可以显著提升团队的研发效率。在实时数据湖方面,巨杉数据库借助JSON灵活的数据处理能力,已助力多家客户构建全量历史数据平台,支持跨系统、跨业务的实时高并发数据查询。

深耕文档型数据库12载,SequoiaDB再开源

VectorSearch基于文档型技术,探索AGI数据应用新边界

AGI通用人工智能的发展,将进一步推动JSON文档型数据类型的应用(实际上,本次发布活动中,VectorSearche部分的讲解也是通过AI技术合成的)。

传统AI应用中,需要存取及处理的是,海量的半结构化「CM内容管理」数据、「动态标签」数据,以及各类非结构化对象数据。这些都正是SequoiaDB过去12年聚焦及取得显著成果的领域技术,而AGI全新的爆发性发展,必将对JSON文档型技术,带来全新的机遇及技术挑战。当前,业界领先的OpenAI、文心一言等大模型平台中,JSON已经被指定为对内,及对外,函数调用的,标准数据传输格式。

另外,我们可以看到“向量数据”在AGI通用人工智能发展中,得到了关键的应用,需要更有效的数据库处理能力。

向量数据的存放格式,天然就可以用JSON结构表示,非常适合通过文档型数据库处理。然而,单独使用向量数据,并不能解决业务的全景问题。在业务过程中,向量数据还必须与其他业务数据进行组合使用,才能发挥其价值。因此SequoiaDB也正在探索,为文档型数据库提供「VectorSearch向量搜索」能力,为保存到SequoiaDB的向量数据,提供高效的查询能力,这一特性将在2024年与大家见面。

要注意的是,我们并不需要发展独立的向量数据库产品。而是基于深耕了12年的JSON文档型数据库底座技术为基础,进行向量查询能力的扩展,这将可以帮助企业,驱动实体世界的更多数据,和AGI通用人工智能进行有效链接,释放全量数据价值。

深耕文档型数据库12载,SequoiaDB再开源

四大特性,释放全量数据价值

巨杉数据库基于JSON文档型底座对SequoiaDB进行了全面升级,此次发布活动全面解读了SequoiaDB的四大特性——高可用、安全、实时和易用。

深耕文档型数据库12载,SequoiaDB再开源

高可用:文档型数据库处理的数据,包括了结构化的元数据、半结构化的标签数据,以及非结构化的对象数据。对于PB级大数据或上百节点规模的大集群,在面对重大灾难时的数据可靠性、数据一致性和系统可用性时都面临着巨大挑战。精细化容灾能有效地帮助客户实现针对这些数据的多中心容灾,从而提升整体系统的高可用和数据高可靠能力。

安全:巨杉数据库不仅在技术上通过国密算法和硬件加速来平衡安全与性能,还提供了跨国内外不同芯片、不同操作系统的混合部署能力。这意味着巨杉数据库可以实现集群的异构部署,平滑地进行硬件资源的替换,对上层业务系统做到完全透明,保障业务连续性。

实时:巨杉数据库凭借JSON文档型数据结构的Schema灵活性,为企业提供了全量数据底座。DDL的实时变更、横向扩展能力,以及高性能的并发点查能力等都颠覆了传统ODS数据贴源层的界限,使得ODS能够服务于实时业务,满足对客实时数据查询和企业内部跨业务数据实时汇总的需求。

易用:巨杉数据库进一步增强了SAC的监控、告警和管理等功能。一站式的数据管理工具,极大地方便了DBA的管理工作,提高了问题排查的效率并简化了对系统的监控管理,从而为业务带来更高的稳定性和效率。

开放、开源共赴新篇章

深耕文档型数据库12载,SequoiaDB再开源

新年伊始,巨杉数据库也将谱写崭新篇章。发布会介绍,巨杉数据库决定将在2024年Q1再次发布开源版本,不仅希望获得社区同仁的参与和监督,让产品未来发展更透明;同时也承担历史责任,希望通过开源的方式吸引更多合作伙伴,共同发展中国的分布式文档型数据库生态链,促进业务的快速迭代和开发效率的提升。近期,SequoiaDB新版本的源代码将通过Gitee、GitCode及GitHub再次开源。

深耕文档型数据库12载,SequoiaDB再开源

以上内容为资讯信息快照,由td.fyun.cc爬虫进行采集并收录,本站未对信息做任何修改,信息内容不代表本站立场。

快照生成时间:2024-01-16 15:45:29

本站信息快照查询为非营利公共服务,如有侵权请联系我们进行删除。

信息原文地址:

内部软件技术文档怎么做?
...文档,查看超文本和多媒体(音频和视频)通过Web服务器数据库。此外,对于任何组织来说,提供对公司网站的公开访问都变得必要和关键,这需要恒定、可靠、交互式的网络表单、真实的交易
2023-02-24 14:18:00
【划重点】医院信息互联互通标准化成熟度测评方案(2020年版)
...。3、分级要求一、技术架构内容1、数据层面整合:系统数据库之间的数据交换和共享,以及数据之间的映射转换2、应用(服务)层面整合:系统之间实时或异步信息共享与业务协同3、使用总
2023-08-23 12:00:00
国产AI大模型“曹植”发布
...。此外,“曹植”针对不同行业开发特定应用和训练专属数据库,使用海量训练数据进行曹植大模型的预训练,生成具备基础语言能力和垂直应用能力的模型;支持个性化定制,本地服务器私有化部
2023-07-07 23:27:00
互联网知识:搜索场景的基础
...升搜索结果的准确度。2.分词分词是当输入关键词无法与数据库完全匹配时,则会将关键词拆分为多个Term(Term可以是词组也可是汉字)再与数据库匹配。如:“九转大肠”无匹配内容
2023-02-23 13:38:00
李彦宏叫板GPT-4:百度“全家桶”AI化完成,10多款原生应用上线
...可提升对知识图谱的理解和查找能力;在输出环节,通过数据库的反馈机制,提升输出结果的准确性。据了解,从3月以来,训练算法的效率提升到了3.6倍。AI版“App Store”上线
2023-10-18 13:00:00
AI人工智能问答FAQ基础的数据内容支撑从何而来?
...。这些工具可以是专门的知识管理软件、内容管理系统或数据库。知识更新和维护:定期对知识库进行更新和维护,及时添加新的问题和答案,删除过时或不准确的内容。这有助于保持知识库的时效
2023-09-01 10:38:00
5W 分析法,彻底搞懂云计算
...aaS(平台即服务):不想购买和部署服务器、操作系统、数据库和web中间件等资源,又想运行自己应用程序的用户,可以选择直接在PaaS上自由构建自己的应用程序
2023-08-13 19:00:00
夸克扫描王App上线 应用AI大模型技术提升手机扫描精度效率
...扫描文字存在阴影遮挡或破损等情况,夸克扫描王在结合数据库里的训练样本后,可以根据上下文的语义解析,去进行匹配定位,从而扫描出一份清晰、平整、有逻辑的电子文档。过去一年,夸克扫
2023-08-29 18:15:00
事密则成:只有高度保密,事情才有可能成功
...越常见了,新闻中经常爆出A公司泄露了用户信息,B公司数据库遭到攻击。企业只有从思想上高度重视信息安全,并在行动中建立严格完善的信息保密制度,并执行到位,才能确保公司的机密信息
2023-01-18 12:00:00
更多关于科技的资讯: