超融合数据库:解锁全场景数据价值的钥匙

2023-10-27 · YMatrix Team
#行业观察

前言

近日,四维纵横对外官宣已完成上亿元 B 轮融资。作为超融合数据库理念的提出者,三年来 YMatrix 持续在超融合数据库领域中保持精进与迭代,对于超融合数据库在行业、场景中的应用和理解也更为深刻。

本篇文章,我们将基于 YMatrix 的功能路径和最佳实践,详细阐述超融合数据库的价值与应用。

伴随着全新的应用场景不断出现,各类数据库如雨后春笋般层出不穷,截止上月,数据库专业媒体 DB-Engines 对外发布的全球数据库排名榜单已经收录了 400 多款产品。不过无论数据库产品的数量如何变化,对于企业而言,其对于数据库产品的核心诉求始终落脚于“性能、功能、运维、成本”。

归根结底,符合企业的真实需求,从真实环境中的痛点出发,才是数据库选型过程中要遵循的最重要的原则。平衡功能、性能、复杂度,切实提升可用性,降低人员的运维与学习成本,尽可能实现“花小钱办大事”,这才是企业在数据库选型过程中真正“务实”的思考方式;而如果简单关注某一个角度,最后结果难免差强人意,使整个系统的运行效率被木桶中最短的一根板子所限制。

1.融合,正在成为当下最热的“技术趋势”

面向新一代需求,打造一款用户真正需要的数据库。

整体上看,数据库发展至今已经覆盖了用户在不同维度、不同角度的需求。然而,当前大部分数据库仍很难满足企业的实际需求。在应用场景中,一条业务线中使用多款数据库已是一种常态,Gartner 报告指出,大约 85%的企业 IT 系统都会使用一种以上的数据库产品。究其原因,还是各个产品虽然各有所长,但也明显各有所短,高吞吐量、低延时、分布式无感知、强一致性、运维友好度甚至稳定性等维度难以实现面面俱到。

正是这种“常态”,为企业带来了不少问题:

  1. 各种产品授权费用,专业技术人员聘用、复杂架构导致的稳定性差等带来了较高的成本压力;

  2. 相互之间数据难以流通,构建跨部门的服务技术、进行跨部门数据分析十分困难;

  3. 数据来源随着业务发展愈发复杂,图像、音频、文本等海量的非结构化数据为数据的整合处理带来较高的难度。

因此在实际使用场景中,企业往往需要用到非常多的中间件来搭建一套复杂的数据系统,其中包括 OLTP 数据库、OLAP 数据库,消息队列、流引擎、ETL 工具等等。这样一来,会导致系统复杂度不断膨胀,无论是从运维、使用角度来看,还是从长期业务发展角度来看,都是企业不得不面对的难题。

时代需要一款能够覆盖大多数业务场景、满足绝大多数应用需要的超融合数据库。

2.超融合,都“融合”了哪些

不只是融合技术,更需要融合场景。

超融合数据库关键词在于“融合”,如果将不同技术融合,会带来怎样的改变?

通过智能手机的发展历史,可以更好解释未来数据库的演进趋势。在创新融合通信、计算、影像、交互等多领域技术之后,智能手机不但大幅提升了用户使用这些技术的便利性,更多的,融合的能力在不同场景下协同作用,催生了无数新的可能性,改变了我们的生活,也创造了一个全新的行业。

将视角转回到数据库,如果我们将种种关键技术融合,相信也会在大幅提升数据使用便利性的同时,也能够带来更多可能性,让数据在企业中创造出革命性的全新价值。

这便是超融合的核心理念,即在数据库碎片化的大潮下,将计算、存储和网络资源整合在一套系统中,结合应用场景的原数据库种类、版本、部署状况、业务特性等方面,在公共基础组件之上,为不同业务场景需求提供不同的存储、执行引擎组合,实现不同的微内核,以得到针对性的写入、存储、查询性能提升。

  1. 数据库超融合,将很多资源打了包

数据库的稳定性、性能和安全性等层面是企业需要重点考虑的因素,超融合数据库就是将这些不同类型的资源进行了打包,并统一为一套完整的数据库系统,这样用户在使用时只需关注整体数据库架构的可用性和性能,无须关心各种数据库产品的具体细节。当所有类型的资源都统一在一个平台上时,才能真正便于用户解决业务系统当中所存在的问题。

融合了数据类型:在物联网+数智化时代,万物智联,数据的来源丰富,种类繁多且规模巨大,包括结构化、半结构、非结构化的多模态数据。对于政府、机构、企业而言,高效处理这些数据是绕不过的关卡。因此,大家往往会选择专有数据库来存储和处理各种不同模态的数据,不过从实时性来说,使用一种数据库来实现存储和处理的效率是最高的。因此,能否融合多模态数据于一身,将成为超融合数据库能力的标配。

融合了数据场景:随着数据处理应用场景不断拓展,单一的操作方式已无法满足复杂多变的业务需求,这些操作包括增删改查、点查询、明细查询、聚集查询、多维查询、OLAP、机器学习等,为用户提供更灵活、更高效的数据处理方案。因此,能提供全场景一站式解决方案,也就成为了超融合数据库最重要的能力之一。

融合了数据性能:当下,海量高并发数据已经对数据库形成了极大的挑战,此时再叠加多模态数据处理的复杂性、全场景操作的多样性,对数据库的性能将带来极大的挑战。因此,超融合数据库需要进行精心的性能设计,在内核及并行框架上进行更全面的优化。高性能,是超融合数据库最重要的根基。

  1. 数据库超融合,简化复杂技术栈

在部署多款数据库集群的情况下,技术架构会变得更加复杂,十分不利于业务线之间的数据流通以及企业的整体管理。而且不同数据库之间所需适配的功能生态也有所区别。以上因素交织在一起,技术栈的复杂程度可想而知。因此,超融合数据库需要将不同的技术路线组合起来,能够在不同的环境下分别完成不同的工作,为企业庞杂的 IT 系统提供统一的数据基座,以替换过去极为复杂的技术栈。

融合了数据使用:超融合数据库本质是化繁为简从而一站式解决问题,从理念来看,这款数据库就必须要做到简洁易用。因为要承接多模海量数据,所以超融合数据库必须是分布式系统,但分布式系统的复杂程度较高,难以实现快速部署、简便管理。此外要承接各种多模操作,没有直观的用户界面、缺少丰富的文档和友好的 API,不能支持多种编程语言和平台,又如何让开发者快速上手。因此,易用性,是超融合数据库最重要的前提条件。

3.YMatrix 在超融合下的探索

专注全场景覆盖。

过去几十年来,数据库领域的技术解决方案一直都比较稳定,其根本作用并没有产生太大的变化,稳定的同时也使其理念和形态逐渐变得相对陈旧。不过,这一切在万物智联的时代都得到了改变。融合,开始成为了当今数据库发展的主题。

前期数据库稳定固化的技术,正在新环境、新挑战下发生新变化,未来很长一段时间,一家企业在多个业务场景下使用多款数据库就是常态。而 YMatrix 所要做的,就是颠覆这种“常态”。YMatrix 关注全场景性能表现,包括写入能力、时序查询能力、OLAP 分析、机器学习性能以及 OLTP 能力等,帮助企业采用一款数据库来应对多种复杂场景,从多方位实现资源规格的灵活控制、应用的多模、扩展能力以及成本控制。

与其它架构的数据库相比,YMatrix 的超融合体现在融合了多种数据类型与数据操作,从而在一个数据库内实现多种数据类型 + 多场景的高性能支持;就 YMatrix 内部架构而言,其具有微内核特征,可以在公共基础组件之上,为不同业务场景需求提供不同的存储、执行引擎组合,实现不同的微内核,以得到针对性的写入、存储、查询性能提升。

  1. 性能卓越

在性能层面,YMatrix 超融合数据库只有一个系统,相较于由多个技术栈所组成的数据库体系,YMatrix 超融合数据库最为稳定和健壮。此外,YMatrix 为用户提供了支持多数据类型的高速写入工具 MatrixGate,具有高并发、分布式、流式、批量写入数据等特性,可满足企业时序场景下的实时入库,同时提供完整的事务保证;此外,YMatrix 支持行列混存,结合完全自研的 MARS3 存储引擎与向量化执行引擎,在大数据分析场景下能够将查询执行效率提升至全新水准。

  1. 功能完善

通过融合分析、事务、时序等能力,YMatrix 为用户在多行业、多场景下构建一套强大的数据基础设施,提供了完善的能力组合。超融合数据库架构相较于其它数据库,融合了多种数据类型与数据操作,能够在一个数据库内实现多数据类型 + 多场景的高性能支持。由于超融合数据库架构的特性,企业的业务数据都集中于 YMatrix 中,有助于企业从更加全面的角度进行科学决策,轻松实现多条业务+多场景数据的联合分析;

在开发阶段,由于数据和业务流程都在 YMatrix 超融合数据库之中,可以为企业提供快速联动各类公共基础组件,以满足在不同业务场景下不同性能需求的能力组合,使 YMatrix 能够更加自然地融入到生产场景当中,并称为生产系统的核心。

  1. 运维高效

通过将行业生态的价值进行融合、凝练,YMatrix 的产品生态极具包容性与领先性。一方面,YMatrix 超融合数据库在持续迭代的过程中,汇集了制造、汽车、金融等不同行业场景的特性,使一套数据库生态能够在多个系统间进行敏捷交互、高效集成、快速流转,帮助企业构建一套完善的数据治理机制,充分释放数据时代的数字潜能;

另一方面,YMatrix 拥抱时代主流,顺应数据库产业的发展趋势。通过将各条业务的核心数据汇聚在 YMatrix 中,超融合使企业的数据生态更易管理,运维人员无需精通多种产品技术和程序语言,极大简化运维工作。

  1. 成本可控

YMatrix 超融合数据库可为企业提供统一的数据基础设施进而高效协同处理不同业务数据,并提供更具全局视角的分析洞察。此外因其超融合特性,YMatrix 可在单个系统中消费与管理数据,而无需在多个分布式系统间传递,避免了一份数据的多系统存储。

4.超融合数据库最佳实践

理想汽车:全面升级数据平台业务保障能力

随着新能源汽车在市场中的占比不断升高,国产新能源汽车的产量与用户量也在随之快速提升。作为国内新能源汽车领域的头部厂商,理想汽车的数据基础平台已承载了数十万辆车的车机数据,监测超过 5000 多个车辆运行指标,每日新增的数据规模超过 60 亿行,对数据库的吞吐写入能力要求非常高。

同时,随着车辆规模的增长以及监测指标的细化,整体数据规模仍在持续高速扩张,平台面临着性能、成本和运维的三重挑战。

![](https://img.ymatrix.cn/ymatrix_home/640 (3)_1698389886.png)

YMatrix 为理想汽车提供了一套高性能、低成本且高效易用的时序数据解决方案:

  • 支持海量高并发数据的分批、乱序写入,历经生产环境 1.5 亿点/秒写入考验,同时也能保证数据的一致性(ACID);
  • 支持秒级扩容,业务 0 中断,提供 PB 级数据存储能力,帮助平台从容应对业务数据的高速增长;
  • 在服务器用量减少 2/3 的情况下,不但数据入库延迟大幅降低,而且系统查询性能也显著提升;
  • 同时简化了技术架构,指标开发时间从原来的几天,大幅缩减到 1 小时以内,单个指标明细查询等常用查询耗时缩减至 1 秒内,最大降幅超过 90%。

5.超融合为企业全场景业务而生

超融合代表着数据库未来发展的一种可能,我们更愿意相信,这是符合企业实际需求的必然之选。

通过简化繁杂的技术栈,将开发人员、运维人员从复杂、繁琐的工作中解放出来,让数据释放更大的潜力。超融合数据库不仅能够满足企业在当下的实际需求,相信随着技术的演进,未来一定也会带来更多的可能性,真正成为能够与企业业务相匹配的数据库产品,为企业打造“性能卓越、功能完善、运维高效、成本可控”的数据基础设施。