MatrixDB 4.0 发布:性能呈数十倍超越,时序场景支持能力抢跑国际最前沿标准

2021-07-05 · YMatrix Team
#新闻#产品动态

我们荣幸的宣布,MatrixDB 4.0 版本正式发布。

2020 年,时序数据库流行度排名第一的产品 InfluxDB 公布了它的下一代产品规划,并提出了下一代时序数据库设计的 13 个目标,包括支持海量设备、支持大量指标和标签、支持 Metrics query 同时实现一流的分析能力、支持多态存储、支持多机存储、支持存算分离等。 这是行业排名第一的产品,在时序数据库领域摸爬滚打了七年,接触大量场景之后,总结的下一代时序数据库应该具备的功能。

目前,我们在 MatrixDB 4.0版本中,已经实现了这 13 条中的 11 条。除了容器化和灵活的副本控制,其他的都已经做到很好的支持。 此外,作为能够高效服务时序场景的企业级超融合数据库产品,MatrixDB 4.0 还有更多的功能:

比如,很好的支持线性扩展,既可以单节点部署,也可以分布式部署;能够支持资源管理,有完善的监控报警系统;能够做在线扩容,不用停机、不用停业务;具备分布式备份恢复的能力,完善的支持事务,支持 ACID;360 度的安全访问机制,包括认证、权限控制、加密、审计;支持多种压缩算法,包括列式压缩算法和通用压缩算法;支持多种索引,还支持多表关联;支持复合数据类型,包括数组、Json、KV 等等;支持自定义类型、自定义函数、自定义聚集;支持持续聚集,物化视图,子查询等。

基于已有和更新的丰富功能,产品性能在插入、查询的延迟、高吞吐、throughput 等测试中,也得到了进一步验证。 插入是时序场景中最频繁的操作,占比 95%-99%。评测中,在某个 10 万+设备,10、50、100 到 400 不等指标数场景下,MatrixDB 的性能都具有明显优势。同时,随着指标数增多,YMatrix 的性能优势也越来越明显。在 400 个指标位置,MatrixDB 4.0 实测性能达到 InfluxDB 的 50 倍左右。

查询延迟评测,我们选择的是 TSBS Benchmark,对比其主要的维护者之一 Timescale。评测结果可以看到,大查询对 Timescale 具有明显的优势;而对于小查询,MatrixDB 4.0 处于在同一个量级上,都是毫秒级左右。 吞吐评测,也就是 throughput,显示 MatrixDB 4.0 和国内一个竞品相比,吞吐量要高 80 倍左右。 下面我们看几个场景和案例,第一个是工业互联网。工业互联网是智能制造的重点,也是我们国家十四五规划的重中之重。这张图我们可以看到左边是工业里面的工业设备、生产设备,也就是说是生产域,是OT域的设备。通过数据采集,我们可以把这些数据插入到 MatrixDB 里面。而同时 MatrixDB 还可以对接IT域像 ERP、CRM 这类数据,可以实现在 MatrixDB 内部做到 IT 域和 OT 域数据的融合。在一个公司内部全量数据的基础之上提供支撑包括流程优化、智能分析等等。所以 MatrixDB 可以是工业互联网的数据基座,它可以从数据层首先实现两化融合,为智能制造打下数据基础。 这是一个车联网的例子,这个用户之前用了像 OpenTSDB 这样的时序数据库,然后搭配 Hive 这样的多维分析的产品。采用了 MatrixDB 之后,它可以用一套数据库,来解决过去两个分布式系统。当然了大家知道OpenTSDB 底层是基于 HBase,那 HBase 又用了 ZooKeeper 和 HDFS 等等一堆的分布式产品,所以底层其实是很多套分布式系统。现在的话用一套分布式系统,一个超融合时序数据库可以解决过去很多产品组合才能解决的场景。这样一来的话整个技术栈大幅简化,开发和运维的效率也有了明显的提升,整个技术栈大幅简化,性能也是原来架构的 10 倍以上,开发运维效率大幅提升。 这是一个物联网智慧城市的案例,随着万物开始互联,各种各样的数据开始被采集到,包括天气的数据,空气的数据、栅格数据;包括交通里面道路数据、车流数据、人流数据、人群的各种各样的数据。这些数据通过各种各样的传感器收集起来实时上传到 MatrixDB,然后支撑上面的各种各样的业务,包括风险预测、事故的预测、时空的大数据分析、事件流分析、交通分析等等,各种应用的场景。 下面我们再看一个云边一体的案例,这是一个能源相关的场景。在场站侧我们部署了一套单节点的MatrixDB 数据库,在集控侧部署了四个节点的 MatrixDB 数据库,在数据中心部署了一个十几个节点的大集群。这样就可以使用一套数据库,无缝地实现数据在各个层次的对接,真正的达到了云边一体。

时序数据是物联网、车联网、工业互联网和智慧城市的基础数据,而时间是时序数据的最重要的属性。时间的本质是什么,目前尚无定论,不过哲学家黑格尔说的一句话非常具有参考价值。他说时间是人们对过去的回忆,事物本身没有记忆,所以我们没有办法对过去的事物形成回忆。但是超融合时序数据库,将会为未来的事物赋予记忆,进而拥有智能。超融合时序数据库,为万物互联的时代提供一站式的数据平台。让您和您的客户省心省力、省时省钱。