2020 年10月,超融合数据库厂商 YMatrix 宣布,成立月余就已完成千万级天使轮融资。不到半年时间,公司再次宣布,完成新一轮规模数千万的 Pre-A 轮融资。本轮融资由顺义产业基金领投,老股东晨山资本继续跟投。
YMatrix 成立于 2020 年 8 月,核心成员来自于 Greenplum、微软、阿里、腾讯、百度、字节、快手等国内外知名数据团队,具备深厚的数据库内核开发沉淀。
根据 Gartner 2019 报告,Greenplum 数据库产品是基于PostgreSQL架构开发的MPP数据库,世界排名第三。YMatrix 创始团队都曾在 Greenplum 中国团队工作,是分析型数据库领域少见的世界级完整建制团队,他们曾服务大量全球 500 强企业,在银行、证券、保险、电信、能源、政务、制造业等行业,对企业级数据库产品的需求、研发和应用有丰富经验。
近一年来,基础软件领域的投资形成“风口”,数据库细分领域的投资活跃度快速上升,尤其是时序专用数据库、以及强化数据分析能力的功能性产品。
但不同于大多数同期创业项目,YMatrix 团队没有选择研发只解决特定数据管理需求的专用类型数据库,而是率先提出了超融合概念,研发了新一代产品 YMatrix 超融合数据库,一款能真正做到一库多用,满足各类传统和新兴场景下大部分数据管理和分析需求的产品。
基于微数据库内核(microdb)的多核开放架构,YMatrix 内置 4 个高性能微内核数据引擎,完善支持标准 SQL,一方面支持多模数据类型,包括关系数据、时序数据、GIS 数据、JSON 数据、文本数据、图片等;同时支持多场景操作,提供比传统 MPP 数据库更为强大、丰富的数据查询和分析能力,比如高并发低延迟增删改查、点查、明细查询、聚合查询、窗口查询、关联查询、多维查询、库内机器学习等。
创始人姚延栋表示,“专用数据库只是在解决特定需求,比如支持时序、知识图谱类型的数据,或是强化分析能力。由于上一代传统数据库能力太有限,不断叠加这类专用产品来满足新的业务需求,已是行业内惯例。”
“但从用户的实际使用来看,每叠加一个专用数据库,都给运维带来了多一层的复杂度。比如,在某个专用数据库中处理完成后,再导入另外一个数据库分析,合并后再导出结果,造成大量工作量。每个产品都要考虑到监控、报警、导入、导出、扩容、备份、恢复、安全控制、升级等工作,为运维带来大量的财务、人力、时间成本。”
据了解,从国际市场进程来看,海外厂商虽尚未明确提出超融合理念,但是各种形式的融合已有数年实践。
比如,Snowflake 和 Databricks 等数据库独角兽,先后提出并认同“one data platform”概念;传统数据库头把交椅的 Oracle 也在走向融合方向。
与此同时,因为对复杂的新兴场景需求更加熟悉,时序数据库企业在相关产品上的试水更为激进。比如,时序数据库厂商TimescaleDB 正基于 PostgreSQL 开源架构,开发超融合类型产品,试图从单机向分布式演进;DB-Engines 上流行度排名第一的时序数据库 InfluxDB,因为原有产品更适合中小规模数据,查询分析功能相对简单,启动了新产品 IoX 研发,定位于服务更多数据类型和场景的下一代超融合数据库,完成后极大可能替换掉原有产品。
对此,姚延栋表示,“正在进行数字化的传统行业和新兴产业,场景更为复杂,数据分析需求更多元,上一代传统数据库+N个单品数据库的技术架构,已经无法以相对简洁的方式满足需求。”
“作为替代方案,如果能以超融合数据库作为起点,先一次性满足未来5年可预见的数据管理需求,是更好的技术路线。这也是YMatrix 目前的产品研发策略,可以实现目前很多个专用数据库联合起来才能实现的分析能力、管理不同数据类型的能力等。超融合是更经济、更理性的技术路线,让架构开发省力、运维省心、老板省钱、迭代省时”。
目前,YMatrix 超融合数据库经过半年研发,已经优化迭代至 3.0 版本,在支持关系、JSON 数据类型的同时,已经具备了基本时序、GIS 数据管理能力;在性能上的表现,也以数十倍的实测数据超过了大多数第一梯队产品。
完成此次融资后,YMatrix 将继续进行技术投入,针对市场需求最大的时序数据管理功能,对产品做进一步开发和性能优化。在市场推广上,除了服务首批天使客户的部署外,也将进一步针对智能汽车、智能装备、智慧工厂领域做积极拓展。