从 AI 智能体到报表洞察,从产线管理到业务流程,我们专注于为大型企业构建满足全业务线需求的统一数据服务。
近年来,作为上市新能源电池生产厂商领军企业之一,孚能科技产量逐渐提升。一方面企业需要解决越来越多、越来越复杂的产线生产管理工作,同时也急切的希望提升工厂数据自建设水平,实现“数据驱动经营效率”提升。
YMatrix 首期完成了电池溯源系统的数据库 Greenplum 的替换,解决大量复杂报表无法出结果的问题,且常用简单报表查询性能提升了数倍;在二期产线数据平台升级项目中,YMatrix 从使用不同产品的产线中汇聚数据,支撑上层报表和 BI, 相较原有的 Oracle,极大的改善了大时间范围数据导出不可用、复杂报表不可用的问题,各类查询响应速度达到秒级,毫秒级。
2021 年理想汽车引入 YMatrix, 更换了原有的以 OpenTSDB 为核心车机信号运营平台,实现实时车辆行驶指标数据的存储、查询和计算,支撑车辆数据分析、故障追溯、车主 App等应用场景。
YMatrix 在时序场景的领先性能,不仅帮助理想汽车解决了交通高峰时期数据入库堆积超 3 小时的问题,同时还大幅降低了硬件成本,首年即节约硬件成本超百万。随着理想汽车近年来的销量攀升,支撑车机信号平台的 YMatrix 集群规模随之扩大,目前已管理了超过 1 PB 历史数据,并具备支持超过 150 万辆汽车规模的车机信号写入、查询的能力。
该企业作为全国排名前 2 的医药连锁零售企业,随着业务的增长,于 2024 年启动了整体 ERP 系统的升级计划。YMatrix 和友商一起,提供了具备细粒度的业财一体实时分析能力的产品,帮助企业充分挖掘数据价值,驱动运营效率提升。
YMatrix 的 HTAP 和实时分析能力得到突出体现:在 TP 方面,支撑月新增 3000 万交易凭证的业务流程稳定、高效运行,在 AP 方面,实现百亿级数据报表分钟级返回;同时,摈弃了传统的 Flink 方案, 通过原创的库内流技术实现了 TP 到 AP 的库内实时同步,做到了业务发生到报表更新分钟级延迟,为 ERP 产品提供了领先的实时分析能力。
早在 OpenAI 刚刚发布之际,某国内头部 ERP 厂商就已经提前布局, 探索 AI 在企业服务领域的落地的路径。该厂商既非常关注 AI 领域的潜在市场,但考虑到作为还处于萌芽阶段的市场的不确定性,需要考虑以最小化的研发、维护成本,最快的方式落地产品,同时能够和其他数据深度整合,最大化发挥平台价值
YMatrix 作为该厂商的重要合作伙伴,已经为其主要产品提供了技术数据服务,而利用 YMatrix 的向量数据能力,该厂商无需引入新数据库,就在数月之内完成了 AI 产品的上线,目前经过集团内部全面试用打磨,已经签约多家客户。
用户通过 SQL 即可创建由 Spark、Flink 等方式实现的包括填充、过滤、扩维,聚集等在内的数据加工逻辑,实现数据库内的实时数据加工;Domino 流计算引擎还具备完善的 ACID 特性,可确保数据加工过程正确性和可靠性,满足对数据一致性、正确性要求高的场景。
利用 Domino 流计算引擎,可实现库内交易数据到的数仓实时同步,构建具备 HTAP 能力的数据架构; 同时还可支持数仓内 ODS (贴源层)、DWD(明细层)、DWS(主题层)间的实时加工,从而使数仓具备实时分析能力。
MARS3 是 YMatrix 的自主研发的行列混合存储引擎,既具备列式存储引擎的在分析型场景中的优势,也具备传统行式存储引擎在写入、事务方面的能力。
针对时序场景,MARS3 还具备出众的写入速度和压缩比,并可通过灵活配置排序键、块大小等从而在不同业务场景中发挥极致性能;此外,相较其他列式存储引擎,MARS3 不但性能表现出众,还完善的支持了 UPDATE/DELETE,适合在各类有复杂操作及对数据正确性要求高的数据加工场景中使用。
向量化技术是近年来出现的先进的数据库性能优化技术,相较传统的”火山式“计算引擎,它能利用现代 CPU 指令集,实现在一个时钟周期内完成一组数据计算,从而提升大数据量分析型场景中数据库的性能表现。
YMatrix 研发团队对数据库中的各类算子进行了全面的向量化改造,使得数据库能够在 CPU 层面实现数据的“按批计算”,从而大幅提升 YMatrix 在大数据量分析场景中的查询性能表现;在部分查询中,性能提升可达 10 ~ 100 倍。