目前,在医疗、高校、政府、金融等行业单位,其数据库数量高达上百个,难以形成统一的访问视图,需要通过ETL等工作,先将其进行集中存储后方能进行后续的分析与数据治理。然而,面对如此庞大的数据资产,通过ETL这种数据移动集中的方式,将存在以下难以回避的痛点:
->高成本
要将分散在上百个数据库系统中的数据进行集中,需要付出极大的时间、人力、财务成本。
->不实时
数据通过ETL移动到集中的中央库后,一方面其数据滞后于生产库,二来移动过来的数据并不是在相同时间点,因此也影响了后续的分析与使用;
->性能压力
通常,各业务库需要承担数据上报、集成平台同步等工作;此时,再增加ETL抽取同步等工作,将进一步加大业务库的负担,影响了业务操作的性能体验。
KLake是基于Data Fabric数据经纬架构而设计,通过实时链接的方式,将组织内所有数据库统一的组织起来,形成逻辑上集中统一的虚拟数据库系统,从而实现全局数据资产的集中、安全的运营与共享。
KLake平台是一款基于大规模并行处理(MPP)架构的SQL计算集群,其本身并不存储与缓存数据,而是实时的解析SQL与执行SQL,并将结果反馈给上层调用者。与此同时,还提供了集中的数据安全访问控制以及硬件资源的控制能力。
->为生产库减负
日常数据上报、各类数据同步等场景,导致核心生产库不堪重负。KLake通过自身的计算集群,实现SQL计算从业务库到KLake平台的卸载,同时提升了SQL的执行效率;
->各类评级中的指标比对
电子病历、互联互通、等级医院等的评定工作,涉及复杂且众多的指标查询与跨库数据比对,通过KLake平台,可以通过一个SQL,实现对多个数据源的跨库指标比对,避免了传统方式下分步分库的复杂过程;
-->为智慧医院应用提供实时数据支撑
智慧医院建设过程中,各类智慧应用,需要实时的、全方位的数据供给,而传统的数据中台、集成平台等,在实时性、数据全面性等方面,难以满足其应用需求;KLake将全院的所有数据库资源统一成为一个虚拟的数据库,因此,完美的解决了数据实时性、数据全面性的问题,成为院方核心的数据基础设施底座。