描述
KShare数据共享服务平台

应用间互联互通的难点

当前,各组织机构内应用系统数呈爆发式增长势头,从原来的数个增长到数十至数百个。各应用系统之间的数据交换变得越来越迫切,同时也变得愈加复杂与困难,为了实现应用间互联互通,目前实现方式主要分以下几类:

    1. 数据库点对点直连(如DB-LINK)

    2. 中间库或表

    3. 定制化接口开发

    4. ESB企业服务总线

以上各类方式,要么实现起来简单,但难以匹配复杂业务流程;要么技术过于复杂,对业务侵入性强,需要应用侧较大改动,导致实施成本巨大。

描述

数据中心库构建难

    当组织内仅有数个或十来个库时,通过ETL或数据湖的技术,将企业内各数据库内进行集中同步是可行的,但当数据库数量达数十个甚至更多时,通过ETL或数据同步的方式将数据同步到集中的库中,将变得极具挑战性,在此种情况下,如果还是通过数据同步或ETL方式将数据集中到一起,其运维成本、同步的故障率将大幅提升,从而最终影响到集中库的数据质量,以及与生产库不一致等问题。

KShare数据共享服务平台

      目前,在医疗、高校、金融等领域,应用系统以及数据库的个数高达上百个。为了实现应用间的互联互通以及中心数据库或ODS层,各组织投入了巨大的人力、财务,但效果并不理想。在此背景下,基于数据经纬(Data Fabric)的理念油然而生,其核心思想是通过统一的、实时的方式,集中、实时的访问各业务系统的生产数据。这种不依赖于数据移动与同步的数据管理理念,极大的简化了数据管理过程、提升了数据可访问性、一致性、安全性。

      KShare 数据共享服务平台,基于Data Fabric数据经纬的理念打造而成,旨在解决当下及未来组织内日益增长的业务系统之间数据共享的棘手问题,并将数据共享从各类应用系统和数据库系统中独立出来,成为IT的基础设施与核心平台系统。


    1.虚拟数据湖

     通过ODBC驱动,将多个数据源实时的连接起来,从而行成一个虚拟的中央集中式数据库系统,用户可以在虚拟数据湖中,通过一个SQL关联多个不同生产库中的表,实现复杂的跨库查询。此外,通过虚拟数据湖的实时访问接口,用户可以直接通过SQL方式生成中央库及ODS层,从而极大的降低 ETL 处理的复杂度。


    2.基于SQL的RESTful API接口定义

     用户可以通过填写SQL或匿名块的方式对外发布接口,实现不同应用系统间实时数据共享与交换,避免繁琐的接口开发工作,以及点对点的数据库直连方式,同时,还能弥补ESB企业服务总线不实时的短板。


    3.动态脱敏

     基于虚拟数据湖,KShare可以针对第三方应用、RESTful API服务进行动态实时脱敏,避免数据泄露等安全风险。