四、数据全域治理平台
(一)平台架构
数据标准管理负责管理维护整个数据中台的标准,为其他各类管理活动提供标准化服务支持。元数据管理为血缘管理和数据资产管理提供元数据支撑,基于元数据管理建立血缘关系、进行血缘分析、元数据级别的分级定义和资源目录规划等:数据资产管理负责数据资产共享、分发、使用、管理,包含数据资源目录、分级分类、生命周期管理、血缘管理等部分;数据质量通过建立评估标准和管理规范,提供数据质量问题发现、监测跟踪、分析应用等闭环流程和管理功能为数据质量提供必要的保障;数据运维管理则全面掌握数据接入、数据流量、数据资源的总体情况和使用情况:数据运营是数据资产管理实现的最终阶段,该阶段包括开展数据资产价值评估、数据资产运营流通等。
(二)数据流程
数据治理,通过管理数据资源目录、元数据、分级分类、血缘关系等信息保障数据汇聚与融合后的效果,规范数据组织形式;同时对数据质量进行管控,通过运维手段确保数据全生命周期的高质量运行,通过数据运营变现数据价值。
(三)数据资产目录
建设数据中台数据资源目录,以全国的原始库、资源库、主题库、知识库、业务库的数据资源为管理对象。形成标准的、规范的、统一的数据中台数据资源目录,结合用户分级分类访问权限管理,促进数据中台的数据资源科学、有序、安全的开放和共享。
(四)元数据管理
元数据管理是数据治理得到有效实施的关键技术环节之一,为了在大数据能力构建过程中有效的实时数据治理,平台须提供元数据管理功能,管理在实时过程中沉淀的各类元数据信息,并可开放各类元数据信息,以支持管理人员、业务人员和技术人员快速了解平台数据对象定义以及对象之间的关系等。
(五)血缘管理
数据的血缘关系主要由数据平台各类数据源的数据项信息、库表关系、ETL 逻辑、存储过程、代码逻辑等组成。能清晰的反映数据从源头到过程转化,到最终数据产物之前的转换关系,包括但不限于:组合关系、依赖关系、数据流向拓扑信息。
通过完善的数据血缘关系,建设数据中台的数据地图,提供良好的数据溯源、血统分析的能力。
五、数据质量管理平台
(一)数据标准管理
数据标准管理包括:根据制定的数据中台、各数据来源方基础数据,业务数据的数据标准,统一管理数据标准,规范数据资源格式、命名的准确性和口径的一致性。
(二)数据生命周期管理
数据的生命全周期管理,须贯穿于数据中台采集、存储、整合、处理与分析、应用与呈现、归档与销毁的数据生命周期,进行持续优化治理。元数据管理和主数据管理是数据标准化层面的治理,从基础上保障数据的完整性、规范性和一致性:数据质量管理更加强调运用数据特征度量来精确判定数据价值,更加注重数据清洗后的整合、分析与价值利用,更加倾向于通过持续治理来有改进数据质量、创造新的价值:数据中台的开放共享使得数据安全与合规问题更加严重,需要在数据全生命周期内强化数据分级分类管理、强制数据鉴权访问,确保重要数据资产在使用过程中具有适当的认证、授权、审计、控制。
(三)数据质量管理
数据运维管理和数据质量管理息息相关,数据质量管理是客观上对整个数据提供层数据的质量量化评价标准,用来把数据质量比较抽象的概念用数字等指标来进行量化,是对数据提供层数据质量高低的个客观评价。数据运维管理是把数据提供层数据通过可视化或报表等方式客观展示系统整体情况,通过可视化的形式把数据质量进行展示汇总,从而达到真实数据的客观展示,并通过客观数据发现系统的问题,来逐步完善系统的整体功能和性能,从而提升整个系统的质量。
六、数据共享服务平台
(一)平台架构
服务总线通过 API 接口方式提供服务,服务构建平台为应用开发提供支撑。通过以上方式,形成数据中台手段丰富、分类服务、按需动态授权的数据服务综合模式。
(二)数据流程
(三)平台功能
1. 数据服务总线设计
(1)数据服务总线功能
服务管理中心主要针对节点和服务进行管理。节点分为主中心节点和分中心节点(包括备份中心)。节点管理主要完成节点注册,节点审批以及节点的基本信息维护等。服务管理主要完成服务注册、服务审批、服务发布、服务检索、服务维护、服务分类以及服务信息的全网同步等。
(2)数据服务总线部署
数据服务总线,在主中心和分中心分别部署,在各级数据服务总线节点之间建立数据互联通路,实现消息、实时数据流 (包括音视频流数据)、文件等多种数据交换方式,实现服务调度、服务路由、数据交换、服务调用、服务安全等功能。
2. 数据服务场景设计
(1)数据服务构建场景
(2)数据服务使用场景
服务使用者浏览服务目录,选择需要使用的服务,提交服务使用申请。服务管理者对此服务使用申请进行鉴权,如果判断有权使用此服务,那么批准此申请。服务使用者在使用完服务后,对服务进行评价,评价信息会被其他服务使用者参考,以帮助他们了解服务的质量。
(3)数据服务审计场景
3. 数据交换服务
数据交换服务是数据中台各节点提供的面向业务部门的数据交换渠道。目前包含数据订阅、数据下载、数据推送等数据共享服务模式。
(1)数据订阅服务
数据订阅服务包含订阅发布和订阅推送两个过程实时订阅和精准推送。订阅类型包含增量订阅、关键词订阅、范围订阅、协议订阅、消息订阅、主题订阅等。
数据订阅服务主要功能包括可订阅数据和服务目录查询,数据订阅提交,订阅撤销、续订和订阅协议标准查询等。
(2)数据推送服务
数据推送是数据平台各节点之间,数据平台和省市县各平台之间数据交换的基础核心能力,数据推送实现将加工好的数据或分析成果,向一线推送,以便应用于实战、体现大数据价值,并将数据化为数据能力的过程。
(3)数据下载服务
数据下载服务是对数据资源异步处理方式。数据下载服务,提供日常业务数据、政策信息、共享目录数据等的下载路径。
4. 数据可视化服务
数据可视化服务,帮助用户快速完成多数据整合,建立统一数据口径,支持自助式数据准备,并提供灵活、易用、高效可视化探索式分析能力,帮助用户构建切合自身业务的企业洞察,并将数据决策快速覆盖隔层相关人员及应用场景。
5. 数据管理服务
(1)元数据访问服务
元数据,主要是对数据的数据描述,对数据的数据描述可以概括为如下几个部分:数据结构定义、数据代码定义、数据部署定义、数据接口规范定义、数据血缘关系定义、数据路由访问定义、数据访问权限定义组成。元数据访问服务,提供数据资源、服务资源的元数据查询访问能力,并提供分级汇聚的服务能力。支持枚举数据资源、获取数据资源的元数据信息以及字段结构信息,包括对应的元数据信息等。
(2)数据字典服务
数据字典是对数据的数据项、数据结构、数据流、数据存储等进行定义和描述,数据元素业务含义的抽象表达,用来对数据流程图中的各个元素做出详细的说明,是对系统中使用的所有数据元素的定义的集合。
数据字典服务提供数据字典的查询、翻译接口,返回字典类别、字典项值等相应所需结果,实现数据字典查询或翻译。
(3)数据鉴权服务
数据鉴权服务要求所有的数据服务请求,都必须对请求方权限进行验证,确保其所访问的数据在权限允许范围内,是数据中台保证数据安全的核心。
(4)跨网跨域服务
跨网跨域服务,实现内部数据、外部社会数据和内外部泛感知数据的整合,形成高质量的数据基础;在保证数据安全的前提下,通过边界防护,允许适当的公共网络跨越边界使用内部的数据服务,实现数据中台的跨网,跨域服务能力,体现数据中台的社会价值。
七、数据可视化平台
(一)平台架构
数据可视化平台为整个数据中台提供了大数据可视化展示能力,它为客户提供了各种可视化组件,客户可以根据自己的需求通过组件间简单组合进行数据展示。为客户提供了超过 50 种以上的数据可视化展示方式。
(二)数据流程
通过可视化分析展示平台,使抽象的数据信息变得简单、易懂直观呈现数据分析结果,丰富的可视化组件可帮助业务准确的表达数据的价值所在,完善的功能可帮助用户建立有针对性的报表体系。其主要价值可体现在即席查询、数据洞察与大屏呈现、移动报表之上。
(三)平台功能
1. 数据可视化
系统支持多场景模板管理,预置地理分析、实时监控、汇报展示等多种场景模版。系统支持除针对业务展示优化过的常规图表外,还能够绘制包括海量数据的地理轨迹、热力分布、地域区块、3D 地图、3D 地球,地理数据的多层叠加。此外还有拓扑关系、树图等异形图表可以自由搭配。
提供丰富的图形可视化选择,(堆积) 柱图、 堆积) 横条图、散点图、(堆积)面积图、折线图、组合图、瀑布图、饼图、环形图、南丁格尔玫瑰图、油量图、散点图、气泡图、雷达图、关系图、热力图、词云图。
2. 地图分析
地图分析可以将数据在地图上进行可视化呈现,形成地理导航仪,通过点击、下钻以及图表联动等方式,进行数据分析和展示。
3. 仪表盘
适用于管理者把握全局,运筹帷幄。以简洁、直观的界面,展现各环节的数据,并以丰富的展现和互动形式为决策者提供帮助。
(1)可视化配置、布局灵活、快速发布、支持页面主题
(2)丰富的互动性,支持 What-if 分析,参数控件可视化
(3)支持页面内部、页面之间的钻取、关联分析
(4)帮助开发人员快速完成仪表盘设计,实现交付过程敏捷化
4. 大屏幕
系统内置大屏拼接控制,可以根据不同的应用场景,自由布局多块屏幕的分布以及显示内容,既可重点关注专项事件态势,又可全面掌控整体态势。可通过 PAD 等手持设备作为控制终端,来实现对大屏显示布局、监控模式的切换以及软件界面内容的交互控制。提供各种灵活、便捷的操控体验。
5. 报表报告
本报表报告可满足各种格式的行业监管报表、内部管理报表的需求。包括:清单报表、交叉报表、分组报表、多源分片报表、分块报表、表单报表、图形报表、回写报表、假设分析报表、二次计算报表套打报表、段落式报表、预警报表、组合报表。
6. 分析报告
系统可通过拖拽的方式形成报告的模板,即可按照相关参数随时进行报告生成,省去定期手工出报告的时间和烦恼。将数据从IT 环节贯通到办公系统,提高报告的制作效率,使业务的工作重心回归问题的原因分析和解决方案设计上。
7. 丰富的交互查询
系统支持按照时间、空间、属性等不同维度对数据进行全方位呈现,提供丰富的呈现形式和交互功能。
8. 二三维联动功能
三维双屏相互联动,二维的平面地理视图便于操控,三维视图便于直观形象化展示。
9. 数据历史回放
系统支持任一时间段的数据以轨迹图、仪表盘等各种方式加以展现,并可对全系统数据同步进行快进、慢放等操作,有助于决策者了解全局数据变化趋势。
八、主要关键技术
(一)内存级数据交换共享
1. 多元异构、一键迁移
2. 数据采集和分发
3. 数据实时交换
4. 数据ETL工作流
5. 分布式内存处理
6. 多种数据灾备方式
(二)一站式数据集成和数据管理
(三)数据分析模型
(四)数据治理技术
(五)数据挖掘技术
(六)可视化建模技术
(七)NLP语义分析技术
(八)知识图谱技术
(九)数据交换共享技术指标
(十)应用系统技术指标
版权所有:江苏钟吾大数据发展集团有限公司 ICP备案许可证号:苏ICP备2023016529号 苏公网安备32130002004002号