什么是数据治理

数据治理(DataGovernance),是企业数据治理部门发起并推行的,关于如何制定和实施针对整个企业内部数据的商业应用和技术管理的一系列政策和流程。

数据治理是一套持续改善管理机制,通常包括了数据架构组织、数据模型、政策及体系制定、技术工具、数据标准、数据质量、影响度分析、作业流程、监督及考核等内容。

“数据治理是目前一个比较新兴的、正在发展的学科,目前业界对它的定义还不完全一样。”

数据治理涉及的IT技术主题包括元数据管理、主数据管理、数据质量、数据集成、监控与报告等。

数据治理的技术组成

数据治理涉及的IT技术主题包括元数据管理、主数据管理、数据质量、数据剖析、数据分析、数据集成、数据字典、数据库管理、监控与报告等。

所有与数据有关的技术产出物全部通过知识库(REPOSITORY)实现相互之间共享,知识库作为数据治理的后台通道,传输不同平台、环境、技术、工具所提交和需要的元数据信息。

数据治理是专注于将数据作为企业的商业资产进行应用和管理的一套管理机制,能够消除数据的不一致性,建立规范的数据应用标准,提高组织的数据质量,实现数据广泛共享,并能够将数据作为组织的宝贵资产应用于业务、管理、战略决策中,发挥数据资产的商业价值。

数据治理的整体架构

数据治理管理体系

数据治理管理体系由管理政策、管理功能、管理流程、管理组织等几大部分组成。

数据治理管理组织(管理团队角色分工)

此文摘自恩核公司的孙斌授课材料

欢迎加入本站公开兴趣群

软件开发技术群

兴趣范围包括:Java,C/C++,Python,PHP,Ruby,shell等各种语言开发经验交流,各种框架使用,外包项目机会,学习、培训、跳槽等交流

QQ群:26931708

Hadoop源代码研究群

兴趣范围包括:Hadoop源代码解读,改进,优化,分布式系统场景定制,与Hadoop有关的各种开源项目,总之就是玩转Hadoop

QQ群:288410967

;