终于有人把数据资产目录给讲清楚了

楼主
学无止境,精益求精

数据资产的定义和分类

中国信息通信研究院在其发布的《数据资产管理实践白皮书》中将数据资产定义为"企业拥有或者控制的,能够为企业带来现实或潜在经济利益的数据资源"。这个定义强调了数据的所有权和经济价值,这在数据交易日益活跃的中国市场尤为重要。
在实践中,我们通常将数据资产分为以下几类:
  • 结构化数据:如员工信息、财务报表,存储在关系型数据库中。

  • 半结构化数据:如日志文件、XML文档,有一定的组织结构。

  • 非结构化数据:如邮件、合同扫描件,占企业数据的80%以上。

另一种常见的分类方法是基于数据的来源和用途:

  • 内部数据:企业自身生产的数据,如销售记录。

  • 外部数据:从第三方获得的数据,如社交媒体评论。

  • 主数据:描述业务实体的核心数据,如客户、产品信息。

  • 事务数据:记录业务活动的数据,如订单、支付记录。

为了更便于识别,根据数据资产的定义,再根据企业业务特点总结企业自身的数据资产性质。可参考如下:

有价值,数据要能直接或间接给企业带来价值和效益,价值不能局限于金钱价值,还可以包括品牌、信誉、社会影响力等无形价值。

能管控,企业内部数据肯定是能管控的,还包括能进行管控的外部数据,比如第三方数据、上下游企业的相关的数据、市场数据。

有记录方式,除了电子方式的数据,一般容易忽略物料记录方式,比如纸质表单。还需要注意,如果有些数据还没有通过电子或物料的形式记录下来,但确实满足其他特征的,需要识别进来并要增加措施将其通过电子或物料形式记录下来。

需识别,并非所有数据都要识别,首先不满足上述特征的不应该被识别,其次可以抓主要矛盾,重点识别重要程度高、使用频次高的。

数据资产盘点

传统意义上的资产盘点是指对资产进行定期清点,以确定各种财产在一定时间的实存数。数据资产盘点则是对企业拥有的数据进行清点,已确定企业当前拥有的数据。数据资产盘点将帮助企业弄清以下问题:
  • 企业有多少数据?

  • 企业有哪些数据?

  • 企业的数据价值如何?

  • 企业的这些数据分布在什么地方?最有价值的数据存储在什么位置?

  • 企业数据的归属和责任人是谁?

下面介绍数据资产盘点的方法和步骤,主要归纳为6个阶段:构建数据标准、数据发现、数据定义、分类分级、明确归属、数据资产目录。

数据资产目录架构

关于数据资产目录的架构建立,可参考业务流程架构,如果企业还没有建立流程架构,可以按企业业务板块,形成数据资产架构的最上层——数据主题域,比如研发或IPD主题域、营销或LTC主题域、人力资源主题域。

再从流程或业务流中识别和归纳数据主题域的下一层——数据域。数据域一般是核心业务流程的按阶段点或流程功能模块,比如价格管理、商机管理、合同管理、供应商管理。

再下一层是具体的业务对象,承载业务运作和管理业务的重要信息,是业务领域涉及到的重要的事、物、人。比如客户基本信息、报价单、产品数据。

业务对象下一层是对业务对象进行描述的数据项,一般也称之为数据实体,比如报价信息、机会点信息、合同信息。而且一般每个信息都包括两个数据项表头信息(出货单表头)和内容信息(明细行),反映数据信息实体的最小粒度。

最下一层是数据属性,是用来描述数据项的维度信息、属性信息和数据特征信息,反映数据管理的最小粒度。

数据资产目录是数据架构的基础,它列出了企业所有的数据资产,包括数据的来源、类型、格式、用途等。数据资产目录有助于企业清晰地了解自身的数据资源,为数据的利用和管理提供依据。

如何建立数据资产目录

自定义的数据资产目录模板,将数据按照层级结构汇总,检查和完善数据属性,经过评审确认形成企业数据资产目录。一旦有新的业务流程、新的业务系统、新的流程表单,以及涉及数据的变更时,需要及时更新数据资产目录。

数据资产目录是数据管理层面的输出,如果需要进一步将数据资产在应用系统或数据平台管理落地,再结合数据结构、表结构、数据存储的物理层级,形成数据字典。数据资产目录主要是面向业务人员和数据管理人员,数据字典一般面向数据管理人员和开发实施人员。

下面是数据资产目录实例:

L1~L2业务数据主题域

下面以最常见的研发和营销数据主题域为例,实例如下:

(1)研发数据主题域

(2)营销数据主题域

如何建立数据资产目录

数据资产目录管理包括目录维护及目录安全权限管理,目录应用场景有数据资产的可视化应用、数据资产目录服务、数据分析应用场景等内容。

数据资产目录主要有如下 4 个价值。

(1)统一数据管理

企业的 IT 团队无法为越来越多的业务人员和数据分析师提供所需的所有数据,导致业务人员和数据分析师无法了解企业现有的数据集数量、数据集的内容以及每个数据集的质量和实用性。他们花费太多时间来查找和理解数据,经常重新创建已经存在的数据集,经常使用不正确的数据集,导致分析不充分和不正确,这也是精益数据方法所提到的浪费的核心根源。

所以帮助业务人员和数据分析师实现自助式数据生产是数据治理的根本,为此,要先实现数据的统一管理。

数据资产目录应该是企业唯一且统一的数据资产管理工具,也是企业单一可信的数据出口。所以,数据资产目录应该清晰、结构化地将所有的数据资产按类别或标签进行管理,让所有的用户能够在一套数据体系下、一个平台上获取、分析和利用数据,让数据更容易被理解,从而减少错误,降低风险,提高数据分析效率,从而实现数据自助服务和分析。

(2)自助式探索分析

数据资产目录应该对不同角色的用户提供对应的数据探索、浏览和分析的功能,从而让用户方便地根据业务需要,用自己熟悉的方式浏览、查找、探索数据。

(3)安全合规保障

数据资产目录对所有的数据、数据产品和服务进行分级、分类、分权限管理,根据不同的身份对用户授权,满足企业的数据安全合规的要求。

(4)高效协同生产

数据资产目录是所有用户访问数据的唯一入口,要让所有用户能够高效协同,比如提供统一的知识库、数据自服务、数据标签以及协同开发等功能。

数据资产目录优化企业数据生产全链路

在没有数据资产目录的时候,企业的数据生产全链路如下所示。

由于没有统一的数据管理工具,所有的数据相关的文档、数据产品和数据都分散在企业不同的系统中,所以当需要数据的时候,工作人员就只能通过分散的文档和各种沟通会议来获得数据,然后评估数据是不是完整,再进行数据的探索和理解。如果数据不准确或者不是所需要的,则又要回到原点去寻找数据。

在数据处理和数据分析阶段,相关人员如果需要更多的数据,就要寻找更多的数据文档和组织更多的沟通会议。从寻找数据开始,到数据分析结果出来,再到数据产品构建好,这个过程费时费力,并且新的数据分析结果和数据产品又变成了数据孤岛,当别人利用数据的时候依然需要沟通。这样的过程低效、随机性很大,并且很容易导致数据质量问题。

当企业构建起数据资产目录后,数据生产的全链路就形成了,如下所示。

数据资产目录是企业所有数据产品和元数据的管理工具,能够集中地注册、管理数据资产,全面地监控数据生产的过程,让用户对数据进行探索分析,把数据治理的工作分散融入数据生产全链路中。这样从寻找数据、获取数据、评估数据、理解数据、数据处理、分析数据,到最后数据结果和数据产品的分享,所有工作人员都可以实时通过数据资产目录协作,而且所有的操作都会被记录下来,不同人可以对数据进行点评、打标签,分享自己对这个数据的理解,从而帮助其他人更好地查找和利用数据。

数据资产目录的目标是提供快速且低成本的方式来盘点、分类和组织分散且杂乱无章的数据资产,让所有人用同一个工具进行数据的查找、访问和协作。数据资产目录帮助企业构建统一的一站式数据治理能力,是精益数据治理的典型实现方式。

分享扩散:

沙发
发表于 2024-7-22 18:09:34
学习了
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

返回顶部 返回列表