企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]大数据发展到今天,扮演了越来越重要的作用。数据可以为各种组织和企业提供关键决策的支持,也可以通过数据分析帮助发现更多的有价值的东西,如商机、风险等等。 在数据治理工作开展的时候,往往会有一个专门负责数

企业级数据治理工作怎么开展?Datahub这样做

大数据发展到今天,扮演了越来越重要的作用。数据可以为各种组织和企业提供关键决策的支持,也可以通过数据分析帮助发现更多的有价值的东西,如商机、风险等等。

		在数据治理工作开展的时候,往往会有一个专门负责数据治理工作的负责人,他和大数据的负责人共同保证数据的可靠性,合法合规性。因为只有这样的数据才是有价值的,这也是很多公司追求的目标:在合规的同时,让数据创造价值。

​ DataHub 是一个强大的工具,可帮助企业完成数据治理的工作。下面让我们从负责人的角度深入了解 DataHub 是如何帮助改善大数据负责人和数据治理负责人的。

大数据负责人

​ 大数据负责人的任务是设计和管理公司的数据及其用户。DataHub 可以帮助轻松维护大数据过程中的不同部分。最重要的是,它能形成一些通过的指标,这些对于公司的很多岗位都非常的有帮助。以下是 DataHub 如何帮助大数据负责人日常可能面临的一些问题。

1、数据集和仪表板的数据是否可靠?

​ 数据集和BI是商业决策中最重要的部分,如果这部分数据的准确性都无法保证,那么做出的决策肯定是错误的。

​ DataHub 的元数据测试功能可让您围绕元数据的内容进行自定义测试。您可以轻松查看有多少数据集,数据集中的描述、所有者和其他属性。这有助于您快速确定您的实体是否可靠。在不久的将来,Datahub还将增加一些新的功能。如允许您按最常用的数据集来查看元数据,这有助于您在进行数据质量更容易发现关键点所在。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

如何支持不同的数据使用者?

​ 开展数据分析工作意味着比以前更多的了解数据的用户和查看数据的用户。DataHub 可以让这两类用户相互合作,而无需负责人直接参与。了解数据的用户可以通过编写描述和使用标签和词汇表术语对数据进行分类来轻松注释您拥有的数据。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

DataHub 还在右侧栏中增加了简单而强大的注释工具。

想了解数据的用户还可以自行利用 DataHub 的搜索功能和数据血缘特性来查找相关资产并了解它们。

搜索功能:

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

数据血缘功能:

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

DataHub 使各种用户可以为各种元数据进行管理,从而使您的数据血缘问题不会成为团队生产力的瓶颈。

数据治理负责人

​ 随着数据安全问题的出现,监管对于数据合规性的要求越来越高。如何让数据合规合法是数据治理负责人的责任所在。由于敏感个人信息的泄露存在风险,如何让团队遵循数据治理准则就非常的重要。DataHub 的分类和数据组织功能让您可以轻松处理此问题,并减少人为的错误。

如何去定义数据的合规标准?

​ DataHub 的业务词汇表功能可以提供一站式服务,来标准化数据的合规类型,并为整个企业提供数据合规性的事实标准。将数据按照合规类型标准化为不同的级别,例如敏感数据、机密数据等等。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

单击术语表功能可让您轻松查看关联该术语的实体列表。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

术语表还允许您定义业务术语并将数据集和仪表板与术语相关联。这使您的所有团队成员都知道某个术语的确切含义。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]
企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

如何对数据进行分类?

​ 对数据进行分类是一种最简单、最强大的数据组织方式,让数据更容易管理。在 DataHub 中,您可以将术语表应用于数据集中的特定列,这样您就可以对数据进行分类并为其分配合规类型。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

​ 您还可以为术语表设置继承结构,以便特定类别自动与其他词汇表术语分类。在下面的示例中,我们将所有标记为“品种”的数据设置为也属于“敏感”的术语,因此它会在整个 DataHub 中自动携带该合规类型。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

如何将我的数据资产应用于部门级?

​ 许多企业由多个部门组成。使用 DataHub 时,团队成员可以通过在其部门的权限下浏览,轻松过滤和查看与自己部门相关的数据。

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

​ 将此功能纳入数据生态系统可以简化仅在部门级权限下进行数据相关工作的工作的团队成员的工作。这对于具有通常彼此独立工作的不同部门的公司特别有用。同时,中央管理人员仍然可以通过 DataHub 统一查看您组织中发生的所有数据和业务。

​ 有什么用呢?例如“部门 A 的数据已正确注释,但部门 B 的数据注释不全且杂乱无章”。作为数据治理的负责人,这个功能够棒了吧!

企业级数据治理工作怎么开展?Datahub这样做[亲测有效]

总结

​ 数据治理的实践经验还非常的少,在使用Datahub的过程中,也发现了很多Datahub可以帮助我们管理数据的非常好的功能。我们可以利用 DataHub来管理我们的数据,为数公司导创造价值。随着时间的推移,DataHub 也正在添加更多功能,让我们持续关注吧!

Datahub系列文章

元数据治理平台Datahub学习交流群成立

万字保姆级长文——Linkedin元数据管理平台Datahub离线安装指南

一站式元数据治理平台——Datahub入门宝典

欢迎加入学习群与我们一起讨论!

大数据与数据治理相关资料领取 请关注大数据流动,后台回复 大数据2022

加入学习群 请关注大数据流动,后台回复 加群

数据治理实践类知识星球 数据治理工具箱 也已成立 ,需要加入请在后台 回复 “数据治理工具箱”

公众号推送规则变了,如果您想及时收到推送,麻烦右下角点个在看或者把本号星标并****置顶

原文地址:https://www.cnblogs.com/tree1123/archive/2022/08/02/16543018.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4940.html

(0)
上一篇 2023-05-29 16:30
下一篇 2023-05-29

相关推荐

  • Mysql默认配置文件[通俗易懂]

    Mysql默认配置文件[通俗易懂]Mysql默认配置文件 [client] port = 3306 socket = /tmp/mysql.sock [mysql] prompt=”MySQL [d]> ” no-auto-reha…

    2023-04-01
    168
  • 高碑店哪里可以开医院门诊发票-中国新闻网[亲测有效]

    高碑店哪里可以开医院门诊发票-中国新闻网[亲测有效]高碑店哪里可以开医院门诊发票【152 * 9б 28 * 21 б9】陈生,诚、信、合、作,保、真、售、后、保、障、长、期、有、效。adb的全称为Android Debug Bridge,是Andr…

    2023-02-02
    230
  • Oracle通过一个字段的值将一条记录拆分为多条记录「建议收藏」

    Oracle通过一个字段的值将一条记录拆分为多条记录「建议收藏」前言 之前遇到了一次这样的需求,当时没有记录,这一次又赶上了,简单的记录一下。 本文个人拙见,若有出入,请指出——来自菜的颤抖 该方式的效率不高,如何优化,请看记Oracle中regexp_subs…

    2023-01-28
    148
  • 使用Pycharm进行高效查找替换技巧

    使用Pycharm进行高效查找替换技巧编程是一项非常复杂的工作,其中常常需要查找和替换特定的字符或代码,以满足功能和格式的需求。在Python编程语言中,使用Pycharm作为开发环境可以带来高效的查找替换体验。下面将介绍几种使用Pycharm进行高效查找替换的技巧。

    2024-09-12
    24
  • python协程总结(协程Python)

    python协程总结(协程Python)在python中线程和协程的区别:1、一个线程可以拥有多个协程,这样在python中就能使用多核CPU;2、线程是同步机制,而协程是异步;3、 协程能保留上一次调用时的状态,每次过程重入时,就相当于进入上一次调用的状态。

    2023-11-01
    131
  • 一文详解TDSQL PG版Oracle兼容性实践[通俗易懂]

    一文详解TDSQL PG版Oracle兼容性实践[通俗易懂]TDSQL PG版分布式关系型数据库,是一款同时面向在线事务交易和MPP实时数据分析的高性能HTAP数据库系统。面对应用业务产生的不定性数据爆炸需求,不管是高并发交易还是海量实时数据分析,TDSQL

    2023-05-02
    132
  • 修改redis配置文件_redis配置

    修改redis配置文件_redis配置介绍 Redis是一个开源的内存中键值数据存储。Redis有几个命令,可让您即时更改Redis服务器的配置设置。本教程将介绍其中一些命令,并说明如何使这些配置更改永久生效。 如何使用本指南 本指南以…

    2023-02-28
    165
  • kafka datahub_hadoop HA

    kafka datahub_hadoop HA一、概述 EFAK(Eagle For Apache Kafka,以前称为 Kafka Eagle)是一款由国内公司开源的Kafka集群监控系统,可以用来监视kafka集群的broker状态、Topi

    2023-05-19
    141

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注