数据治理的王者——Apache Atlas「建议收藏」

数据治理的王者——Apache Atlas「建议收藏」一、Atlas是什么? 在当今大数据的应用越来越广泛的情况下,数据治理一直是企业面临的巨大问题。 大部分公司只是单纯的对数据进行了处理,而数据的血缘,分类等等却很难实现,市场上也急需要一个专注于数据治

file

一、Atlas是什么?

在当今大数据的应用越来越广泛的情况下,数据治理一直是企业面临的巨大问题。

大部分公司只是单纯的对数据进行了处理,而数据的血缘,分类等等却很难实现,市场上也急需要一个专注于数据治理的技术框架,这时Atlas应运而生。

Atlas官网地址:https://atlas.apache.org/

Atlas是Hadoop的数据治理和元数据框架。

Atlas是一组可扩展和可扩展的核心基础治理服务,使企业能够有效,高效地满足Hadoop中的合规性要求,并允许与整个企业数据生态系统集成。

Apache Atlas为组织提供了开放的元数据管理和治理功能,以建立其数据资产的目录,对这些资产进行分类和治理,并为数据科学家,分析师和数据治理团队提供围绕这些数据资产的协作功能。

file

  • Atlas支持各种Hadoop和非Hadoop元数据类型

  • 提供了丰富的REST API进行集成

  • 对数据血缘的追溯达到了字段级别,这种技术还没有其实类似框架可以实现

  • 对权限也有很好的控制

二、架构原理

file

Atlas包括以下组件:

  • 采用Hbase存储元数据
  • 采用Solr实现索引
  • Ingest/Export 采集导出组件 Type System类型系统 Graph Engine图形引擎 共同构成Atlas的核心机制
  • 所有功能通过API向用户提供,也可以通过Kafka消息系统进行集成
  • Atlas支持各种源获取元数据:Hive,Sqoop,Storm。。。
  • 还有优秀的UI支持

三、效果图

file

file

更多大数据,Atlas,ES,Kafka等技术博文,欢迎关注实时流式计算:

file

本文由博客一文多发平台 OpenWrite 发布!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/10837.html

(0)
上一篇 2022-12-21
下一篇 2022-12-21

相关推荐

  • Python判断list为空的方法

    Python判断list为空的方法 Python是一种高级编程语言,因其简洁易懂、功能强大而备受欢迎。在Python中,判断列表(list)是否为空是常见的操作之一,可以帮助程序员更好地处理数据。本文将主要介绍Python判断list为空的方法,为读者提供清晰易懂的Python编程指南。

    2024-07-10
    40
  • 使用Python对JSON数组进行循环

    使用Python对JSON数组进行循环JSON是一种轻量级的数据交换格式,很多API接口返回的数据都是JSON格式。在Python中,我们可以使用json模块来处理JSON数据,将其转换成Python字典,然后对其进行操作。本文将围绕使用Python对JSON数组进行循环展开,给读者提供详细的操作指导。

    2024-09-02
    23
  • MySQL基础篇(一)

    MySQL基础篇(一)本文主要内容为MySQL的基础语句以及正则表达式等内容。 本文操作的数据库内容存在个人github:https://github.com/YuanGao-1/blog_demo.git init_sc

    2023-04-16
    147
  • redis 过期删除策略和内存淘汰机制是什么_redis缓存过期策略

    redis 过期删除策略和内存淘汰机制是什么_redis缓存过期策略Redis 设置过期时间 Redis 有四个不同的命令可以用于设置键的生存时间(键可以存在多久)或过期时间(键什么时候会被删除): EXPIRE <key> <ttl> ——将

    2023-04-24
    155
  • Python中Open函数用法详解

    Python中Open函数用法详解在Python中,我们可以使用Open函数来打开文件,进行读写操作。该函数是Python中文件IO操作的基础,功能非常强大。那么,本文将从多个角度,详细介绍Python中Open函数的使用方法。

    2024-05-19
    63
  • 利用Python Tuple进行数学计算

    利用Python Tuple进行数学计算a href=”https://www.python100.com/a/sm.html”font color=”red”免责声明/font/a a href=”https://beian.miit.gov.cn/”苏ICP备2023018380号-1/a Copyright www.python100.com .Some Rights Reserved.

    2024-01-10
    98
  • 从网络导入数据到python(从网站导入数据)

    从网络导入数据到python(从网站导入数据)可以,但难易程度取决于在下面哪个阶段获取这个数据

    2023-10-29
    133
  • 什么是爬虫

    什么是爬虫在互联网时代,人们通过浏览器访问网站获取所需信息已成为日常生活不可或缺的一部分。但是,当人们需要通过大量的网站或特定的网站来获取信息时,这将变得非常困难和费时,这时候,爬虫就应运而生了。

    2024-05-22
    63

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注