大数据技术栈,主要有哪些[亲测有效]

大数据技术栈,主要有哪些[亲测有效]往大数据方向发展需要学哪些技术?网上一搜真是指不胜屈。对于小白来说,实在是一头雾水,到底哪些是当下流行的?哪些是必须要先学会的?流行?主次搞不清。为了解决这些疑惑,羚羊专门花了些时间, 挨个技术去研究

大数据技术栈,主要有哪些

往大数据方向发展需要学哪些技术?网上一搜真是指不胜屈。对于小白来说,实在是一头雾水,到底哪些是当下流行的?哪些是必须要先学会的?流行?主次搞不清。为了解决这些疑惑,羚羊专门花了些时间,  挨个技术去研究对比归类,大概总结出以下的技术点:

文件存储: Hadoop HDFS、GFS、KFS、Tachyon
离线计算: Hadoop MapReduce、Spark
流式、实时计算:flink、Storm、JStorm、Spark Structured Streaming、Heron、Spark Streaming
存储格式:kudu、ORC、Apache Parquet、CarbonData
数据库: HBase、Redis、MongoDB、Couchbase、LevelDB、Apache Cassandra、Ignite、TiDB
资源管理: YARN、Mesos
日志收集: Flume、Scribe、Logstash、FileBeat
消息系统: Kafka、StormMQ、ZeroMQ、RabbitMQ、Confluent Platform
在线、离线查询搜索分析: Hive、Impala、Pig、Presto、Phoenix、SparkSQL、Drill、Kylin、Druid、ClickHouse、Elasticsearch
数据可视化查询分析工具:Apache Zeppelin、Kibana
分布式协调服务:Zookeeper
集群管理与监控:Ambari、Ganglia、Nagios、Cloudera Manager
数据同步: Sqoop、DataX、Cannal、Maxwell、Debezium、DataBus
任务调度: Azkaban、Oozie
数据安全:Apache Eagle
机器学习、数据挖掘:Spark MLLib、Mahout

 下图是羚羊根据当下流行的大数据技术点,结合之前的项目经验,基于HDFS文件系统搭建了一个基本的、通用的完整大数据平台技术架构。一切的技术都是来源于不同的需求场景,所以根据不同的产品需求搭建出来的技术架构也会有差异。

大数据架构

【版权声明】

本文版权归作者(深圳伊人网网络有限公司)和思创斯聊编程共有,欢迎转载,但未经作者同意必须在文章页面给出原文链接,否则保留追究法律责任的权利。如您有任何商业合作或者授权方面的协商,请给我留言:siqing0822@163.com

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/7894.html

(0)
上一篇 2023-03-11 19:00
下一篇 2023-03-11 20:00

相关推荐

  • 【12c】RMAN 与 DataGuard「终于解决」

    【12c】RMAN 与 DataGuard「终于解决」由于主库和备库的db_name相同的,只是db_unique_name不同,可以使用备库进行数据库的备份,从而减轻主库备份的负担。本篇演示DataGuard环境下RMAN工具的使用。 1 查看主库RM

    2023-03-05
    148
  • MySQL基础:基础查询

    MySQL基础:基础查询DQL语言:数据查询语言 3.1 基础查询 语法 select 查询列表 from 表名; 特点 查询列表可以是字段、常量、表达式、函数,也可以是多个 查询结果是一个虚拟表 示例 1、查询单个字段 s

    2023-04-20
    149
  • Python元组索引的使用方法

    Python元组索引的使用方法元组是Python中的一个特殊数据类型,类似于列表(list)。元组可以看作是不可改变的列表,一旦定义后不能更改,即元组中的元素值不允许被修改。元组使用小括号进行定义,元素之间以逗号分隔。

    2024-02-25
    130
  • MySQL索引 索引分类 最左前缀原则 覆盖索引 索引下推 联合索引顺序 – G

    MySQL索引 索引分类 最左前缀原则 覆盖索引 索引下推 联合索引顺序 – GMySQL索引 索引分类 最左前缀原则 覆盖索引 索引下推 联合索引顺序 What's Index ? 索引就是帮助RDBMS高效获取数据的数据结构。 索引可以让我们避免一行一行进行全

    2023-03-18
    151
  • plsql编程教程_pl/sql developer怎么执行sql语句

    plsql编程教程_pl/sql developer怎么执行sql语句结构化查询语言(SQL)是第四代编程语言的典型,这种命令式的语言更像一种指令,使用它,你只需要告诉计算机“做什么”,而不用告诉计算机“怎么做”。第四代编程语言普遍具有简单、易学、能更快的投入生产等优点

    2023-03-09
    134
  • 如何卸载Jupyter Notebook

    如何卸载Jupyter Notebook在使用 Jupyter Notebook 长时间后,我们可能会需要卸载它。卸载 Jupyter Notebook 的原因可能是因为你想更新 Jupyter Notebook 或者 你需要删除 Jupyter Notebook 以便重新安装它。不管是哪种情况,本文将会告诉你如何在 Windows,MacOS 和 Linux 上卸载 Jupyter Notebook。

    2024-07-26
    27
  • 使用Python repr函数的重要性

    使用Python repr函数的重要性Python是一门非常流行且易于学习的编程语言。Python内置许多有用的函数和方法,其中一个关键函数是repr函数。在本文中,我们将详细介绍repr函数在Python中的作用和重要性。

    2024-09-08
    21
  • python常用函数学习笔记(python中常用的函数)

    python常用函数学习笔记(python中常用的函数) 1.1 例如:print(hex(2))案例

    2023-11-01
    113

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注