HDFS架构

小小码 • 2023-01-30 10:00 • 代码基础 • 阅读 170

一键激活最新全家桶

HDFS架构HDFS架构（Master Slave）几个进程的角色 1. nameNode（master）：用于保存、管理、持久化文件的元数据（文件名、文件副本数、文件块大小、文件块列表），同时还要接收客户端的

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说HDFS架构,希望您对编程的造诣更进一步.

HDFS架构

HDFS架构（Master-Slave）

几个进程的角色
1. nameNode（master）：用于保存、管理、持久化文件的元数据（文件名、文件副本数、文件块大小、文件块列表），同时还要接收客户端的文件读写请求。
2. secondaryNameNode：用于实时同步文件元数据，给nameNode服务做副本，担当高可用备份，nameNode处于正常状态时secondaryNameNode只sandBy。
3. dataNode（slave）：真正存储文件块，分布在每个节点上。
4. dfsClient：向hdfs发请求，当用户发起一个hdfs文件读、写、查询等请求时，集群都会启动一个dfsClient进程，dfsClient先访问nameNode获取文件元数据，然后根据元数据解析出文件分片的分布情况，最后去各dataNode完成真正的读写。它扮演着用户与hdfs交互中间人的角色，同时文件的拆分和拼装也是在dfsClient进程完成的。
HDFS文件读写流程
- 读取：系统接收到用户读请求后，首先启动一个dfsClient进程，这个进程拿着用户传递的文件路径等信息，传递给nameNode，nameNode返回文件分片的分布节点列表，dfsClient就近读取文件分片，并将各分片拼装为完整文件返回给用户。
- 写入：系统接收到用户写请求后，首先启动一个dfsClient进程，这个进程将写入文件的信息提交给nameNode，nameNode根据集群情况将文件进行分片和位置规划，再将规划信息返回给dfsClient，dfsClient根据规划信息将文件切分成特定的块，然后根据位置规划分别与对应的dataNode建立管道，将分片传输到对应的dataNode上。

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/9900.html

赞 (0)

0 0

Redis集群模式「终于解决」

上一篇 2023-01-30

zookeeper工作机制_Zookeeper心跳机制实现

下一篇 2023-01-30

代码基础

mysql的操作_MySQL source

mysql的操作_MySQL source前提要述：参考书籍《MySQL必知必会》《MySQL必知必会》是先讲了查询，但是没有记录就无法查询，所以先将如何添加数据。表已经知道怎么创建了，随便创两张。 5.1 插入数据 MySQL使用 IN

小小码
2023-01-22
148
代码基础

mysql（四）_数据库MySQL

mysql（四）_数据库MySQL1.用python连接mysql实现登陆（存在sql注入危险） 2用python连接mysql实现登陆方式二（不存在sql注入危险） 3 利用python 在mysql插入数据(插) 4 利用pyth

小小码
2022-12-29
163
代码基础

Anaconda和Pandas：Python工程师的必备工具

Anaconda和Pandas：Python工程师的必备工具Python是一门广泛应用于科学计算、数据分析和人工智能领域的高级编程语言。Python的快速发展和广泛应用，带来了许多强大的工具，其中Anaconda和Pandas无疑是Python工程师必备的两大工具。Anaconda是一个含有多种数据分析工具和科学计算环境的Python发行版，而Pandas是用于Python编程语言的、基于NumPy的数据处理工具。

admin
2024-09-11
26
代码基础

SQL语句实战学习 – 小小程序员「建议收藏」

SQL语句实战学习 – 小小程序员「建议收藏」参考：https://zhuanlan.zhihu.com/p/38354000再次感谢作者的整理！！ 1.数据已提前准备好了，已知有如下4张表：学生表：student 成绩表：score（学号，课程

小小码
2023-05-27
124
代码基础

Mysql数据库语言学习的路线

Mysql数据库语言学习的路线对于我们数据库的学习，不管是测试人员还是开发人员以及我们的DBA来说重点都是SQL；但是我们的SQL可以分多少类型，学习重点又是在哪里呢，本文仅仅针对测试人员来展开说明： SQL：structure

小小码
2023-05-02
142
代码基础

Python List弹出元素实现

Python List弹出元素实现代码输出：

admin
2024-01-30
101
代码基础

k8s集群部署方案_docker redis集群

k8s集群部署方案_docker redis集群作者：颜博青云科技数据库研发工程师目前从事 PostgreSQL 产品开发工作，热衷于 PostgreSQL 数据库的学习和研究上一期我们介绍了 PG 集群复制管理工具 repmgr，能够轻松的

小小码
2023-04-30
135
代码基础

Python中的字典 – 快速查找和访问数据的绝佳工具

Python中的字典 – 快速查找和访问数据的绝佳工具在Python中，字典是一种非常实用的数据类型，它可以帮助我们快速地查找和访问数据。

admin
2024-03-12
90

发表回复