Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效]

小小码 • 2023-02-01 16:30 • 代码基础 • 阅读 139

大家好，我是考100分的小小码，祝大家学习进步，加薪顺利呀。今天说一说Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效],希望您对编程的造诣更进一步.

Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理

一、写操作

　　 Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效]

二、读操作

　　　1.请求namenode 因为namenode元数据里面记录了DataNode的地址

　　　2.把我们的信息返回给客户端

　　　3.客户端收到信息之后就到相应客户端去请求数据即可

　　　4.重点是请求那个DataNode上的哪个块信息，因为namenode上存放的是块编号

　　 Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效]

三、元数据

　　元数据保存在内存中，fsimage是元数据文件的存放方式，fsimage中的内容是各个文件的块信息

　　namenode中fsimage信息会每隔半小时更新一次，新文件与旧文件合并不断更新，在关闭时也会更新一次，开启时namenode会吧fsimage的数据加载到内存

Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效]

四、namenode和SecondaryNameNode CheckPoint原理

　　在无Secondarynamenode时namenode要处理大量的客户端的请求还要每半小时把内存的数据同步到fsimage一次，为了减小namenode工作负担，设计出secondarynamenode。

　　secondarynamenode是对namenode的一个备份，它会下载namenode上的日志信息，根据日志生成fsimage实现对namenode的备份，把fsimage传给namenode，这时同步的任务交给secondarynamenode，namenode无需自己每半小时同步到fsimage。

　　不开启secondarynamenode的情况下，如果namenode挂掉就无法恢复。

　　1.secondary namenode请求主Namenode停止使用edits文件，暂时将新的写操作记录到一个新文件中，如edits.new。
　　2.secondary namenode节点从主Namenode节点获取fsimage和edits文件（采用HTTP GET）
　　3.secondary namenode将fsimage文件载入到内存，逐一执行edits文件中的操作，创建新的fsimage文件
　　4.secondary namenode将新的fsimage文件发送回主Namenode（使用HTTP POST）
　　5.主Namenode节点将从secondary namenode节点接收的fsimage文件替换旧的fsimage文件，用步骤1产生的edits.new文件替换旧的edits文件（即改名）。同时更新fstime文件来记录检查点执行的时间

　　注：从Hadoop0.21.0开始，辅助Namenode已经放弃不用，由checkpoint节点取而代之，功能不变。新版本同时引入一种新的Namenode，名为BackupNode

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至举报，一经查实，本站将立刻删除。
转载请注明出处: https://daima100.com/9765.html

Hadoop的读写操作、元数据及SecondaryNameNode、Checkpoint原理[亲测有效]

一、写操作

二、读操作

1.请求namenode 因为namenode元数据里面记录了DataNode的地址

2.把我们的信息返回给客户端

3.客户端收到信息之后 就到相应客户端去请求数据即可

4.重点是请求那个DataNode上的哪个块信息，因为namenode上存放的是块编号

三、元数据

四、namenode和SecondaryNameNode CheckPoint原理

相关推荐

发表回复

　　　1.请求namenode 因为namenode元数据里面记录了DataNode的地址

　　　2.把我们的信息返回给客户端

　　　3.客户端收到信息之后就到相应客户端去请求数据即可

　　　4.重点是请求那个DataNode上的哪个块信息，因为namenode上存放的是块编号