hadoop伪分布安装_伪分布式hadoop

hadoop伪分布安装_伪分布式hadoopHadoop伪分布安装搭建 搭建Hadoop的环境 一、准备工作 1、安装Linux、JDK、关闭防火墙、配置主机名 解压:tar -zxvf hadoop-2.7.3.tar.gz -C ~/tra

Hadoop伪分布安装搭建

  Hadoop伪分布安装搭建

搭建Hadoop的环境
======================================
一、准备工作
1、安装Linux、JDK、关闭防火墙、配置主机名

解压:tar -zxvf hadoop-2.7.3.tar.gz -C ~/traning/

设置Hadoop的环境变量: vi ~/.bash_profile

HADOOP_HOME=/root/training/hadoop-2.7.3
export HADOOP_HOME

PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
export PATH

环境变量生效
source ~/.bash_profile

 

=============== 伪分布模式:一台(bigdata111)
特点:是在单机上,模拟一个分布式的环境
具备Hadoop的主要功能

HDFS: namenode+datanode+secondarynamenode
Yarn: resourcemanager + nodemanager

  hdfs-site.xml

原则:一般数据块的冗余度跟数据节点(DataNode)的个数一致;最大不超过3

<!–表示数据块的冗余度,默认:3–>
<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>

先不设置
<!–是否开启HDFS的权限检查,默认true–>
<property>
  <name>dfs.permissions</name>
  <value>false</value>
</property>

  core-site.xml

<!–配置NameNode地址,9000是RPC通信端口–>
<property>
  <name>fs.defaultFS</name>
  <value>hdfs://bigdata111:9000</value>
</property>

<!–HDFS数据保存在Linux的哪个目录,默认值是Linux的tmp目录–>
<property>
  <name>hadoop.tmp.dir</name>
  <value>/root/training/hadoop-2.7.3/tmp</value>
</property>

  mapred-site.xml 默认没有 cp mapred-site.xml.template mapred-site.xml

<!–MR运行的框架–>
<property>
  <name>mapreduce.framework.name</name>
  <value>yarn</value>
</property>

  yarn-site.xml

<!–Yarn的主节点RM的位置–>
<property>
  <name>yarn.resourcemanager.hostname</name>
  <value>bigdata111</value>
</property>

<!–MapReduce运行方式:shuffle洗牌–>
<property>
  <name>yarn.nodemanager.aux-services</name>
  <value>mapreduce_shuffle</value>
</property>

格式化:HDFS(NameNode)
hdfs namenode -format

日志:
Storage directory /root/training/hadoop-2.7.3/tmp/dfs/name has been successfully formatted.

启动停止Hadoop的环境
start-all.sh
stop-all.sh

访问:通过Web界面
HDFS: http://192.168.153.111:50070
Yarn: http://192.168.153.111:8088

运行
例子:/root/training/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar
hadoop jar hadoop-mapreduce-examples-2.7.3.jar wordcount /input/data.txt /output/0407

(*)一定配置免密码登录:原理、配置

 

hadoop伪分布安装_伪分布式hadoop

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/8936.html

(0)
上一篇 2023-02-19
下一篇 2023-02-19

相关推荐

  • MySQL DQL 去重教程表代码「建议收藏」

    MySQL DQL 去重教程表代码「建议收藏」垃圾的撒娇的风景色谱发票为菩萨的搭配覅色谱法配色【】we9rfpqsoedufoiewrun拍摄跑调覅就怕是东风破一坚实的皮肤的胜多负少的 的食品发票速度发票首都非破损的赔付喷水电机 山东分批进隧道排

    2023-04-24
    135
  • Python正则表达式速查表:快速匹配字符串模式

    Python正则表达式速查表:快速匹配字符串模式Python正则表达式可以被描述为一种高级的文本匹配工具,用于在给定的字符串中搜索指定的字符串模式。在处理文本数据时,它已成为Python开发人员的核心工具之一。由于正则表达式的难度和灵活性,学习它并熟练掌握它是必要的。那么,本文将为您提供有关Python正则表达式的全面指南,从基础到高级,帮助您更好地理解Python正则表达式。

    2024-03-14
    71
  • Python tan 4:如何让数学计算更精确?

    Python tan 4:如何让数学计算更精确?作为一门应用广泛的编程语言,python不仅可以完成各种企业级应用的开发,同时也可以用来进行数学计算。然而在进行数学计算时,可能会出现误差偏大、计算速度缓慢等问题。本文将从以下几个方面介绍如何让python进行更精确的数学计算。

    2024-01-27
    111
  • redis数据库持久化问题处理「建议收藏」

    redis数据库持久化问题处理「建议收藏」redis数据库问题整理一、数据无法持久化1、背景介绍:经开发人员告知redis有3万多条数据无法写入内存,数据持久化停滞状态。2、排查过程:经过排查redis日志,发现报错信息如下,经过查询得知为…

    2023-03-25
    146
  • 如何退出conda

    如何退出condaConda是一个包管理系统和环境管理系统。它可以让你在不同的项目之间快速切换环境,并管理不同的依赖包。Conda也提供了一些命令行工具,包括conda、conda-env和conda-build等工具,用于在conda环境下进行不同的操作。

    2024-09-01
    20
  • MySQL学习——使用mysqldump命令备份和还原「建议收藏」

    MySQL学习——使用mysqldump命令备份和还原「建议收藏」本文主要学习了如何使用mysqldump命令备份和还原数据库。

    2022-12-28
    153
  • Python 工程师

    Python 工程师Python是一种高级编程语言,被广泛用于Web开发、科学计算、人工智能等领域,同时也逐渐成为了最受欢迎的编程语言之一。作为一名成功的Python工程师,需要掌握一系列技能和知识,如数据分析、网络编程、机器学习等。这篇文章将介绍Python工程师的职责、所需技能以及如何成为一名出色的Python工程师。

    2024-04-20
    74
  • 掌握Photoshop混合模式

    掌握Photoshop混合模式在Photoshop中,混合模式是非常重要的一个功能,它可以让我们更加灵活地处理图像。通过使用不同的混合模式,我们可以改变图像的外观、色彩和透明度等效果。在这篇文章中,我们将深入了解Photoshop混合模式,并通过详细的示例代码来帮助读者更好地掌握。无论你是Photoshop初学者还是有一定经验的用户,都可以从本文中获益。

    2024-08-31
    25

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注