云小课|MRS基础原理之Oozie任务调度[通俗易懂]

云小课|MRS基础原理之Oozie任务调度[通俗易懂]阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。 摘要:Oozie是一个基

云小课|MRS基础原理之Oozie任务调度

阅识风云是华为云信息大咖,擅长将复杂信息多元化呈现,其出品的一张图(云图说)、深入浅出的博文(云小课)或短视频(云视厅)总有一款能让您快速上手华为云。更多精彩内容请单击此处。

云小课|MRS基础原理之Oozie任务调度[通俗易懂]

摘要:Oozie是一个基于工作流引擎的开源框架,它能够提供对Hadoop作业的任务调度与协调。Oozie是一个工作流引擎服务器,用于运行MapReduce任务工作流。同时Oozie还是一个Java Web程序,运行在Tomcat容器中。

本文分享自华为云社区《【云小课】EI第41课 MRS基础原理之Oozie任务调度》,作者: Hello EI。

Oozie是一个基于工作流引擎的开源框架,它能够提供对Hadoop作业的任务调度与协调。

Oozie是一个工作流引擎服务器,用于运行MapReduce任务工作流。同时Oozie还是一个Java Web程序,运行在Tomcat容器中。

云小课|MRS基础原理之Oozie任务调度[通俗易懂]

Oozie工作流通过HPDL(一种通过XML自定义处理的语言,类似JBOSS JBPM的JPDL)来构造。包含“Control Node”(可控制的工作流节点)、“Action Node”。

“Control Node”用于控制工作流的编排,如“start”(开始)、“end”(关闭)、“error”(异常场景)、“decision”(选择)、“fork”(并行)、“join”(合并)等。

Oozie工作流中拥有多个“Action Node”,如MapReuce、Java等。

所有的“Action Node”以有向无环图DAG(Direct Acyclic Graph)的模式部署运行。所以在“Action Node”的运行步骤上是有方向的,当上一个“Action Node”运行完成后才能运行下一个“Action Node”。一旦当前“Action Node”完成,远程服务器将回调Oozie的接口,这时Oozie又会以同样的方式执行工作流中的下一个“Action Node”,直到工作流中所有“Action Node”都完成(完成包括失败)。

云小课|MRS基础原理之Oozie任务调度[通俗易懂]
云小课|MRS基础原理之Oozie任务调度[通俗易懂]

Oozie工作流提供各种类型的“Action Node”用于支持不同的业务需要,如MapReduce,HDFS,SSH,Java以及Oozie子流程。

如何使用Oozie

购买包含有Oozie组件的MRS集群后,用户即可使用Oozie进行作业提交及调度。

MRS集群的创建可参考MRS快速入门中的“创建集群”章节,例如购买MRS 3.1.0普通模式(关闭Kerberos认证)集群。

Oozie客户端的安装可以参考MRS用户指南的“安装客户端”章节,例如客户端安装目录为:“/opt/client”。

1.以客户端安装用户,登录安装客户端的节点。

2.执行以下命令,切换到客户端安装目录。

cd /opt/client
source bigdata_env

3.上传Oozie配置文件以及Jar包至HDFS(UserOozie为提交任务的用户名)。

hdfs dfs -mkdir /user/UserOozie
hdfs dfs -put -f /opt/client/Oozie/oozie-client-*/examples /user/UserOozie/

4.修改任务执行配置文件:

cd /opt/client/Oozie/oozie-client-*/examples/apps/map-reduce/
vi job.properties
nameNode=hdfs://hacluster 
resourceManager=Yarn ResourceManager主节点IP地址:端口   ##端口可通过“yarn.resourcemanager.port”参数查询,例如8032。
queueName=default 
examplesRoot=examples 
user.name=admin 
oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce #hdfs上传路径 
outputDir=map-reduce 
oozie.wf.rerun.failnodes=true

5.运行oozie任务:

oozie job -oozie https://oozie角色的主机名:21003/oozie/ -config job.properties -run
[root@kwephispra44947 map-reduce]# oozie job -oozie https://kwephispra44948:21003/oozie/ -config job.properties -run 
...... 
job: 0000000-200730163829770-oozie-omm-W

6.登录FusionInsight Manager,选择“集群 > 服务 > Oozie ”。

7.单击“oozie WebUI”后的超链接进入Oozie页面,在Oozie的WebUI上查看任务运行结果。

云小课|MRS基础原理之Oozie任务调度[通俗易懂]

关于Ooize应用开发及相关样例代码介绍,请参考《Oozie开发指南》。

好了,本期云小课就介绍到这里,快去体验MapReduce(MRS)更多功能吧!猛戳这里

 

点击关注,第一时间了解华为云新鲜技术~

原文地址:https://www.cnblogs.com/huaweiyun/archive/2022/10/31/16844542.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4596.html

(0)
上一篇 2023-06-13 09:30
下一篇 2023-06-13

相关推荐

  • 大数据dds_应用用户数据怎么那么大

    大数据dds_应用用户数据怎么那么大我们前面采集的日志数据已经保存到 Kafka 中,作为日志数据的 ODS 层,从 Kafka 的ODS 层读取的日志数据分为 3 类, 页面日志、启动日志和曝光日志。这三类数据虽然都是用户行为数据,但

    2023-06-19
    113
  • [20221018]本地运行与远程运行.txt「终于解决」

    [20221018]本地运行与远程运行.txt「终于解决」[20221018]本地运行与远程运行.txt//链接http://blog.tanelpoder.com/2008/02/05/oracle-hidden-costs-revealed-part

    2023-06-11
    85
  • 使用Python Tkinter实现复选框

    使用Python Tkinter实现复选框Python Tkinter是一个强大的GUI开发库,可以用来开发各种桌面应用程序。在Tkinter中,复选框是一种常见的GUI控件,用户可以通过勾选或取消勾选复选框来选择或取消选择相应的选项。

    2024-03-27
    27
  • 新特性解读 | mysql 8.0 memcached api 新特性[亲测有效]

    新特性解读 | mysql 8.0 memcached api 新特性[亲测有效]作者:杨涛涛 资深数据库专家,专研 MySQL 十余年。擅长 MySQL、PostgreSQL、MongoDB 等开源数据库相关的备份恢复、SQL 调优、监控运维、高可用架构设计等。目前任职于爱可生…

    2023-03-18
    107
  • Python Nested Condition: 如何优雅地处理多个条件语句

    Python Nested Condition: 如何优雅地处理多个条件语句在Python编程中,当我们需要对多种情况进行判断时,通常使用条件语句来实现,例如 if…elif…else 结构。而当我们需要对多个条件进行同时判断时,就需要使用嵌套条件语句。

    2024-01-22
    60
  • Python字典:高效管理和操作数据

    Python字典:高效管理和操作数据Python是一种流行的编程语言,被广泛应用于数据科学、机器学习、Web编程等领域。Python提供了丰富的数据结构,其中字典是最常用的数据结构之一。Python的字典是一种键-值对存储结构,可以高效地管理和操作数据。在本文中,我们将介绍Python字典的各种用法,包括创建字典、操作字典、遍历字典、嵌套字典等,旨在帮助读者更好地掌握Python字典的应用。

    2023-12-24
    74
  • 去 HBase,Kylin on Parquet 性能表现如何?

    去 HBase,Kylin on Parquet 性能表现如何?Kylin on HBase 方案经过长时间的发展已经比较成熟,但也存在着局限性,因此,Kyligence 推出了 Kylin on Parquet 方案。通过标准数据集测试,与仍采用 Kylin o

    2023-02-25
    111
  • 如何从文本文件读入 SQL 参数[通俗易懂]

    如何从文本文件读入 SQL 参数[通俗易懂]有时我们希望把参数列表分行存储在文本文件里,执行SQL时再拼到in函数里,从而查询出符合条件的记录。 但SQL不能解析文本文件,直接拼到in函数里有困难,所以很多人先把文件导入数据库临时表,再用jo…

    2023-03-03
    112

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注