ambari部署hadoop集群_impala apache

ambari部署hadoop集群_impala apache1、环境说明 | 操作系统 | CentOS Linux release 7.4.1708 (Core) | | | : : | | Ambari | 2.6.x | | HDP | 2.6.3.0

Ambari HDP 下 SPARK2 与 Phoenix 整合

1、环境说明

操作系统 CentOS Linux release 7.4.1708 (Core)
Ambari 2.6.x
HDP 2.6.3.0
Spark 2.x
Phoenix 4.10.0-HBase-1.2

2、条件

  1. HBase 安装完成

  2. Phoenix 已经启用,Ambari界面如下所示:

    ambari部署hadoop集群_impala apache

  3. Spark 2安装完成

3、Spark2 与 Phoenix整合

Phoenix 官网整合教程: http://phoenix.apache.org/phoenix_spark.html

步骤:

  1. 进入 Ambari Spark2 配置界面

    ambari部署hadoop集群_impala apache

  2. 找到自定义 spark2-defaults并添加如下配置项:

    spark.driver.extraClassPath=/usr/hdp/current/phoenix-client/phoenix-4.10.0-HBase-1.2-client.jar
    spark.executor.extraClassPath=/usr/hdp/current/phoenix-client/phoenix-4.10.0-HBase-1.2-client.jar

    代码100分

    mark

4、Yarn HA 问题

如果配置了Yarn HA, 则需要修改 Yarn HA 配置,否则spark-submit提交任务会报如下错误:

代码100分Exception in thread "main" java.lang.IllegalAccessError: tried to access method org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider.getProxyInternal()Ljava/lang/Object; from class org.apache.hadoop.yarn.client.RequestHedgingRMFailoverProxyProvider
        at org.apache.hadoop.yarn.client.RequestHedgingRMFailoverProxyProvider.init(RequestHedgingRMFailoverProxyProvider.java:75)
        at org.apache.hadoop.yarn.client.RMProxy.createRMFailoverProxyProvider(RMProxy.java:163)
        at org.apache.hadoop.yarn.client.RMProxy.createRMProxy(RMProxy.java:94)
        at org.apache.hadoop.yarn.client.ClientRMProxy.createRMProxy(ClientRMProxy.java:72)
        at org.apache.hadoop.yarn.client.api.impl.YarnClientImpl.serviceStart(YarnClientImpl.java:187)
        at org.apache.hadoop.service.AbstractService.start(AbstractService.java:193)
        at org.apache.spark.deploy.yarn.Client.submitApplication(Client.scala:153)
        at org.apache.spark.scheduler.cluster.YarnClientSchedulerBackend.start(YarnClientSchedulerBackend.scala:56)
        at org.apache.spark.scheduler.TaskSchedulerImpl.start(TaskSchedulerImpl.scala:173)
        at org.apache.spark.SparkContext.<init>(SparkContext.scala:509)
        at org.apache.spark.SparkContext$.getOrCreate(SparkContext.scala:2516)
        at org.apache.spark.sql.SparkSession$Builder$$anonfun$7.apply(SparkSession.scala:922)
        at org.apache.spark.sql.SparkSession$Builder$$anonfun$7.apply(SparkSession.scala:914)
        at scala.Option.getOrElse(Option.scala:121)
        at org.apache.spark.sql.SparkSession$Builder.getOrCreate(SparkSession.scala:914)
        at cn.spark.sxt.SparkOnPhoenix$.main(SparkOnPhoenix.scala:13)
        at cn.spark.sxt.SparkOnPhoenix.main(SparkOnPhoenix.scala)
        at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
        at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
        at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
        at java.lang.reflect.Method.i

修改Yarn HA配置:

原来的配置:

yarn.client.failover-proxy-provider=org.apache.hadoop.yarn.client.RequestHedgingRMFailoverProxyProvider

ambari部署hadoop集群_impala apache

改为现在的配置

代码100分yarn.client.failover-proxy-provider=org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider

ambari部署hadoop集群_impala apache

如果没有配置 Yarn HA, 则不需要进行此步配置


欢迎关注微信公众号

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/9902.html

(0)
上一篇 2023-01-30
下一篇 2023-01-30

相关推荐

  • 常见SQL编写和优化[通俗易懂]

    常见SQL编写和优化[通俗易懂]常见的SQL优化方式 1. 对查询进行优化,应尽量避免全表扫描,首先应考虑在 where及order by 涉及的列上建立索引 。 2. 应尽量 避免 在 where 子句中对字段进行null 值判断

    2022-12-24
    144
  • Python阶乘实现

    Python阶乘实现Python是一种高层次的动态编程语言,被广泛应用于Web开发、数据科学、人工智能等领域。Python的一个关键特性是它强大且易于使用的标准库,其中包括了多种数据类型和数据结构,可以轻松实现大量常用算法。本文将介绍如何使用Python实现阶乘,作为入门算法的示范,希望能够吸引读者的兴趣和启发读者对Python编程的兴趣。

    2024-05-24
    75
  • mysql索引优化有几种_如何优化索引

    mysql索引优化有几种_如何优化索引导读 本文章始发于本人公众号:码猿技术专栏,原创不易,谢谢关注推荐。 索引下推(index condition pushdown )简称ICP,在Mysql5.6的版本上推出,用于优化查询。 在不使用

    2023-02-11
    150
  • Oracle解析逗号分隔的字符串,或者01110110101此类数据

    Oracle解析逗号分隔的字符串,或者01110110101此类数据– 1.提取此类数据中的1的索引位置,从1开始 例: 0001100001100 –> 4,5,10,11 create or replace function hazq_instr_con

    2022-12-22
    126
  • 使用PyTorch进行神经网络训练

    使用PyTorch进行神经网络训练PyTorch是一个基于Python的机器学习库,主要用于构建深度神经网络。它实现了动态计算图概念,从而使得模型的构建、训练和优化更加灵活方便。在本文中,我们将介绍如何使用PyTorch进行神经网络训练,以及它的一些基本概念和技巧。

    2024-04-17
    76
  • MySQL分区表Range方式

    MySQL分区表Range方式Range分区的特点: 根据分区键值保存到不同表中 多个分区要连续,不能重叠 要完全封口则需要使用MAXVALUE CREATE TABLE `user_login_log` ( `user_id`…

    2023-03-07
    177
  • 测试在线答案查询:Python工程师必备利器

    测试在线答案查询:Python工程师必备利器在软件开发领域,需要进行各种各样的测试工作,其中就包括测试问题的答案。对于Python工程师来说,一个好用的在线答案查询工具是必不可少的。本文介绍了一个强大的Python库——WolframAlpha,它可以解决许多测试中出现的数学、物理、化学、天文学等问题。

    2023-12-24
    113
  • 使用pip升级Python库的命令

    使用pip升级Python库的命令Python是一种高级编程语言,它具有开源性、跨平台性、易于学习和理解等特点,已经被广泛应用于数据分析、机器学习、人工智能等领域。Python库则是Python编程的一个重要组成部分,它们提供了许多常用的函数和模块,帮助Python程序员解决问题和完成任务。然而,随着技术的更新和改进,Python库也需要不断升级以追赶时代的步伐。而pip则是Python自带的包管理器,可以帮助Python程序员下载和升级Python库。

    2024-07-03
    40

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注