flink1.12 hive_flink docker

flink1.12 hive_flink dockerApache Flink社区宣布Flink 1.10.0正式发布! 本次Release版本修复1.2K个问题,对Flink作业的整体性能和稳定性做了重大改进,同时增加了对K8S,Python的支持。

Flink 1.10 正式发布!——与Blink集成完成,集成Hive,K8S

file

Apache Flink社区宣布Flink 1.10.0正式发布!

本次Release版本修复1.2K个问题,对Flink作业的整体性能和稳定性做了重大改进,同时增加了对K8S,Python的支持。

这个版本标志着与Blink集成的完成,并且强化了流式SQL与Hive的集成,本文将详细介绍新功能和主要的改进。

一、内存管理优化

原有TaskExecutor有一些缺点:

流处理和批处理用了不同的配置模型;

流处理的堆外配置RocksDB复杂,需要用户配置;

为了使内存管理更明确直观,Flink 1.10对TaskExecutor内存模型和配置做了重大改进,这个更改使FLink更适合于各种部署环境:K8S,Yarn,Mesos。

这种更改统一了入口点,使得下游框架比如zeppelin的编程更加容易。

file

二、集成Kubernetes

这对于想要在容器中使用Flink的用户是一个非常好的消息。

在Flink1.10中推出了Active Kubernetes集成

Flink的ResourceManager(K8sResMngr)与Kubernetes进行本地通信以按需分配新的Pod,类似于Flink的Yarn和Mesos集成。用户还可以利用命名空间为聚合资源消耗有限的多租户环境启动Flink集群。事先配置具有足够权限的RBAC角色和服务帐户。

用户可以简单地参考Kubernetes配置选项,然后使用以下命令在CLI中将作业提交到Kubernetes上的现有Flink会话:

./bin/flink run -d -e kubernetes-session -Dkubernetes.cluster-id=<ClusterId> examples/streaming/WindowJoin.jar

代码100分

file

三、集成Hive

Flink 1.10通过开发将Hive集成到Flink,可用于生产环境。

并且支持大部分Hive版本,Flink支持Hive版本列表:

  • 1.0

    • 1.0.0
    • 1.0.1
  • 1.1

    • 1.1.0
    • 1.1.1
  • 1.2

    • 1.2.0
    • 1.2.1
    • 1.2.2
  • 2.0

    • 2.0.0
    • 2.0.1
  • 2.1

    • 2.1.0
    • 2.1.1
  • 2.2

    • 2.2.0
  • 2.3

    • 2.3.0
    • 2.3.1
    • 2.3.2
    • 2.3.3
    • 2.3.4
    • 2.3.5
    • 2.3.6
  • 3.1

    • 3.1.0
    • 3.1.1
    • 3.1.2

需要引入依赖

代码100分<!-- Flink Dependency -->
<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-connector-hive_2.11</artifactId>
  <version>1.10.0</version>
  <scope>provided</scope>
</dependency>

<dependency>
  <groupId>org.apache.flink</groupId>
  <artifactId>flink-table-api-java-bridge_2.11</artifactId>
  <version>1.10.0</version>
  <scope>provided</scope>
</dependency>

<!-- Hive Dependency -->
<dependency>
    <groupId>org.apache.hive</groupId>
    <artifactId>hive-exec</artifactId>
    <version>${hive.version}</version>
    <scope>provided</scope>
</dependency>

连接Hive代码

val settings = EnvironmentSettings.newInstance().useBlinkPlanner().inBatchMode().build()
val tableEnv = TableEnvironment.create(settings)

val name            = "myhive"
val defaultDatabase = "mydatabase"
val hiveConfDir     = "/opt/hive-conf" // a local path
val version         = "2.3.4"

val hive = new HiveCatalog(name, defaultDatabase, hiveConfDir, version)
tableEnv.registerCatalog("myhive", hive)

// set the HiveCatalog as the current catalog of the session
tableEnv.useCatalog("myhive")

四、PyFlink:支持UDF

从Flink 1.10开始,PyFlink开始支持UDF函数。

用户还可以pip使用以下方法轻松安装PyFlink :

代码100分pip install apache-flink

file

file

file

五、其他重要变化

  • Flink现在可以编译并在Java 11上运行。

  • 一个新的Elasticsearch sink,完全支持Elasticsearch 7.x版本。

  • Kafka 0.8 和 0.9 版本已经被废,不再支持。

  • 删除了非认证网络流量配置选项taskmanager.network.credit.model。

  • 删除了旧版Web UI。

六、贡献者名单

最后我们看一下贡献者的名单,有很多国内大神的身影

Achyuth Samudrala, Aitozi, Alberto Romero, Alec.Ch, Aleksey Pak, Alexander Fedulov, Alice Yan, Aljoscha Krettek, Aloys, Andrey Zagrebin, Arvid Heise, Benchao Li, Benoit Hanotte, Benoît Paris, Bhagavan Das, Biao Liu, Chesnay Schepler, Congxian Qiu, Cyrille Chépélov, César Soto Valero, David Anderson, David Hrbacek, David Moravek, Dawid Wysakowicz, Dezhi Cai, Dian Fu, Dyana Rose, Eamon Taaffe, Fabian Hueske, Fawad Halim, Fokko Driesprong, Frey Gao, Gabor Gevay, Gao Yun, Gary Yao, GatsbyNewton, GitHub, Grebennikov Roman, GuoWei Ma, Gyula Fora, Haibo Sun, Hao Dang, Henvealf, Hongtao Zhang, HuangXingBo, Hwanju Kim, Igal Shilman, Jacob Sevart, Jark Wu, Jeff Martin, Jeff Yang, Jeff Zhang, Jiangjie (Becket) Qin, Jiayi, Jiayi Liao, Jincheng Sun, Jing Zhang, Jingsong Lee, JingsongLi, Joao Boto, John Lonergan, Kaibo Zhou, Konstantin Knauf, Kostas Kloudas, Kurt Young, Leonard Xu, Ling Wang, Lining Jing, Liupengcheng, LouisXu, Mads Chr. Olesen, Marco Zühlke, Marcos Klein, Matyas Orhidi, Maximilian Bode, Maximilian Michels, Nick Pavlakis, Nico Kruber, Nicolas Deslandes, Pablo Valtuille, Paul Lam, Paul Lin, PengFei Li, Piotr Nowojski, Piotr Przybylski, Piyush Narang, Ricco Chen, Richard Deurwaarder, Robert Metzger, Roman, Roman Grebennikov, Roman Khachatryan, Rong Rong, Rui Li, Ryan Tao, Scott Kidder, Seth Wiesman, Shannon Carey, Shaobin.Ou, Shuo Cheng, Stefan Richter, Stephan Ewen, Steve OU, Steven Wu, Terry Wang, Thesharing, Thomas Weise, Till Rohrmann, Timo Walther, Tony Wei, TsReaper, Tzu-Li (Gordon) Tai, Victor Wong, WangHengwei, Wei Zhong, WeiZhong94, Wind (Jiayi Liao), Xintong Song, XuQianJin-Stars, Xuefu Zhang, Xupingyong, Yadong Xie, Yang Wang, Yangze Guo, Yikun Jiang, Ying, YngwieWang, Yu Li, Yuan Mei, Yun Gao, Yun Tang, Zhanchun Zhang, Zhenghua Gao, Zhijiang, Zhu Zhu, a-suiniaev, azagrebin, beyond1920, biao.liub, blueszheng, bowen.li, caoyingjie, catkint, chendonglin, chenqi, chunpinghe, cyq89051127, danrtsey.wy, dengziming, dianfu, eskabetxe, fanrui, forideal, gentlewang, godfrey he, godfreyhe, haodang, hehuiyuan, hequn8128, hpeter, huangxingbo, huzheng, ifndef-SleePy, jiemotongxue, joe, jrthe42, kevin.cyj, klion26, lamber-ken, libenchao, liketic, lincoln-lil, lining, liuyongvs, liyafan82, lz, mans2singh, mojo, openinx, ouyangwulin, shining-huang, shuai-xu, shuo.cs, stayhsfLee, sunhaibotb, sunjincheng121, tianboxiu, tianchen, tianchen92, tison, tszkitlo40, unknown, vinoyang, vthinkxie, wangpeibin, wangxiaowei, wangxiyuan, wangxlong, wangyang0918, whlwanghailong, xuchao0903, xuyang1706, yanghua, yangjf2019, yongqiang chai, yuzhao.cyz, zentol, zhangzhanchum, zhengcanbin, zhijiang, zhongyong jin, zhuzhu.zz, zjuwangg, zoudaokoulife, 砚田, 谢磊, 张志豪, 曹建华

Flink系列文章:

Flink入门(一)——Apache Flink介绍
Flink入门(二)——Flink架构介绍

Flink入门(三)——环境与部署

Flink入门(四)——编程模型

更多实时计算,Flink,Kafka等相关技术博文,欢迎关注实时流式计算

file

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/9988.html

(0)
上一篇 2023-01-28 09:30
下一篇 2023-01-28 10:30

相关推荐

  • Windows远程登录MySQL「建议收藏」

    Windows远程登录MySQL「建议收藏」我的MySQL安装在Linux上,如果我要想在Windows上连接linux上的MySQL,可以使用一些工具,如Navicat和SQLyog。我在这里用SQLyog演示一下Windows远程连接MyS

    2023-02-27
    156
  • MSSQL·查询存储过程中的关键字

    MSSQL·查询存储过程中的关键字阅文时长 | 0.22分钟 字数统计 | 408字符 主要内容 | 1、引言&背景 2、声明与参考资料 『MSSQL·查询存储过程中的关键字』 编写人 | SCscHero 编写时间

    2023-04-15
    159
  • 使用Pycharm进行Python调试

    使用Pycharm进行Python调试随着Python语言的不断发展,很多开发者已经开始使用Pycharm进行集成开发环境的构建。Pycharm具有许多有用的功能,其中最有用的就是Python调试器。

    2024-08-17
    26
  • MySQL中的全表扫描和索引树扫描[通俗易懂]

    MySQL中的全表扫描和索引树扫描[通俗易懂]引言 在学习mysql时,我们经常会使用explain来查看sql查询的索引等优化手段的使用情况。在使用explain时,我们可以观察到,explain的输出有一个很关键的列,它就是type属性,ty

    2023-05-16
    140
  • 用Python爬取淘宝商品信息

    用Python爬取淘宝商品信息淘宝作为目前中国最大的电商平台,每天都有数百万的交易和商品信息产生,如何快速精准地获取这些信息,对于电商领域的研究者和实践者都具有非常重要的意义。本文将分享通过Python爬虫技术获取淘宝商品信息的经验,希望对读者有所启发。

    2024-06-12
    46
  • java架构师学习路线-MongoDB数据库详解「终于解决」

    java架构师学习路线-MongoDB数据库详解「终于解决」 图灵学院 java架构师学习路线 相信每个软件程序员对数据库这个名词都不陌生吧,今天就由我为大家总结大家生活中最常用到的MongoDB,可能有许多软件专业的学生都没听过这个词,MongoDB…

    2023-03-29
    159
  • Yarn架构「建议收藏」

    Yarn架构「建议收藏」Yarn架构(Master Slave) 进程角色: resourceManager(Master):任务调度和集群资源管理。 nodeManager(Slave):单个节点的资源管理。 applic

    2023-01-30
    141
  • MySQL数据库多实例介绍及安装「建议收藏」

    MySQL数据库多实例介绍及安装「建议收藏」MySQL数据库多实例介绍及安装1.mysql多实例实质在一台机器上开启多个不同的mysql服务端口(3306,3307),运行多个mysql服务进程,这些服务进程通过不同的socket监听不同的服…

    2023-04-05
    136

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注