5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步简述 本文主要介绍如何使用 CloudCanal 构建一条 MySQL 到 Greenplum / PostgreSQL 的数据同步链路。 支持版本 源端 MySQL 支持的版本为:5.6、5.7、8

5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

简述

本文主要介绍如何使用 CloudCanal 构建一条 MySQLGreenplum / PostgreSQL 的数据同步链路。

支持版本

源端 MySQL 支持的版本为:5.65.78.X
对端 PostgreSQL 支持的版本为:8.49.09.19.29.3 9.49.59.610.X11.X12.X13.X14.X15.X16.X17.X
对端 Greenplum 支持的版本为:6.X

技术点

流程自动化&功能丰富

支持创建结构迁移、全量迁移、增量同步、数据校验、数据订正类型的任务。结构迁移、全量迁移和增量同步可作为一个任务的多个阶段自动化进行。

新增表自动迁移同步

CloudCanal 提供了修改订阅的能力。对于一个正在运行的增量同步的任务,CloudCanal 提供了动态修改订阅的方式,可以对一个正在运行的增量同步任务新增需要订阅的表。对于新增的表,CloudCanal 会自动迁移、同步其数据。

自定义数据处理

用户在迁移、实时同步期间如需要对传输的数据行进行自定义的加工可以采用 CloudCanal提供的自定义数据处理能力,这对于实时宽表构建、新增动态列、基于微服务、缓存的数据清洗等数据处理场景都非常有帮助。关于更多自定义数据的使用方式可以参考:数据处理插件使用方式。

支持多种 DDL

MySQL -> Greenplum / PostgreSQL 链路支持的DDL有 Create TableDrop TableAlter TableRname TableCreate Index

支持高性能写入模式

CloudCanal 中默认采用 PostgreSQL/Greenplum的驱动通过JDBC的方式进行批量写入。如果用户对性能要求很苛刻,可以尝试开启基于Copy模式的高性能写入模式。在Copy写入模式下,写入性能相比采用JDBC的方式有很大的提升。了解基于Copy的高性能写入模式可以参考:开启PG/GP高性能写入。

支持地理信息类型写入

PostgreSQLGreenplum对于地理信息类型的处理比较友好,因此常常被用于存储地理信息数据。CloudCanal 支持迁移同步源端地理信息类型的数据并且对其做自动转换后写入对端。了解更多 CloudCanal对于地理信息类型的处理可以参考文章:CloudCanal地理数据同步与处理。

结构迁移类型自动处理

异构数据源之间对类型的处理都存在差异,CloudCanal 会进行自动的转化和优化,例如在 MySQL 中可以定义的VARCHAR(0)数据类型,在 PostgreSQL / Greenplum 中不支持,CloudCanal 结构迁移时会自动将源端MySQLVARCHAR(0)类型映射为 VARCHAR(1)

数据类型映射

CloudCanal 结构迁移和数据迁移同步时会自动进行数据类型映射。类型映射见下表:

MySQL 类型 PostgreSQL / Greenplum 类型
BIT BIT
TINYINT SMALLINT
SMALLINT SMALLINT
MEDIUMININT INTEGER
INT INTEGER
BIGINT BIGINT
DECIMAL NUMERIC
FLOAT NUMERIC
DOUBLE NUMERIC
DATE TIMESTAMP WITHOUT TIME ZONE
DATETIME TIMESTAMP WITHOUT TIME ZONE
TIMESTAMP TIMESTAMP WITHOUT TIME ZONE
TIME TIME WITHOUT TIME ZONE
YEAR INTEGER
CHAR CHARACTER
VARCHAR CHARACTER VARYING
BINARY BYTEA
VARBINARY BYTEA
TINYBLOB BYTEA
BLOB BYTEA
MEDIUMBLOB BYTEA
LONGBLOB BYTEA
TINYTEXT BYTEA
TEXT TEXT
MEDIUMTEXT TEXT
LONGTEXT TEXT
ENUM TEXT
SET TEXT
JSON JSON
GEOMETRY� TEXT
POINT� POINT�
LINESTRING� TEXT
POLYGON� POLYGON�
MULTIPOINT� TEXT
GEOMETRY_COLLECTION� TEXT
GEOM_COLLECTION� TEXT
MULTILINESTRING� TEXT

准备工作

  • 安装好 CloudCanal 社区版 2.2.5.10 及以上版本
  • 准备好源端和目标端数据库以及对应的测试数据

操作示例

添加数据源

  • 登录 CloudCanal 平台
  • 数据源管理 -> 新增数据源 -> 自建数据库

image.png

  • 添加 Greenplum 或者 PostgreSQL后可以在数据源列表看到新增的数据源。

image.png

创建同步任务

  • 任务管理 -> 创建任务
  • 源端选择 MySQL 数据源,对端选择 Greenplum / PostgreSQL
  • 分别点击 测试连接,选择源端对端需要订阅的库,选择 下一步

image.png

  • 选择 增量同步 -> 选择 全量初始化
  • 根据自身机器配置选择 规格
  • 选择 下一步

image.png

  • 选择源端需要同步的表,如果目标表显示橙色表示对端不存在该表,任务创建之后,会自动生成该表
  • 点击下一步

image.png

  • 可以在左侧,添加 数据过滤条件
  • 选择 下一步

image.png

  • 选择 创建任务

image.png

任务执行

任务创建并且启动后,会自动进行如下的三个阶段:

  • 结构迁移:任务创建之后,如果对端没有表结构,那么 CloudCanal 会去自动在对端创建表结构
  • 数据初始化:将源端存量数据整体迁移到对端
  • 数据同步:全量迁移期间以及全量完成以后的源端增量数据变更会实时同步到对端

image.png

image.png

总结

本文简单介绍了如何使用 CloudCanal 进行 MySQL -> Greenplum 数据迁移同步。各位读者朋友,如果你觉得还不错,请点赞、评论加转发吧。

原文地址:https://www.cnblogs.com/clougence/archive/2022/12/02/16943630.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4469.html

(0)
上一篇 2023-06-18 12:30
下一篇 2023-06-18 14:30

相关推荐

  • python中的一段习题(python第一章课后题答案)

    python中的一段习题(python第一章课后题答案)1:

    2023-11-02
    161
  • MySQL学习指南

    MySQL学习指南MySQL是一个关系型数据库管理系统,由瑞典MySQL AB 公司开发,属于 Oracle 旗下产品。MySQL 是最流行的关系型数据库管理系统之一,在 WEB 应用方面,MySQL是最好的 RDBM

    2023-04-17
    176
  • mysql中的数据类型_datetime数据类型

    mysql中的数据类型_datetime数据类型
    ################################# 分类标准: 分类: 数值数据类型:() 字符串数据类型 日期时间数据类型 json数据类…

    2023-04-19
    170
  • mysql 5.7 主从_MySQL source

    mysql 5.7 主从_MySQL source一、环境准备 # rpm -qa |grep mariadb |xargs yum remove -y # setenforce 0(临时关闭),(selinux配置文件:SELINUX=disabl

    2023-05-06
    166
  • Python实例在Java中的引用方法

    Python实例在Java中的引用方法Python和Java都是非常流行的编程语言。Python是一种动态语言,使用起来非常简单和高效,特别是对于数据处理和科学计算方面很方便。而Java则是一种跨平台的语言,运行速度也很快,被广泛应用于服务器端和企业级应用开发中。

    2024-01-06
    111
  • Python:一门优秀的编程语言

    Python:一门优秀的编程语言Python 是一门高级、解释型、强类型、动态类型的编程语言,由 Guido van Rossum 创造。Python 于 1991 年首次发布,是一门受到 ABC 语言启示而创建的语言。Python 最初设计用于编写自动化脚本(shell),后来逐渐发展成为通用编程语言,广泛应用于 Web 开发、数据分析、人工智能等领域。

    2024-07-18
    45
  • 优化数据结构,deque为高效操作尽一份微力

    优化数据结构,deque为高效操作尽一份微力Python标准库collections模块中的deque(双向队列)是一种高效的数据结构,其支持从两端高效地添加或删除元素。它具备与列表(List)相似的功能,但却更加节省内存并且可以提供O(1)复杂度的popleft操作,这使得deque在需要高效的队列或栈操作时非常有用。

    2024-03-08
    80
  • 利用pip安装cv2的步骤

    利用pip安装cv2的步骤在计算机视觉及图像处理领域,cv2是一款非常常用的Python库。它可以在Python中调用OpenCV(开源计算机视觉库),让Python开发者更加便途地完成图像和视频处理相关的任务。
    在本篇文章中,我们将通过几个方面详细阐述利用pip安装cv2的步骤。通过本文的学习,读者将会掌握如下知识:

    2024-05-01
    73

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注