5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步简述 本文主要介绍如何使用 CloudCanal 构建一条 MySQL 到 Greenplum / PostgreSQL 的数据同步链路。 支持版本 源端 MySQL 支持的版本为:5.6、5.7、8

5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

简述

本文主要介绍如何使用 CloudCanal 构建一条 MySQLGreenplum / PostgreSQL 的数据同步链路。

支持版本

源端 MySQL 支持的版本为:5.65.78.X
对端 PostgreSQL 支持的版本为:8.49.09.19.29.3 9.49.59.610.X11.X12.X13.X14.X15.X16.X17.X
对端 Greenplum 支持的版本为:6.X

技术点

流程自动化&功能丰富

支持创建结构迁移、全量迁移、增量同步、数据校验、数据订正类型的任务。结构迁移、全量迁移和增量同步可作为一个任务的多个阶段自动化进行。

新增表自动迁移同步

CloudCanal 提供了修改订阅的能力。对于一个正在运行的增量同步的任务,CloudCanal 提供了动态修改订阅的方式,可以对一个正在运行的增量同步任务新增需要订阅的表。对于新增的表,CloudCanal 会自动迁移、同步其数据。

自定义数据处理

用户在迁移、实时同步期间如需要对传输的数据行进行自定义的加工可以采用 CloudCanal提供的自定义数据处理能力,这对于实时宽表构建、新增动态列、基于微服务、缓存的数据清洗等数据处理场景都非常有帮助。关于更多自定义数据的使用方式可以参考:数据处理插件使用方式。

支持多种 DDL

MySQL -> Greenplum / PostgreSQL 链路支持的DDL有 Create TableDrop TableAlter TableRname TableCreate Index

支持高性能写入模式

CloudCanal 中默认采用 PostgreSQL/Greenplum的驱动通过JDBC的方式进行批量写入。如果用户对性能要求很苛刻,可以尝试开启基于Copy模式的高性能写入模式。在Copy写入模式下,写入性能相比采用JDBC的方式有很大的提升。了解基于Copy的高性能写入模式可以参考:开启PG/GP高性能写入。

支持地理信息类型写入

PostgreSQLGreenplum对于地理信息类型的处理比较友好,因此常常被用于存储地理信息数据。CloudCanal 支持迁移同步源端地理信息类型的数据并且对其做自动转换后写入对端。了解更多 CloudCanal对于地理信息类型的处理可以参考文章:CloudCanal地理数据同步与处理。

结构迁移类型自动处理

异构数据源之间对类型的处理都存在差异,CloudCanal 会进行自动的转化和优化,例如在 MySQL 中可以定义的VARCHAR(0)数据类型,在 PostgreSQL / Greenplum 中不支持,CloudCanal 结构迁移时会自动将源端MySQLVARCHAR(0)类型映射为 VARCHAR(1)

数据类型映射

CloudCanal 结构迁移和数据迁移同步时会自动进行数据类型映射。类型映射见下表:

MySQL 类型 PostgreSQL / Greenplum 类型
BIT BIT
TINYINT SMALLINT
SMALLINT SMALLINT
MEDIUMININT INTEGER
INT INTEGER
BIGINT BIGINT
DECIMAL NUMERIC
FLOAT NUMERIC
DOUBLE NUMERIC
DATE TIMESTAMP WITHOUT TIME ZONE
DATETIME TIMESTAMP WITHOUT TIME ZONE
TIMESTAMP TIMESTAMP WITHOUT TIME ZONE
TIME TIME WITHOUT TIME ZONE
YEAR INTEGER
CHAR CHARACTER
VARCHAR CHARACTER VARYING
BINARY BYTEA
VARBINARY BYTEA
TINYBLOB BYTEA
BLOB BYTEA
MEDIUMBLOB BYTEA
LONGBLOB BYTEA
TINYTEXT BYTEA
TEXT TEXT
MEDIUMTEXT TEXT
LONGTEXT TEXT
ENUM TEXT
SET TEXT
JSON JSON
GEOMETRY� TEXT
POINT� POINT�
LINESTRING� TEXT
POLYGON� POLYGON�
MULTIPOINT� TEXT
GEOMETRY_COLLECTION� TEXT
GEOM_COLLECTION� TEXT
MULTILINESTRING� TEXT

准备工作

  • 安装好 CloudCanal 社区版 2.2.5.10 及以上版本
  • 准备好源端和目标端数据库以及对应的测试数据

操作示例

添加数据源

  • 登录 CloudCanal 平台
  • 数据源管理 -> 新增数据源 -> 自建数据库

image.png

  • 添加 Greenplum 或者 PostgreSQL后可以在数据源列表看到新增的数据源。

image.png

创建同步任务

  • 任务管理 -> 创建任务
  • 源端选择 MySQL 数据源,对端选择 Greenplum / PostgreSQL
  • 分别点击 测试连接,选择源端对端需要订阅的库,选择 下一步

image.png

  • 选择 增量同步 -> 选择 全量初始化
  • 根据自身机器配置选择 规格
  • 选择 下一步

image.png

  • 选择源端需要同步的表,如果目标表显示橙色表示对端不存在该表,任务创建之后,会自动生成该表
  • 点击下一步

image.png

  • 可以在左侧,添加 数据过滤条件
  • 选择 下一步

image.png

  • 选择 创建任务

image.png

任务执行

任务创建并且启动后,会自动进行如下的三个阶段:

  • 结构迁移:任务创建之后,如果对端没有表结构,那么 CloudCanal 会去自动在对端创建表结构
  • 数据初始化:将源端存量数据整体迁移到对端
  • 数据同步:全量迁移期间以及全量完成以后的源端增量数据变更会实时同步到对端

image.png

image.png

总结

本文简单介绍了如何使用 CloudCanal 进行 MySQL -> Greenplum 数据迁移同步。各位读者朋友,如果你觉得还不错,请点赞、评论加转发吧。

原文地址:https://www.cnblogs.com/clougence/archive/2022/12/02/16943630.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
转载请注明出处: https://daima100.com/4469.html

(0)
上一篇 2023-06-18 12:30
下一篇 2023-06-18 14:30

相关推荐

  • 选方向?大数据的职位你了解多少[亲测有效]

    选方向?大数据的职位你了解多少[亲测有效]这是大数据入门常识第二篇,主要讨论大数据工作的方向问题。第一篇没看的同学可以补一下: "3000字长文教你大数据该怎么学!" 有不少刚入门的同学在后台会问类似这样的问题 看招聘网站

    2023-03-01
    152
  • 电脑开机后进不了系统「终于解决」

    电脑开机后进不了系统「终于解决」电脑开机了却进不了系统是不是很奇怪呢,那么遇到这种问题,我们应该怎么解决呢? 电脑开机后进不了系统多半是系统损坏了,需要重装系统。 需要使用另外一台正常的电脑制作U盘启动盘。 1第一步打开云骑士装机…

    2023-04-12
    174
  • sql数据类型_8大基本数据类型

    sql数据类型_8大基本数据类型SQL列的数据类型分类: Unicode数据: 1.nchar 2.nvarchar 3.ntext 说明: Unicode支持的字符范围更大。存储 Unicode 字符所需要的空间更大。 傻瓜式教程

    2023-02-17
    136
  • Mysql与redis缓存一致性「终于解决」

    Mysql与redis缓存一致性「终于解决」问题:线程A在修改mysql的时候,线程B先读取了数据,接着线程A执行完毕,此时redis中没有数据了,接着线程B处理业务然后设置redis缓存,此时redis中的数据还是线程A修改前的数据。

    2023-04-15
    148
  • Oracle删除用户操作「建议收藏」

    Oracle删除用户操作「建议收藏」记录删除Oracle用户和相关操作: 首先确认相关的用户,表空间,表空间文件信息 select username,default_tablespace from dba_users where us…

    2023-01-28
    166
  • oracle redo日志_MySQL性能优化

    oracle redo日志_MySQL性能优化背景 现在主流的数据库系统的故障恢复逻辑都是基于经典的ARIES协议,也就是基于undo日志+redo日志的来进行故障恢复。redo日志是物理日志,一般采用WAL(Write-Ahead-Loggin

    2022-12-17
    135
  • MySQL高可用架构_高可用架构社区

    MySQL高可用架构_高可用架构社区一、MHA介绍 MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,它由日本DeNA公司youshimaton(现就职于Facebook公司)

    2022-12-26
    137
  • Python Setup.py:构建和分发Python软件的核心工具

    Python Setup.py:构建和分发Python软件的核心工具Python是一种高级编程语言,已经成为了web开发、数据科学、机器学习等领域的主要语言之一。当你开发了一个Python代码库,你希望在其他地方使用它,那么如何分发这个代码库呢?这就需要用到Python Setup.py,一个构建和分发Python软件的核心工具。本文将详细介绍Python Setup.py的使用方法。

    2023-12-06
    106

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注