mysql 第三十九篇文章~canal的深度解读1

一 简介:经过一段时间的研究,对canal有了一些见解

二 配置文件:

1 canal.properties (系统根配置文件)

    主要参数列表
   canal.properties (系统根配置文件)
   canal.destinations= example 当前server上部署的instance列表 默认为example 在canal.properties定义了canal.destinations后,需要在canal.conf.dir对应的目录下建立同名的文件

canal.auto.scan 开启instance自动扫描 如果配置为true,canal.conf.dir目录下的instance配置变化会自动触发:
          a. instance目录新增: 触发instance配置载入,lazy为true时则自动启动
          b. instance目录删除:卸载对应instance配置,如已启动则进行关闭
          c. instance.properties文件变化:reload instance配置,如已启动自动进行重载

canal.auto.scan.interval=5 扫描间隔 默认5S
  canal.instance.global.mode=spring 全局配置加载方式、
  canal.zkServers=集群 ZK集群配置
  #binlog配置
  canal.instance.binlog.format = ROW,STATEMENT,MIXED 支持的binlog格式
  canal.instance.binlog.image = FULL,MINIMAL,NOBLOB 支持的binlog
 #sql语句过滤
 canal.instance.filter.query.dcl = false 权限和存储过程相关语句 设置为false 表示不丢弃
 canal.instance.filter.query.dml = false 删增改相关语句 设置为false 表示不丢弃
 canal.instance.filter.query.ddl = false DDL相关语句 设置为false 表示不丢弃
 canal.instance.filter.table.error = false

三 关于 canal destinations
   1 server第一次启动时,会自动扫描conf目录下,将文件名做为instance name,启动对应的instance
   2 server运行过程中,会根据canal.auto.scan.interval定义的频率,进行扫描
         1. 发现目录有新增,启动新的instance
         2. 发现目录有删除,关闭老的instance
         3. 发现对应目录的instance.properties有变化,重启instance
  3 通过以上可以看出 不必再配置文件中增加实例定义,扫描会自动发现

四 关于 canal 扫描的binlog
   1 canal.instance.master.journal.name + canal.instance.master.position : 精确指定一个binlog位点,进行启动
   2 canal.instance.master.timestamp : 指定一个时间戳,canal会自动遍历mysql binlog,找到对应时间戳的binlog位点后,进行启动
   3 不指定任何信息:默认从当前数据库的位点,进行启动。(show master status)
五 关于 canal的 实例meta
   1 每个 instance 下 如果被应用读取,都有一个 meta文件,里面记录着同步的详细信息
  {"clientDatas":[{"clientIdentity":{"clientId":1001,"destination":"dbname","filter":"过滤规则"},"cursor":{"identity":{"slaveId":-1,"sourceAddress":{"address":"IP","port":3306}},"postion":{"included":false,"journalName":"mysql-    bin.000085","position":283121001,"timestamp":1512620199000}}}],"destination":"dbname"}
  包括过滤规则,instance name,同步信息(主库 IP filename,position)
  2 通过meta存在与否可以判断当前instance是否被程序读取
 六 关于 canal的消费使用情况
   1 单独的 instance 只能一个客户端进行消费
   2 如果第一个客户端停止消费,第二个客户端进行消费的时候 binlog会继承第一个客户端进行消费
   3 只要目标数据库进行事务变更,后端消费就会出现transaction显示
七 关于 canal与ZK的配合
  1 搭建两组 canal 服务和一组ZK配置
  2 canal.zkServers=IP:PORT
  3 重启两组canal生效
  4 进入zk进行查看 get /otter/canal/destinations/example/running
  {"active":true,"address":"cannalIP1","cid":1}
  5 停止接入的canal 再进入zk进行查看
 {"active":true,"address":"cannalIP2","cid":1}

八 关于canal 研发的一些问题
 1 关于单事务的过滤问题,出现大量transaction,如何进行过滤,这是一个问题

时间: 2024-11-09 11:52:31

mysql 第三十九篇文章~canal的深度解读1的相关文章

mysql 第三十五篇文章~xtarbackup增量备份以及策略

一 简介: 今天咱们来探讨下增量备份的策略 二 背景: 随着数据量的日益增长,全备已经不现实了,所以探讨并测试了增量备份策略 三 具体策略: 1  一周为界限,一天做全备,其他时间以全备为基础进行增量备份 2  一周为界限,进行打包,然后上传到备份服务器 四 具体脚本: 第一部分 参数变量初始化 #!/bin/bash #config xingqi=`date +%w` DATE=`date +%Y%m%d%H` DATEyst=`date +"%Y%m%d%H" -d "-

mysql 第三十二篇文章~并发导致的从库延迟问题

一 简介:今天来聊聊周期性从库延迟的问题 二 背景:近期每天的指定时间段,收到从库延迟的报警,然后过一段时间恢复.由于从库是提供读服务的,所以需要解决 三 分析思路: 1 周期性延时,而且全部从库都出现延迟,应该是由于主库的DML操作引起的 2 查看主库的慢日志记录(我们的数据库会每小时进行切割),也并没有发生DML慢语句,排除因为慢sql(DML操作)导致的问题,主库的DML操作如果出现慢语句,同步到从库会更慢,比如update,delete语句 3 查看从库的慢日志记录,是否出现DML慢语句

mysql 第四十五篇文章~初探MGR

一 简介 :MGR一直没有时间测试,今天咱们来初步了解搭建一下呗 二 环境: mysql5.7.20  单台机器 启动三实例 三  mysql 搭建: 1 建立相关目录+ mkdir -p /data/mysql/data_3306 mkdir -p /data/mysql/data_3307 mkdir -p /data/mysql/data_3308 2 脚本初始化 /usr/local/mysql/bin/mysqld --initialize-insecure --user=mysql

mysql 第四十四篇文章~谈谈最基本的规范

一 简介:今天咱们来谈谈研发规范 二 规范   1 表       1 选择合适的字符集和存储引擎 推荐innodb utf8mb4       2 表名称不要包含mysql关键字,符合命名规范       3 不建议采用外键       4 尽量不要采用分区表,采用分库分表是最优方案  2 列       1 每一列都要设置comment注释        2 每一列最好都设置为非NULL,设置默认值       3 varchar和char的选择 定长选择char 变长选择varchar ,

第三十九篇 Python异常处理

一. 什么是异常 异常就是程序运行时发生的错误,在程序出现错误时,则会产生一个异常,若程序没有处理它,则会抛出该异常,程序的运行也随之终止,在python中,错误触发的异常如下 错误分成两种: #语法错误示范一 if #语法错误示范二 def test: pass #语法错误示范三 class Foo pass #语法错误示范四 print(haha 1.语法错误(这种错误,根本过不了python解释器的语法检测,必须在程序执行前就改正) #TypeError:int类型不可迭代 for i i

Python之路(第三十九篇)管道、进程间数据共享Manager

一.管道 概念 管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信. 先画一幅图帮助大家理解下管道的基本原理 现有2个进程A和B,他们都在内存中开辟了空间,那么我们在内存中再开辟一个空间C,作用是连接这两个进程的.对于进程来说内存空间是可以共享的(任何一个进程都可以使用内存,内存当中的空间是用地址来标记的,我们通过查找某一个地址就能找到这个内存)A进程可以不断的向C空间输送东西,B进程可以不断的从C空间读取东西,这

第三十九篇 matplotlib模块

matplotlib模块 绘图库,可以创建常用的统计图(条形图.箱型图.折线图.散点图和直方图) bar() 条形图 # 由于该模块不识别中文,所以我们需要导入一个中文简体字文件 import matplotlib.pyplot as plt from matplotlib.font_manager import FontProperties font = FontProperties(fname='B:\\msyh.ttc') # 在文件B中找字体文件 # 修改背景为条纹 plt.style.

C++第三十九篇 -- 研究一下Windows驱动开发(二)-- 驱动程序中重要的数据结构

数据结构是计算机程序的核心,I/O管理器定义了一些数据结构,这些数据结构是编写驱动程序时所必须掌握的.驱动程序经常要创建和维护这些数据结构的实例. 一.驱动对象(DRIVER_OBJECT) 每个驱动程序会有唯一的驱动对象与之对应,并且这个驱动对象是在驱动加载的时候,被内核中的对象管理程序所创建的. 驱动对象用DRIVER_OBJECT数据结构表示,它作为驱动的一个实例被内核加载,并且内核对一个驱动只加载一个实例.确切地说,是由内核中的I/O管理器负责加载的.驱动程序需要在DriverEntry

Python开发【第十九篇】:Python操作MySQL

Python开发[第十九篇]:Python操作MySQL 本篇对于Python操作MySQL主要使用两种方式: 原生模块 pymsql ORM框架 SQLAchemy pymsql pymsql是Python中操作MySQL的模块,其使用方法和MySQLdb几乎相同. 下载安装 ? 1 pip3 install pymysql 使用操作 1.执行SQL + ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26