Canal——原理架构及应用场景

Canal简介

Canal是阿里开源的一款基于Mysql数据库binlog的增量订阅和消费组件，通过它可以订阅数据库的binlog日志，然后进行一些数据消费，如数据镜像、数据异构、数据索引、缓存更新等。相对于消息队列，通过这种机制可以实现数据的有序化和一致性。

github地址：https://github.com/alibaba/canal

完整wiki地址：https://github.com/alibaba/canal/wiki

Canal工作原理

原理相对比较简单：

canal模拟mysql slave与mysql master的交互协议，伪装自己是一个mysql slave，向mysql master发送dump协议
mysql master收到mysql slave（canal）发送的dump请求，开始推送binlog增量日志给slave(也就是canal)
mysql slave（canal伪装的）收到binlog增量日志后,就可以对这部分日志进行解析，获取主库的结构及数据变更

Mysql主从同步原理

canal工作原理其实也是基于mysql主从同步原理的，所以理解mysql主从同步原理是第一步

master将改变记录到二进制日志(binary log)中
slave（I/O thread）将master的记录改变的binlog日志拷贝到它的中继日志(relay log)中
slave（SQL thread）重做中继日志中的事件，将改变反映它自己的数据从库中

Canal架构

说明：
server代表一个canal运行实例，对应于一个jvm
instance对应于一个数据队列

instance模块：
eventParser (数据源接入，模拟slave协议和master进行交互，协议解析)
eventSink (Parser和Store链接器，进行数据过滤，加工，分发的工作)
eventStore (数据存储)
metaManager (增量订阅&消费信息管理器)

Canal应用场景

　　1、同步缓存redis/全文搜索ES

　　canal一个常见应用场景是同步缓存/全文搜索，当数据库变更后通过binlog进行缓存/ES的增量更新。当缓存/ES更新出现问题时，应该回退binlog到过去某个位置进行重新同步，并提供全量刷新缓存/ES的方法，如下图所示。

　　2、下发任务

　　另一种常见应用场景是下发任务，当数据变更时需要通知其他依赖系统。其原理是任务系统监听数据库变更，然后将变更的数据写入MQ/kafka进行任务下发，比如商品数据变更后需要通知商品详情页、列表页、搜索页等先关系统。这种方式可以保证数据下发的精确性，通过MQ发送消息通知变更缓存是无法做到这一点的，而且业务系统中不会散落着各种下发MQ的代码，从而实现了下发归集，如下图所示。

　　3、数据异构

　　在大型网站架构中，DB都会采用分库分表来解决容量和性能问题，但分库分表之后带来的新问题。比如不同维度的查询或者聚合查询，此时就会非常棘手。一般我们会通过数据异构机制来解决此问题。

所谓的数据异构，那就是将需要join查询的多表按照某一个维度又聚合在一个DB中。让你去查询。canal就是实现数据异构的手段之一。

参考：

https://www.cnblogs.com/huangxincheng/p/7456397.html

原文地址：https://www.cnblogs.com/caoweixiong/p/11824423.html

时间： 2024-08-29 13:24:06

Canal——原理架构及应用场景

Canal简介

Canal工作原理

Mysql主从同步原理

Canal架构

Canal应用场景

Canal——原理架构及应用场景的相关文章

【Netty】最透彻的Netty原理架构解析

(转)OpenStack —— 原理架构介绍(一、二)

HTTPS 原理剖析与项目场景

python 装饰器语法糖（@classmethod @staticmethod @property @name.)原理剖析和运用场景

Durid(一): 原理架构

局部性原理的点滴应用场景 use of localityprinciple

K8s 原理架构介绍(一)

nginx之旅（第四篇）:nginx限速原理、nginx限速场景、nginx限速实现

lvs之 lvs原理架构介绍