pt-online-schema-change你今天滥用了吗？

注：本文来自真实生产案例，感谢网友小豚提供，本人加以故障重现校验。

场景

因想整理一下线上的独立表空间碎片，故使用了pt-online-schema-change在slave从库上执行，目的是怕影响主库的CPU，维护的时候再进行一次主从切换，然后再收缩主库上的表空间碎片。

slave从库上执行的命令如下：

# pt-online-schema-change -S /tmp/mysql.sock --alter="engine=innodb"  
--no-check-replication-filters  --recursion-method=none
--user=root D=test,t=sbtest --execute

故障

DBA在修改完表结构以后，业务方反馈数据不准确，在排查的过程中发现同步报错1032。

分析

1、主库和从库的binlog格式为ROW

2、pt-online-schema-change在拷贝原表数据时，原表的数据变更会通过触发器insert/updete/delete到临时表_sbtest_new里，完成之后原表改名为_sbtest_old老表，_sbtest_new临时表改为原表sbtest，最后删除_sbtest_old老表。过程如下：

Altering `test`.`sbtest`...
Creating new table...
Created new table test._sbtest_new OK.
Altering new table...
Altered `test`.`_sbtest_new` OK.
2016-12-06T12:15:30 Creating triggers...
2016-12-06T12:15:30 Created triggers OK.
2016-12-06T12:15:30 Copying approximately 1099152 rows...
2016-12-06T12:15:54 Copied rows OK.
2016-12-06T12:15:54 Analyzing new table...
2016-12-06T12:15:54 Swapping tables...
2016-12-06T12:15:54 Swapped original and new tables OK.
2016-12-06T12:15:54 Dropping old table...
2016-12-06T12:15:54 Dropped old table `test`.`_sbtest_old` OK.
2016-12-06T12:15:54 Dropping triggers...
2016-12-06T12:15:54 Dropped triggers OK.
Successfully altered `test`.`sbtest`.

3、基于binlog为ROW行的复制，触发器不会在slave从库上工作，这就导致了主从数据不一致。但基于binlog为statement语句的复制，触发器会在slave从库上工作。

With statement-based replication, triggers executed on the master also execute on the slave. With row-based replication, triggers executed on the master do not execute on the slave.

参考文献：http://dev.mysql.com/doc/refman/5.7/en/replication-features-triggers.html

注：在二进制日志里，MIXED默认还是采用STATEMENT格式记录的，但在下面这6种情况下会转化为ROW格式。

第一种情况：NDB引擎，表的DML操作增、删、改会以ROW格式记录。

第二种情况：SQL语句里包含了UUID()函数。

第三种情况：自增长字段被更新了。

第四种情况：包含了INSERT DELAYED语句。

第五种情况：使用了用户定义函数（UDF）

第六种情况：使用了临时表。

参考文献：https://dev.mysql.com/doc/refman/5.7/en/binary-log-mixed.html

复现

1、主库创建t1表

 CREATE TABLE `t1` (
  `id` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

2、从库创建t2表并创建触发器

CREATE TABLE `t2` (
  `id` int(11) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8

触发器

DELIMITER $$
 
USE `test`$$
 
DROP TRIGGER IF EXISTS `t1_1`$$
 
CREATE
    TRIGGER `t1_1` AFTER INSERT ON `t1` 
    FOR EACH ROW BEGIN
    INSERT INTO t2(id) VALUES(NEW.id);
    END;
$$
 
DELIMITER ;

3、主库插入

insert into t1 values(1),(2),(3);
select * from t2;

此时t2表里没有任何数据，触发器没有工作。

结论

如果你使用pt-online-schema-change修改表结构在主库上运行，数据不一致的情况不会发生。但如果在从库上运行，且主库的binlog格式为ROW，那将是危险的。

时间： 2024-10-29 19:12:15

pt-online-schema-change你今天滥用了吗？的相关文章

案例 - percona-online-schema-change各种坑

线上环境复制使用ROW模式,对于上亿的表,使用pt online schema change 在把数据从旧表拷贝到临时表这步操作,会产生大量的binlog,这会导致主从延迟在pt工具包2.1之前,pt-online-schema-change是不会打印binlog的,如果要在主从上加索引,需要分别在主库执行一次,在从库执行一次它提供了一个--log-bin参数,并且默认是关闭binlog的 --bin-log Allow binary logging (SET SQL_LOG_BIN=1).

Replicate Schema Changes

Replication 能够将Article的Schema Change同步到Subscriber中,只需要将 Publication 的属性:Replicate Schema Changes 设置为Ture. 引用<Make Schema Changes on Publication Databases>: If you make the following schema changes to a published article, they are propagated, by defa

SQL Server 中WITH (NOLOCK)浅析

原文:SQL Server 中WITH (NOLOCK)浅析概念介绍开发人员喜欢在SQL脚本中使用WITH(NOLOCK), WITH(NOLOCK)其实是表提示(table_hint)中的一种.它等同于 READUNCOMMITTED . 具体的功能作用如下所示(摘自MSDN): 1: 指定允许脏读.不发布共享锁来阻止其他事务修改当前事务读取的数据,其他事务设置的排他锁不会阻碍当前事务读取锁定数据.允许脏读可能产生较多的并发操作,但其代价是读取以后会被其他事务回滚的数据修改.这可能会使您的

SQL Server 中WITH (NOLOCK)浅析(转潇湘隐者)

博文出处:http://www.cnblogs.com/kerrycode/p/3946268.html 概念介绍开发人员喜欢在SQL脚本中使用WITH(NOLOCK), WITH(NOLOCK)其实是表提示(table_hint)中的一种.它等同于 READUNCOMMITTED . 具体的功能作用如下所示(摘自MSDN): 1: 指定允许脏读.不发布共享锁来阻止其他事务修改当前事务读取的数据,其他事务设置的排他锁不会阻碍当前事务读取锁定数据.允许脏读可能产生较多的并发操作,但其代价是读取以

（转）SQL Server 中WITH (NOLOCK)浅析

概念介绍开发人员喜欢在SQL脚本中使用WITH(NOLOCK), WITH(NOLOCK)其实是表提示(table_hint)中的一种.它等同于 READUNCOMMITTED . 具体的功能作用如下所示(摘自MSDN): 1: 指定允许脏读.不发布共享锁来阻止其他事务修改当前事务读取的数据,其他事务设置的排他锁不会阻碍当前事务读取锁定数据.允许脏读可能产生较多的并发操作,但其代价是读取以后会被其他事务回滚的数据修改.这可能会使您的事务出错,向用户显示从未提交过的数据,或者导致用户两次看到记录

SQL Server 中WITH (NOLOCK)

facebook开源项目集合

Facebook的开源大手笔 1. 开源Facebook平台代码 Facebook在2008年选择将该平台上的重要部分的代码和应用工具开源.Facebook称,平台已经基本发展成熟,此举可以让开发者更全面地理解整个Facebook平台,更容易地为Facebook开发应用软件,并可以回报社区. 该项目代号为“FBOpen”,其中包含了实现Facebook平台的一些基础设施.功能等,如API架构.FQL分析器.FBML分析器.FBJS,以及许多常用方法和标签的实现,代码基于PHP.这意味着其他开发者

sqlserver 存储过程中使用临时表到底会不会导致重编译

曾经在网络上看到过,SqlServer的存储过程中使用临时表,会导致执行计划无法重用, 运行时候会导致重编译的这么一个说法,自己私底下去做测试的时候,根据profile的跟踪结果, 如果不是统计信息变更导致导致的重编译,单单是使用临时表,并不会导致重编译, 但是对于一些特殊的情况,又确实会出现重编译的, 为了弄清楚这个问题,查阅了大量的资料,才把这个问题弄清楚,这里特意记录下来,希望武断地认为存储过程中使用了临时表就会导致重编译的这个观点得到纠正. 首先进行下面的测试,我们知道,导致临时表重编译

Mac OS 10.10 php不能连接mysql问题解决

php连接数据库都没问题,升级到10.10这后, 突然连接不上了. 这个问题放了很久, 今天突然搜索到一篇文章. 用链接的方式解决了. 原文如下: So you installed Ubuntu, got all excited about developing your Rails application on it, and then- No such file or directory - /tmp/mysql.sock) No matter what you do, database c

MyCat 学习笔记第十一篇.数据分片之分片事务处理

1 环境说明 VM 模拟3台MYSQL 5.6 服务器 VM1 192.168.31.187:3307 VM2 192.168.31.212:3307 VM3 192.168.31.150: 3307 MYCAT 1.5 服务部署在宿主机上 MYCAT 192.168.31.207 :8806[SQL执行端口] / 9066[管理端口] 2 应用场景 2.0 MYCAT配置 schema.xml <schema name="TESTDB" checkSQLschema=&quo