mysql分表方法:
方法一、 做数据库集群! 主从数据库 双向热备份(或一对多的数据库实时备份策略),这样可将数据库查询分摊到几个服务器去(可跟服务器负载均衡结合起来架构)
优点:扩展性好,没有多个分表后的复杂操作(php代码)
缺点:单个表的数据量还是没有变,一次操作所花的时间还是那么多,硬件开销大。
方法二、 根据特殊情况,按照特定规则分表:比如 用户聊天表,
message_00,message_01,message_02……….message_98,message_99.然后根据用户的ID来判断 这个用户的聊天信息放到哪张表里面,你可以用hash的方式来获得,可以用求余的方式来获得,方法很多,比如用hash的方法来获得表名:
function get_hash_table( $table , $userid ) { $str = crc32( $userid ); if ( $str <0){ $hash = ‘0‘ . substr ( abs ( $str ), 0, 1); } else { $hash = substr ( $str , 0, 2); } return $table . ‘_‘ . $hash ; } echo get_hash_table( ‘message‘ , ‘user18991‘ ); //结果为message_10 echo get_hash_table( ‘message‘ , ‘user34523‘ ); //结果为message_13
优点:避免一张表出现几百万条数据,缩短了一条sql的执行时间说明一下,上面的这个方法,告诉我们user18991这个用户的消息都记录在message_10这张表里,user34523这个用户的消息都记录在message_13这张表里,读取的时候,只要从各自的表中读取就行了
缺点:当一种规则确定时,打破这条规则会很麻烦,上面的例子中我用的hash算法是crc32,如果我现在不想用这个算法了,改用md5后,会使同一个用户的消息被存储到不同的表中,这样数据乱套了。扩展性很差。
方法三:利用merge存储引擎来实现分表
假如有一张用户表user,有50W条数据,现在要拆成二张表user1和user2,每张表25W条数据,
CREATE TABLE `test`.`user` ( `id` INT( 11 ) NOT NULL AUTO_INCREMENT PRIMARY KEY , `username` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `pwd` VARCHAR( 200 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `email` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ) ENGINE = MYISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; CREATE TABLE `test`.`user1` ( `id` INT( 11 ) NOT NULL AUTO_INCREMENT PRIMARY KEY , `username` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `pwd` VARCHAR( 200 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `email` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ) ENGINE = MYISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; CREATE TABLE `test`.`user2` ( `id` INT( 11 ) NOT NULL AUTO_INCREMENT PRIMARY KEY , `username` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `pwd` VARCHAR( 200 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `email` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ) ENGINE = MYISAM DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ; INSERT INTO `test`.`user` (`id`, `username`, `pwd`, `email`) VALUES (NULL, ‘user1‘ , ‘123‘ ,‘[email protected]‘ ); INSERT INTO `test`.`user` (`id`, `username`, `pwd`, `email`) VALUES (NULL, ‘user2‘ , ‘123‘ ,‘[email protected]‘ ); INSERT INTO `test`.`user` (`id`, `username`, `pwd`, `email`) VALUES (NULL, ‘user3‘ , ‘123‘ ,‘[email protected]‘ ); INSERT INTO `test`.`user` (`id`, `username`, `pwd`, `email`) VALUES (NULL, ‘user4‘ , ‘123‘ ,‘[email protected]‘ ); INSERT INTO user1(user1.id,user1.username,user1.pwd,user1.email) SELECT user.id,user.username,user.pwd,user.email FROM user where user.id >=2; INSERT INTO user2(user2.id,user2.username,user2.pwd,user2.email) SELECT user.id,user.username,user.pwd,user.email FROM user where user.id >2; DROP TABLE `user`; CREATE TABLE `test`.`user` ( `id` INT( 11 ) NOT NULL , `username` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `pwd` VARCHAR( 200 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , `email` VARCHAR( 300 ) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL , INDEX ( `id` ) ) ENGINE = MRG_MYISAM UNION=(user1,user2) INSERT_METHOD=LAST CHARSET=utf8 AUTO_INCREMENT=1 ; 测试: INSERT INTO `user` (`id`,`username`, `pwd`,`email`) VALUES(5, ‘user5‘ , ‘123‘ , ‘[email protected]‘ ); INSERT INTO `user` (`id`,`username`, `pwd`,`email`) VALUES(6, ‘user6‘ , ‘123‘ , ‘[email protected]‘ ); INSERT INTO `user` (`id`,`username`, `pwd`,`email`) VALUES(7, ‘user7‘ , ‘123‘ , ‘[email protected]‘ ); INSERT INTO `user` (`username`, `pwd`,`email`) VALUES( ‘user8‘ , ‘123‘ , ‘[email protected]‘ ); //这样的话 id居然是0 这个有点奇怪,如果解决不了,每次插入新数据,要加上last_id。。。。(php代码得改)
优点:扩展性好,并且php代码几乎不用改但如此分表要注意点东西:
1.不能将merge存储引擎变成其它存储引擎
2.执行一个 insert,数据进入第一个或者最后一个 myisam 表(取决于 insert_method 选项的值)。mysql确保唯一键值在那个 myisam 表里保持唯一,但不是跨集合里所有的表。
3. merge表 必须和分表的结构一模一样····
缺点:这种方法的效果比第二种要差一点
建议:具体情况具体分析,方法一、方法二、方法三综合使用。