数据库分库分表漫谈

背景

随着公司业务增长，关系型数据库表慢慢会增长到很大的量，如果不能清理数据的话就需要面对大表CRUD，这是公司成长过程的共同考验

解决方案

根据我的个人经验，目前主要有3种比较主流的方法

分表。分库不常见，比较多的是分表。分表又分为2种：
- 垂直分表：将表的字段拆分到新表，常用字段留下，少用字段做关联查询。属于冷热分离
- 水平分表：将表复制多份，结构一致，表名用某种规则分开。这种比较复杂，需要中间件或server端来处理
- 冷热分表：将比较新的常用的数据留下，将历史数据归档到历史表。如果查不到数据，再去历史表retrieve
使用NoSQL替代，特别是支持集群和sharding的如mongodb，cassandra等。它们原生地支持分布式查询
比较新潮，使用阿里oceanbase，相当于MySQL on NoSQL，支持分布式存储和查询的MySQL

可以购买相关技术书籍，或者关注这方面专家如阿里巴巴沈询等人的微博等，更深入了解分布式存储思想

分表中间件

网上五花八门的介绍文章很多，可以自行搜索。个人认为，评价一个分布式中间件的标准应该是：

对server端无侵入，不需要改写sql，无需判断routing。将所有表都当成单表来操作
对数据分析无侵入，无论是产品方还是分析师，都可以用某种工具，将所有表当成单表来操作
充分支持sql标准，如分布式的group by，sort by等，没有或很少限制

当然，对程序无影响的代价就是对运维有压力，但这也是标准的一部分：

配置简单，能够集中配置
容忍部分节点宕机，部分查询失效不至于全不可用

个人推荐

需要我推荐吗？我的答案是，无法推荐。因为我没有这方面的实际经验。

不负责任地瞎yy的话，大概是楼方鑫的oneProxy，或者美团的MTDDL吧

时间： 2024-10-12 05:17:42

数据库分库分表漫谈的相关文章

数据库分库分表

1. 数据库分库分表 1.1. 前言 1.1.1. 名词解释 1.2. 数据库架构演变 1.3. 分库分表前的问题 1.3.1. 用户请求量太大 1.3.2. 单库太大 1.3.3. 单表太大 1.4. 分库分表的方式方法 1.4.1. 垂直拆分 1.4.2. 水平拆分 1.5. 分库分表后面临的问题 1.5.1. 事务支持 1.5.2. 多库结果集合并(group by,order by) 1.5.3. 跨库join 1.6. 分库分表方案产品 1.7. 为什么不建议分库分表 1.8. 参考

关系型数据库分库分表解决方案

关系型数据库分库分表解决方案关系型数据库单库或单表在数据达到一定量级后,单个节点的就会出现性能瓶颈.通常的做法就是考虑分库分表. 为什么要分? 分库降低了单点机器的负载:分表,提高了数据操作的效率,尤其是Write操作的效率. 如何分? 按号段分: (1) user_id为区分,1-1000的对应DB1,1001-2000的对应DB2,以此类推:优点:可部分迁移缺点:数据分布不均 (2)hash取模分: 对user_id进行hash(或者如果user_id是数值型的话直接使用user_id 的

数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示

本文原文连接: http://blog.csdn.net/bluishglc/article/details/7696085 ,转载请注明出处!本文着重介绍sharding切分策略,如果你对数据库sharding缺少基本的了解,请参考我另一篇从基础理论全面介绍sharding的文章:数据库Sharding的基本思想和切分策略第一部分:实施策略图1.数据库分库分表(sharding)实施策略图解(点击查看大图) 1.准备阶段对数据库进行分库分表(Sharding化)前,需要开发人员充分了解系

16、MySQL数据库分库分表备份脚本

MySQL数据库分库分表备份脚本 ===================学员分享分库分表========================== 脚本单双引号的区别: 单引号是强引用,强制输出是所见即所得. 双引号是解析变量和多个字符串.数字等连接一个字符串条件1 || 条件2 或假真真假条件1 && 条件2 并真真假假 !条件1 && 条件2

数据库分库分表(sharding)

第一部分:实施策略图1.数据库分库分表(sharding)实施策略图解(点击查看大图) 1.准备阶段对数据库进行分库分表(Sharding化)前,需要开发人员充分了解系统业务逻辑和数据库schema.一个好的建议是绘制一张数据库ER图或领域模型图,以这类图为基础划分shard,直观易行,可以确保开发人员始终保持清醒思路.对于是选择数据库ER图还是领域模型图要根据项目自身情况进行选择.如果项目使用数据驱动的开发方式,团队以数据库ER图作为业务交流的基础,则自然会选择数据库ER图,如果项目使用的

转数据库分库分表(sharding)系列(二) 全局主键生成策略

本文将主要介绍一些常见的全局主键生成策略,然后重点介绍flickr使用的一种非常优秀的全局主键生成方案.关于分库分表(sharding)的拆分策略和实施细则,请参考该系列的前一篇文章:数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示本文原文连接: http://blog.csdn.net/bluishglc/article/details/7710738 ,转载请注明出处! 第一部分:一些常见的主键生成策略一旦数据库被切分到多个物理结点上,我们将不能再依赖数据库自身的主键

数据库分库分表(sharding)系列(三) 关于使用框架还是自主开发以及sharding实现层面的考量

当团队对系统业务和数据库进行了细致的梳理,确定了切分方案后,接下来的问题就是如何去实现切分方案了,目前在sharding方面有不少的开源框架和产品可供参考,同时很多团队也会选择自主开发实现,而不管是选择框架还是自主开发,都会面临一个在哪一层上实现sharding逻辑的问题,本文会对这一系列的问题逐一进行分析和考量.本文原文连接: http://blog.csdn.net/bluishglc/article/details/7766508转载请注明出处! 一.sharding逻辑的实现层面从

数据库分库分表(sharding)系列

数据库分库分表(sharding)系列目录; (一) 拆分实施策略和示例演示 (二) 全局主键生成策略 (三) 关于使用框架还是自主开发以及sharding实现层面的考量 (四) 多数据源的事务处理 (五) 一种支持自由规划无须数据迁移和修改路由代码的Sharding扩容方案 (一) 拆分实施策略和示例演示第一部分:实施策略图1.数据库分库分表(sharding)实施策略图解 1.准备阶段对数据库进行分库分表(Sharding化)前,需要开发人员充分了解系统业务逻辑和数据库sch