数据库分库解决方案

当业务数据量非常大,单数据库无法支撑的时候,有可能是单库已经写满了,也可能数据库读写比较频繁,已经触碰到单库的io瓶颈了,这时就需要考虑分库。

下面聊一下该怎么分库,如何优化:

刚开始只有数据库A, 后来又加了数据库B。

假如数据表都是有时间戳字段,而且数据查询条件都带一个时间戳字段,这样我们可以根据数据创建的时间范围来分库,比如给数据库按年份命名db_2019, 到2020年新生成一个库db_2020, 在业务端进行数据读写操作时,先根据时间戳条件获取到年份,然后选择相应年份的数据库进行操作。

但上面这种方式只适合这种特定的业务场景,而且这种方式,可能旧数据很少读取,新数据会比较频繁读取,会导致不同数据库负载是不均匀的。所以会不会有更好的分片方式呢? 答案是肯定的。几乎任何一张表都会有键字段,假如键值是数字类型,可以键值与数据库数量取模的方式进行分片,比如键值是100,数据库数量是2, 那么100%2得到0,就应该存储到索引为0的数据库。假如键值是字符串呢,可以通过crc32(value)算出一个数字,然后再通过数字取模的方式得到相应的数据库。

假如在使用过程中,数据库又不够用了,需要再扩容,怎么办?

停服,根据新的分片逻辑进行数据迁移,起服上线新的分片逻辑。没毛病,假如业务允许停机一段时间, 这也是一种稳妥方式。假如业务不允许停机,或只允许停机很短的时间,这时该如何数据库扩容呢,或者说该如何平滑地进行数据库迁移而不影响业务呢?

可以通过下面步骤来

方案一:

  • 修改写数据库逻辑:对需要迁移的数据,进行双写(写原数据库和要迁往的数据库)
  • 写一个迁移脚本:从原数据库迁数据到目标数据库
  • 校验原数据库是否跟跟目标数据库数据一致(在迁移的瞬间可能发生了原数据库删除了数据,而目标数据库依然写入),删掉目标数据库多余的数据。
  • 修改数据库分片逻辑,去掉双写逻辑
  • 删掉各个数据库冗余的数据

若数据库双倍分库扩容有更好方案

方案二:

  • 原数据库和要迁往的数据库设计成双主同步
  • 修改数据库分片逻辑
  • 删掉各个数据库冗余的数据

后面找个时间再补充一些图表,以便读者能更直观得理解。

还有一些问题:

问题一:假如方案一中,进行双写的时候一个写成功,一个写失败,该如何处理?

问题二:分库后,如何分页查询数据?

后面会再写一篇较大篇幅的文章分析如何跨数据库分页查询数据。

原文地址:https://www.cnblogs.com/kingson-blog/p/12122211.html

时间: 2024-10-29 21:57:04

数据库分库解决方案的相关文章

关系型数据库分库分表解决方案

关系型数据库分库分表解决方案 关系型数据库单库或单表在数据达到一定量级后,单个节点的就会出现性能瓶颈.通常的做法就是考虑分库分表. 为什么要分? 分库降低了单点机器的负载:分表,提高了数据操作的效率,尤其是Write操作的效率. 如何分? 按号段分: (1) user_id为区分,1-1000的对应DB1,1001-2000的对应DB2,以此类推:优点:可部分迁移缺点:数据分布不均 (2)hash取模分: 对user_id进行hash(或者如果user_id是数值型的话直接使用user_id 的

高并发、高负载解决方案之----------数据库分库分表的应用场景及解决方案

数据库分库分表的应用场景及解决方案  现实业务场景中,为了保障客户体验并满足业务的线性增长.会对数据量巨大,且业务会始终进行的产品进行分表分库策略.但是如何合理的根据业务采取争取的分表分库策略至关重要.下面以具体实例来进行分析. • 场景一:用户中心,单key业务如何进行数据库切分 • 场景二:订单中心,多key业务如何进行数据库切分 场景一:用户中心数据库切分架构实践|场景介绍 用户中心是一个十分常见的业务系统,涵盖用户登录.注册.信息查询与修改等服务. 用户的核心元数据为: User(uid

170123、数据库分库分表策略的具体实现方案

相关文章: 1. 使用Spring AOP实现MySQL数据库读写分离案例分析 2.MySQL5.6 数据库主从(Master/Slave)同步安装与配置详解 :http://blog.csdn.net/xlgen157387/article/details/51331244 3.MySQL主从复制的常见拓扑.原理分析以及如何提高主从复制的效率总结 :http://blog.csdn.net/xlgen157387/article/details/52451613 4.使用mysqlreplic

数据库水平切分的原理探讨、设计思路--数据库分库,分表,集群,负载均衡器

本文转载:http://www.cnblogs.com/olartan/archive/2009/12/02/1615131.html 第1章  引言 数据量巨大时,首先把多表分算到不同的DB中,然后把数据根据关键列,分布到不同的数据库中.库分布以后,系统的查询,io等操作都可以有多个机器组成的群组共同完成了.本文主要就是针对,海量数据库,进行分库.分表.负载均衡原理,进行探讨,并提出解决方案. 随着互联网应用的广泛普及,海量数据的存储和访问成为了系统设计的瓶颈问题.对于一个大型的互联网应用,每

数据库分库分表

1. 数据库分库分表 1.1. 前言 1.1.1. 名词解释 1.2. 数据库架构演变 1.3. 分库分表前的问题 1.3.1. 用户请求量太大 1.3.2. 单库太大 1.3.3. 单表太大 1.4. 分库分表的方式方法 1.4.1. 垂直拆分 1.4.2. 水平拆分 1.5. 分库分表后面临的问题 1.5.1. 事务支持 1.5.2. 多库结果集合并(group by,order by) 1.5.3. 跨库join 1.6. 分库分表方案产品 1.7. 为什么不建议分库分表 1.8. 参考

数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示

本文原文连接: http://blog.csdn.net/bluishglc/article/details/7696085 ,转载请注明出处!本文着重介绍sharding切分策略,如果你对数据库sharding缺少基本的了解,请参考我另一篇从基础理论全面介绍sharding的文章:数据库Sharding的基本思想和切分策略 第一部分:实施策略 图1.数据库分库分表(sharding)实施策略图解(点击查看大图) 1.准备阶段 对数据库进行分库分表(Sharding化)前,需要开发人员充分了解系

16、MySQL数据库分库分表备份脚本

MySQL数据库分库分表备份脚本 ===================学员分享分库分表========================== 脚本单双引号的区别: 单引号是强引用,强制输出是所见即所得. 双引号是解析变量 和 多个字符串.数字等连接一个字符串 条件1  ||    条件2                      或   假真   真假 条件1 && 条件2                      并   真真    假假 !条件1  && 条件2    

数据库分库分表(sharding)

第一部分:实施策略 图1.数据库分库分表(sharding)实施策略图解(点击查看大图) 1.准备阶段 对数据库进行分库分表(Sharding化)前,需要开发人员充分了解系统业务逻辑和数据库schema.一个好的建议是绘制一张数据库ER图或领域模型图,以这类图为基础划分shard,直观易行,可以确保开发人员始终保持清醒思路.对于是选择数据库ER图还是领域模型图要根据项目自身情况进行选择.如果项目使用数据驱动的开发方式,团队以数据库ER图作为业务交流的基础,则自然会选择数据库ER图,如果项目使用的

转数据库分库分表(sharding)系列(二) 全局主键生成策略

本文将主要介绍一些常见的全局主键生成策略,然后重点介绍flickr使用的一种非常优秀的全局主键生成方案.关于分库分表(sharding)的拆分策略和实施细则,请参考该系列的前一篇文章:数据库分库分表(sharding)系列(一) 拆分实施策略和示例演示 本文原文连接: http://blog.csdn.net/bluishglc/article/details/7710738 ,转载请注明出处! 第一部分:一些常见的主键生成策略 一旦数据库被切分到多个物理结点上,我们将不能再依赖数据库自身的主键