4种常见的缓存问题及解决方案详解

前言

使用缓存可以缓解大流量压力，显著提高程序的性能。我们在使用缓存系统时，尤其是大并发情况下，经常会遇到一些“疑难杂症”。本文总结了一些使用缓存时常见的问题及解决方案，以后在遇到这类问题时可以作为参考，在设计缓存系统的时候也应该考虑这些常见的情况。

为了表述方便，本文以数据库查询缓存为例，使用缓存可以减小对数据库的压力。

缓存穿透

我们在使用缓存时，往往先尝试去缓存中取值，如果没有，再去数据库取值，如果数据库也没有值，则根据业务需求，返回空或者抛异常。

如果用户一直访问一个数据库不存在的数据，比如id为-1的数据，就会导致每次请求都会先去缓存查一次，然后再去数据库查一次，造成严重的性能问题。这种情况就叫缓存穿透。

解决方案

以下几种解决方案：

对请求参数做校验，比如用户鉴权校验，id做基础校验，id <= 0的直接拦截。
如果查询到数据库没有值，也将对应的key存进缓存中，value为null。这样下次查询就直接从缓存返回了。但这里的key的缓存时间应该比较短，比如30s。防止后面在数据库插入了这条数据，而用户获取不到。
使用布隆过滤器，判断一个key是否已经查过了，如果已经查过了，就不去数据库查询。

缓存击穿

缓存击穿指的是，一个key的访问量非常大，比如某秒杀活动，有1w/s的并发量。这个key在某一时刻过期，那这些大量的请求就会一瞬间到数据库，数据库可能会直接崩溃。

解决方案

缓存击穿的解决方案也有几种，可以配合使用：

对于热点数据，慎重考虑过期时间，确保热点期间key不会过期，甚至有些可以设置永不过期。
使用互斥锁（比如Java的多线程锁机制），第一个线程访问key的时候就锁住，等查询数据库返回后，把值插入到缓存后再释放锁，这样后面的请求就可以直接取缓存里面的数据了。

缓存雪崩

缓存雪崩指的是，在某一时刻，多个key失效。这样就会有大量的请求从缓存中获取不到值，全部到数据库。还有另一种情况，就是缓存服务器宕机，也算做缓存雪崩。

解决方案

针对上述两种情况，缓存雪崩有两种解决方案：

双写不一致

在使用数据库缓存的时候，读和写的流程往往是这样的：

所谓双写不一致，就是在发生写操作（更新）的时候或写操作之后，可能会存在数据库里面的值和缓存中的值不同的情况。

为什么更新的时候要先删除缓存，再更新数据库？因为如果先更新数据库，然后在删除缓存的时候失败了，就会造成缓存里面的值和数据库的值不一致。

然而这样并不能完全避免双写不一致问题。假设在大并发情景下，一个线程先删除缓存，然后取更新数据库，这个时候另一个线程去取缓存，发现没有值，于是去读数据库，然后把数据库旧的值设置进缓存。等第一个线程更新完数据库后，数据库里面就是新的值，而缓存里面是旧的值，所以就存在了数据不一致的问题。

一个比较简单的解决办法是把过期时间设置得比较低，这样就只有在缓存没过期之前存在数据不一致问题，在一些业务场景下也还能接受。

另一种解决方案是使用队列辅助。先更新数据库，再删除缓存。如果删除失败，就放进队列。然后另一个任务从队列中取出消息，不断去重试删除相应的key。

还有一种解决方案是使用对一个数据使用一个队列，使读写操作串行化。比如对id为n的数据建立一个队列。对这条数据的写操作，删除缓存后，放进一个队列；然后另一个线程过来了，发现没有缓存，则把这个读操作也放进这个队列里面。

不过这样会增加程序的复杂性，串行化也会降低程序的吞吐量，可能得不偿失。一般主流的解决方案还是先删除缓存，再更新数据库。可以满足绝大部分需求。

最后

欢迎大家关注我的公众号【程序员追风】，文章都会在里面更新，整理的资料也会放在里面。

原文地址：https://www.cnblogs.com/zhuifeng523/p/11721917.html

时间： 2024-10-13 23:32:30

ELK+Filebeat 集中式日志解决方案详解