性能设计-缓存
分布式系统或者微服务中最耗性能的地方,就是最后端的数据库。
一般来说,只要小心维护好数据库的四种操作中的三个写操作insert、update和delete,就不太会出现性能问题。
insert一般不会有性能问题,update和delete一般也会有主见,不会太慢。
除非是索引太多,数据库里的数据也太多,这三个操作才会变慢。
绝大多数情况下,select 是出现性能问题最大的地方。
一方面,select 会有很多像 join、group、order、like 等这样丰富的语义,而这些语义是非常耗性能的;
另一方面,大多数应用都是读多写少,所以加剧了慢查询的问题。
分布式系统中远程调用也会消耗很多资源,因为网络开销会导致整体的响应时间下降。
为了挽救这样的性能开销,在业务允许的情况(不需要太实时的数据)下,使用缓存是非常必要的事情。
但缓存技术如何选型,redis还是memcached还是自定义,则需要根据业务场景和具体的架构配套选择。
比如笔者最近参与的一个信贷上云项目,就没有用到redis,而是自己实现了一个简易的jvm本地缓存。
原因在于该银行的技术委员会要求,redis挂了的话,业务要完全不受影响,也就是所谓的退化方案。
开发组开发完本地缓存后,经过性能测试和压力测试,发现完全满足需求。
与其在redis挂了后退化到本地缓存,还不如直接使用本地缓存,因此,redis就被弃用了。
另外,金融系统一般首要考虑的是其正确性和安全性,其次才会考虑性能问题。
因此,这样的方案,看上去是合理的。
Cache Aside 更新模式
这是最常用的设计模式了,其具体逻辑如下。
失效:应用程序先从 Cache 取数据,如果没有得到,则从数据库中取数据,成功后,放到缓存中。
命中:应用程序从 Cache 中取数据,取到后返回。
更新:先把数据存到数据库中,成功后,再让缓存失效。
这是标准的设计模式,包括 Facebook 的论文《Scaling Memcache at Facebook》中也使用了这个策略。
为什么不是写完数据库后更新缓存?主要是怕两个并发的写操作导致脏数据。