老司机 总结的 分库分表最佳实践
点击上方蓝色字体,选择“标星公众号”
优质文章,第一时间送达
何时分库分表
如何分库分表
设置合适的分片数量
满足当前数据平均后的数据量在一个合理的范围(<=100w) 预估未来5年的数据量发展情况,数据量在一个合理的范围(500w左右,有合理的归档备份机制)
选择合适的分片字段
字段类型常规 字段不易过多 字段应该是业务场景大多数都会被使用的
设计合理的分片规则
规则计算高效,逻辑清晰 规则计算后,分片数据均匀 方便后续扩容分片
分片字段本身就是随机均匀的,可以直接使用 分片字段随机,但不均匀,如对总分片取模后,会导致数据不均匀,建议先对分片字段进行2次随机处理(如:zebra提供的:md5/crc32 方法)
如果是按照时间或数值范围进行分片,只需要创建分片库表,修改分片规则,立即生效 如果是hash分片,条件允许可考虑停服迁移,停止服务,将数据按新分片规则进行迁移,修改分片规则,启动服务 某些情况下可考虑升级从库,如2分库扩容为4分库,可将从库升级为主库并修改分片规则,后续可将冗余的数据进行清除并补上缺失的从库。 数据库双写,同时按新老分片规则写入两套物理表,并逐渐下线老数据模型,可参考-新老迁移参考
SQL使用注意
能带分片字段的就尽量把其带上 尽量不使用范围查询 无分片使用limit时不要查询太靠后的数据 尽量不要使用复杂的sql sql写法尽量规范
新老迁移方案参考
数据库双写(事务成功以老模型为准),查询走老模型。 每日job数据对账,并将差异补平。 通过job导历史数据。
历史数据导入完毕并且数据对账无误。 依然是数据库双写,但是事务成功与否以新模型为准,在线查询切新模型。 每日job数据对账,将差异补平。
老模型不再同步写入,异步补齐(同步数据终态)。 此阶段只有离线数据依然依赖老的模型,并且下游的依赖非常多,待改造完就可以完全废除老模型了。
作者 | 有梦想的老王
来源 | cnblogs.com/whgk/p/15251270.html
评论