分库分表-首次上线-老数据-数据迁移

为什么要分库分表，分库分表的实践请看之前的文章：微服务-分库分表思路

分库分表之前我们首先要选出分片字段、然后根据一定的分片算法将数据写入不同的库表，查询数据的时候根据分片字段+分片算法从对应的库表中拿取数据即可

因此，由单独进行横向拆分后需要将老数据按照我们定义的，分片字段和分片算法重新洗数据，那么我们本节主要讲解3中方法：停机数据迁移、新老库双写、写老库通过binlog同步新库

实践思路：

优点：

缺点：

题外话：最后一步一定要做数据校验，如果停服务的话一般校验数据总条数即可，如果同步过程中出现错误，一定要记录，否则数据矫正略麻烦；如果真的出现数据不一致的情况，提供一直校验思路：

同样的查询条件分表查询新老库，分别MD5，然后做对比

上一种为什么要停服务：就是怕在迁移过程中，有数据修改出现数据不一致的情况，那么为了解决数据不一致的情况我们可以在迁移过程中写的数据，同时写入新老库

流程解释：

新建线上新库（按照分片键+分片算法新建）
修改源码，将之前代码新增、修改、删除的地方都修改成同时写新老库
1. 写入数据库中间件之前先判断新库中是否有此次操作的数据
2. 新增操作：如果新库无数据：直接新增，如果有数据：直接丢弃
3. 修改操作：如果新库有数据：确保新数据覆盖旧数据，如果无数据：直接丢弃
4. 删除操作：如果新库有数据：直接删除，如果无数据：直接丢弃
启动后台数据迁移程序
1. 查询老库，查出数据后通过新库规则查询新库，如果无数据直接写入，如果有数据比较时间戳，确保新数据覆盖旧数据，如果是老数据想覆盖新数据，直接丢弃
数据迁移完毕后，进行数据校验
修改源码，将之前同时写新老库的地方全部改成只写新库
经过一段时间，无异常后下掉老库和迁移工具

优点：