b站离线缓存删了还能找回来吗（b站卸载后缓存不见了怎么找回） - 原点资讯

缺点

问题关键

上面的方案的主要的问题在于，路由元数据的压缩不够明显，每条记录的元数据都进行了存储。常识告诉我们，计算和存储之间可以进行转换，即通过计算来降低存储空间。

改进方案

b站离线缓存删了还能找回来吗,b站卸载后缓存不见了怎么找回(9)

新写入过程

优点

对存储层的影响

假设水平扩容的实现过程如下：

写入流程如下：

data表schema更新

为了便于迁移属于同一个shard的所有数据(快速扫描出来，该shard的所有数据)，存储层表的schema更新如下(新增shard_id字段)：

block_idvalueshard_idblockID实际数据shardID

迁移数据时，根据shard_id字段进行过滤即可。至此，Day4工作完成，今天我们完成了数据层的sharding过程，并为水平扩容打下了基础。

Day5

到目前后端的数据均存在MySQL中，MySQL的好处在于稳定易用，但是功能过于复杂，性能也不能满足要求。今天我们对MySQL进行替换。

数据存储节点语义

根据这些需求，可以将存储节点进行如下两种设计：

b站离线缓存删了还能找回来吗,b站卸载后缓存不见了怎么找回(10)

存储节点设计简介

方案对比

方案1

请求进入RPC层之后，根据shardid 进行分发，获取到对应的shard实例(句柄)
shard使用key和value操作engine层
一个节点(或者一块磁盘)公用一个engine，使用shardID作为key前缀，用于区分不同的shard(在迁移的时候，可以使用shardID为前缀扫描属于该shard的所有的key和value)

方案2

引擎的实现

今天我们直接使用RocksDB作为我们的单机引擎，不做其他优化。

新架构

b站离线缓存删了还能找回来吗,b站卸载后缓存不见了怎么找回(11)

数据存储节点替换了原有的MySQL服务，今天的目标达成，收工。

Day6

前面几天已经实现了数据存储层的sharding。但是sharding只能解决水平扩展问题，容灾仍然有问题。今天我们对数据存储集群的资源重新进行整理。

引入资源池和可用区(故障隔离域)的概念。同一个资源池内的机型同构(简化资源调度逻辑，比如相同的磁盘数量和磁盘大小)。不同的业务可以使用不同的资源池，做到存储层资源隔离。
将不同交换机下的节点定义为不同的可用区(故障隔离域)。可用区之间实现交换机级别的隔离。
每个存储集群由一个或者多个资源池组成。资源池之间IO隔离，资源池内部机型同构。
每个资源池内部，由多个可用区组成。每个可用区由若干台服务器(存储节点)组成。
修改路由表中shard到IP的映射关系。
一个shard对应到多个Replica(比如3副本)
路由表中存放每个Replica所在存储节点的地址信息。
一个shard对应的Replica被放置于不同的可用区中(比如3个Replica放在不同的可用区)。
3副本模式的时候，任何一个交换机下的节点宕机，都不会影响读写操作。

新架构

下图为一个资源池 4可用区的模式，每个shard拥有3个副本(Replica)。