redis集群为什么不用哈希 • Worktile社区

fiy

Worktile&PingCode市场小伙伴

Redis集群之所以不使用哈希算法的主要原因有以下几点：

哈希算法的负载均衡不够均匀：哈希算法将数据映射到不同的节点上，例如根据键的哈希值进行计算，然后选择相应的节点进行存储。但是，在实际使用中，由于哈希算法的特性，可能会出现数据倾斜的情况。即使在均匀分布的数据情况下，当节点数量发生变化时，哈希算法也很难保证分布的一致性。
增加、删除节点导致数据迁移的问题：当使用哈希算法进行数据分布时，在增加或删除节点时会导致大量的数据迁移。这会引起集群的不稳定和性能下降。因为数据迁移需要大量的网络带宽和节点计算资源，可能会影响系统的正常运行。
哈希算法无法支持故障转移：在Redis集群中，故障转移是非常重要的，因为节点的故障是难以避免的。而哈希算法没有内置的故障转移机制，一旦节点发生故障，需要手动处理数据迁移的问题。

相比之下，Redis集群采用了一种更加可靠和灵活的分片方式。Redis集群使用一致性哈希算法来确定数据在集群中的分布，但每个节点都存储了整个集群的信息。这样，当增加或删除节点时，可以通过重新计算虚拟槽位的映射关系来实现数据的迁移，而不会影响整个集群的稳定性。

总之，Redis集群不使用哈希算法的主要原因是为了解决哈希算法无法均衡负载、无法支持故障转移以及数据迁移的问题，保证集群的稳定性和可靠性。

2年前 0条评论

worktile

Worktile官方账号

Redis集群不使用哈希主要有以下几个原因：

哈希的不均衡性：在使用哈希的情况下，根据Key的哈希值进行分配，可能会出现某一台服务器负载过高的情况。原因是哈希算法本身可能存在不够均匀的问题，导致数据在集群中分布不均匀。这会导致一些节点的负载很重，而其他节点的负载很轻。
扩容和缩容问题：使用哈希进行分片后，当需要扩容或缩容时，如果重新计算哈希，很可能导致所有的数据都需要重新分片，这会导致大规模的数据迁移，增加了系统的复杂性和风险。
节点故障问题：在使用哈希进行分片时，当某一台节点故障时，可能会导致分配到该节点的大量数据不可用。这样就会影响整个集群的可用性。
数据倾斜问题：哈希算法在分布式系统中的另一个问题是数据倾斜。由于哈希算法是根据Key进行分片的，如果Key的分布不均匀，就会导致数据倾斜。一些Key的负载会很高，而其他Key的负载很低。
哈希冲突问题：在哈希算法中，由于哈希函数的有限性，可能会出现哈希冲突的情况。当不同的Key经过哈希计算后得到相同的哈希值时，就会导致数据分布不均衡，影响集群的性能。此外，在数据迁移过程中，哈希冲突可能会导致数据无法正确分配。

综上所述，Redis集群选择不使用哈希的原因是为了避免负载不均衡、数据倾斜、节点故障等问题，从而保证集群的稳定性和可靠性。相反，Redis集群采用槽位映射的方式来进行数据的分片和负载均衡，能够更好地解决上述问题。

2年前 0条评论

不及物动词

这个人很懒，什么都没有留下～

Redis集群的数据分片是通过哈希槽（hash slot）实现的，而不是通过哈希函数。

哈希函数将数据映射到特定的槽位，这种方法快速定位数据所在的槽位，查询和写入的性能非常高。但是这种方式在集群中无法应用，因为数据在不同的节点间需要进行迁移和复制。如果使用普通的哈希函数，那么在增加或减少节点时，整个数据集都需要重新分配，导致非常麻烦且耗时。

为了解决这个问题，Redis使用了一个称为哈希槽（hash slot）的方式进行数据分片。Redis将整个数据空间分为16384个槽位，并将每个槽位分配给集群的各个节点。每个节点负责管理一部分槽位的数据。

下面是Redis集群中数据分片的步骤：

当进行集群扩容或者缩容时，数据的迁移由Redis集群自动完成。例如，当添加一个新节点时，集群会自动将一部分槽位从现有节点迁移到新节点上，直到所有槽位都被分配到新的节点上。这样就实现了动态的负载均衡，避免了数据重新分片的麻烦。

总结一下，Redis集群不使用普通的哈希函数进行数据分片，而是使用了哈希槽的方式。这种方式可以保证在集群扩容或缩容时，数据的迁移和负载均衡更加高效和自动化。

2年前 0条评论