hashmap底层实现原理

Z, ZLW 3年前 34568

hashmap底层实现原理是：HashMap是基于哈希表的Map接口的非同步实现。HashMap是一个存储key-value键值对的集合，每一个键值对也叫做entry，这些entry分散存储在一个数组中，这个数组也是HashMap的主干，这个数组每个元素的初始值都是null。HashMa是Java中最常用的集合类框架，也是Java语言中非常典型的数据结构，同时也是我们需要掌握的数据结构，更重要的是进大厂面试必问之一。

一、hashmap底层实现原理

HashMap是基于哈希表的Map接口的非同步实现。元素以键值对的形式存放，并且允许null键和null值，因为key值唯一（不能重复），因此，null键只有一个。另外，hashmap不保证元素存储的顺序，是一种无序的，和放入的顺序并不相同（此类不保证映射的顺序，特别是它不保证该顺序恒久不变）。HashMap是线程不安全的。

二、HashMap中的put()和get()的实现原理

map.put(k,v)实现原理：

首先将k,v封装到Node对象当中（节点）。
然后它的底层会调用K的hashCode()方法得出hash值。
通过哈希表函数/哈希算法，将hash值转换成数组的下标，下标位置上如果没有任何元素，就把Node添加到这个位置上。如果说下标对应的位置上有链表。此时，就会拿着k和链表上每个节点的k进行equal。如果所有的equals方法返回都是false，那么这个新的节点将被添加到链表的末尾。如其中有一个equals返回了true，那么这个节点的value将会被覆盖。

map.get(k)实现原理：

先调用k的hashCode()方法得出哈希值，并通过哈希算法转换成数组的下标。
通过上一步哈希算法转换成数组的下标之后，在通过数组下标快速定位到某个位置上。如果这个位置上什么都没有，则返回null。如果这个位置上有单向链表，那么它就会拿着K和单向链表上的每一个节点的K进行equals，如果所有equals方法都返回false，则get方法返回null。如果其中一个节点的K和参数K进行equals返回true，那么此时该节点的value就是我们要找的value了，get方法最终返回这个要找的value。

三、HashMap的数据存储结构

HashMap由数组（键值对entry组成的数组主干）+ 链表（元素太多时为解决哈希冲突数组的一个元素上多个entry组成的链表）+ 红黑树（当链表的元素个数达到8链表存储改为红黑树存储）进行数据的存储。

HashMap采用table数组存储Key-Value的，每一个键值对组成了一个Node节点（JDK1.7为Entry实体，因为jdk1.8加入了红黑树，所以改为Node）。Node节点实际上是一个单向的链表结构，它具有Next指针，可以连接下一个Node节点，以此来解决Hash冲突的问题。

四、HashMap的重要参数

HashMap 的实例有两个参数影响其性能：初始容量和加载因子。容量是哈希表中桶的数量，初始容量只是哈希表在创建时的容量。加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度。当哈希表中的条目数超出了加载因子与当前容量的乘积时，则要对该哈希表进行 rehash 操作（即重建内部数据结构），从而哈希表将具有大约两倍的桶数。在Java编程语言中，加载因子默认值为0.75，默认哈希表元为101。

五、数组+链表的数据结构

HashMap最基础的底层结构是一个数组。每一个数组元素（或称为桶）是一个链表或者红黑树，用于存储多个键值对。当两个不同的键通过哈希函数映射到同一索引上时，会在同一个链表中以节点形式存储。

六、负载因子和扩容机制

负载因子是一个用于衡量HashMap何时进行扩容的指标。当HashMap中的元素数量超过数组大小与负载因子的乘积时，会触发扩容操作。扩容意味着数组大小的增加以及所有现有元素的重新哈希。

七、数据插入与获取过程

数据插入和获取都依赖于哈希函数，该函数将键映射到数组的一个特定索引。插入操作时，如果目标索引处没有元素，则直接存储；如果有元素，则添加到链表或红黑树的末尾。获取操作通过键的哈希值快速找到对应的索引，然后在链表或红黑树中进行搜索。

八、Java与Python中的HashMap实现

在Java中，HashMap是一个广泛使用的数据结构，实现在java.util包内。Python中的字典（dict）与HashMap有类似的功能和实现机制，但具体细节略有不同。

常见问答：

Q1: 为什么 HashMap 不是线程安全的？

答：默认情况下，HashMap 的方法没有同步机制，所以在多线程环境下可能会出现数据不一致的问题。

Q2: 什么情况下会使用红黑树而不是链表？

答：当一个数组索引位置上的元素数量超过一定阈值时，链表会被转换为红黑树，以提高检索效率。

Q3: 负载因子是什么？它如何影响 HashMap 的性能？

答：负载因子是 HashMap 中元素数量与数组大小的比值。一个过高的负载因子会导致检索效率下降，而一个过低的负载因子会导致存储空间的浪费。

Q4: HashMap和HashTable有什么不同？

HashMap是非线程安全的，而HashTable是线程安全的。此外，HashMap允许键或值为null，而HashTable不允许。

Q5: 如何选择合适的负载因子？

一般来说，较低的负载因子会导致更多的空间浪费，而较高的负载因子可能会降低查询速度。默认的负载因子通常设置为0.75。

Q6: 链表和红黑树在HashMap中的应用有什么不同？

当一个桶中的元素数量超过一定阈值时，链表会转换为红黑树，以减少查找时间。红黑树提供了更高效的查找性能。

我来回复

暂无回复内容