HashMap加载因子为什么是0.75

发布时间：2021-10-28 17:57:39 作者：iii
来源：亿速云阅读：654

本篇内容主要讲解“HashMap加载因子为什么是0.75”，感兴趣的朋友不妨来看看。本文介绍的方法操作简单快捷，实用性强。下面就让小编来带大家学习“HashMap加载因子为什么是0.75”吧!

加载因子是哈希表在其容量自动增加之前可以达到多满的一种尺度，它衡量的是一个散列表的空间的使用程度，负载因子越大表示散列表的装填程度越高，反之愈小。

HashMap加载因子为什么是0.75

对于使用链表法的散列表来说，查找一个元素的平均时间是 O(1+a)。因此如果负载因子越大，对空间的利用更充分，然而后果是查找效率的降低;如果负载因子太小，那么散列表的数据将过于稀疏，对空间造成严重浪费。

如果你看过源代码，你会发现在初始条件下，HashMap 在时间和空间两者间折中选择了 0.75

/** * The load factor used when none specified in constructor. */  static final float DEFAULT_LOAD_FACTOR = 0.75f;

但是为什么一定是 0.75?而不是 0.8，0.6，这里有一个非常重要的概念：泊松分布。

相信大家都学过概率论，对这个大名鼎鼎的定律感觉应该是既熟悉又陌生。本篇文章的重点不是为大家普及概率论知识，这里就简单介绍下。

泊松分布是最重要的离散分布之一，它多出现在当X表示在一定的时间或空间内出现的事件个数这种场合。

HashMap加载因子为什么是0.75

举个简单的例子，假如你一个老板，新开张了一家酒店，这个时候应该如何准备一天所用的食材呢?

准备的太多，最后卖不掉这么多菜只能浪费扔掉;准备不够，又接不了生意。但是你有很多同行和朋友，他们会告诉你很多经验。

比如把一天分成几个时间段，上午、下午、晚上每个时间段大概会来多少个客人，每一桌大概会点几个菜。综合下来，就可以大致知道在一天的时间内，估计出需要准备的食材数量。

我们接下来看看 HashMap 源码注释的原话：

Ideally, under random hashCodes, the frequency of nodes in bins follows a Poisson distribution with a parameter of about 0.5 on average for the default resizing threshold of 0.75, although with a large variance because of resizing granularity. Ignoring variance, the expected occurrences of list size k are (exp(-0.5) * pow(0.5, k) /factorial(k)).

0: 0.60653066

1: 0.30326533

2: 0.07581633

3: 0.01263606

4: 0.00157952

5: 0.0001579

6: 0.00001316

7: 0.00000094

8: 0.00000006

more: less than 1 in ten million

翻译过来说的是，在理想情况下,使用随机哈希码，节点出现的频率在 hash 桶中遵循泊松分布。

对照桶中元素个数和概率的表，可以看到当用 0.75 作为加载因子时，桶中元素到达 8 个的时候，概率已经变得非常小，因此每个碰撞位置的链表长度超过 8 个是几乎不可能的，因此在链表节点到达 8 时才开始转化为红黑树。

到此，相信大家对“HashMap加载因子为什么是0.75”有了更深的了解，不妨来实际操作一番吧！这里是亿速云网站，更多相关内容可以进入相关频道进行查询，关注我们，继续学习！

HashMap加载因子为什么是0.75

相关阅读