你可知HashMap为什么是线程不安全的

2022-10-22,,,,

 

 

hashmap线程不安全

hashmap 的线程不安全主要体现在下面两个方面

  • 在 jdk 1.7 中,当并发执行扩容操作时会造成环形链和数据丢失的情况
  • 在 jdk 1.8 中,在并发执行 put 操作时会发生数据覆盖的情况

对于 jdk 1.7 中 hashmap 的线程不安全,暂且不谈了,我们主要看看 jdk 1.8 中的

hashmap 中的 put() 方法

该 put() 方法是 jdk 1.8 中的

public v put(k key, v value) {
	return putval(hash(key), key, value, false, true);
}

final v putval(int hash, k key, v value, boolean onlyifabsent,
                   boolean evict) {
    node<k,v>[] tab; node<k,v> p; int n, i;
    // 判断 table[] 是否为空,如果是空的就创建一个 table[],并获取他的长度n
    if ((tab = table) == null || (n = tab.length) == 0)
    	n = (tab = resize()).length;	
    // 如果单链表节点 node<k,v> p == tab[i = (n - 1) & hash]) == null,
    // 就直接 put 进单链表中,说明此时并没有发生 hash 冲突
    if ((p = tab[i = (n - 1) & hash]) == null)
    	tab[i] = newnode(hash, key, value, null);
    else {
		// 说明索引位置已经放入过数据了,已经在单链表处产生了hash冲突
        node<k,v> e; k k;
		// 判断 put 的数据和之前的数据是否重复
        if (p.hash == hash &&
            // 进行 key 的 hash 值和 key 的 equals() 和 == 比较,如果都相等,则初始化数组 node<k,v> e
            ((k = p.key) == key || (key != null && key.equals(k))))   			
            e = p;
		// 判断是否是红黑树,如果是红黑树就直接插入树中
        else if (p instanceof treenode)
        	e = ((treenode<k,v>)p).puttreeval(this, tab, hash, key, value);
        else {
			// 如果不是红黑树,就遍历每个节点,判断单链表长度是否大于等于 7,
			// 如果单链表长度大于等于 7,数组的长度小于 64 时,会优先选择扩容
			// 如果单链表长度大于等于 7,数组的长度大于 64 时,才会选择单链表--->红黑树
            for (int bincount = 0; ; ++bincount) {
            	if ((e = p.next) == null) {
            		// 采用尾插法,在单链表中插入数据
                	p.next = newnode(hash, key, value, null);
                	// 如果 bincount >= 8 - 1
                    if (bincount >= treeify_threshold - 1) 
                    	treeifybin(tab, hash);
                        break;
                }
				// 判断索引每个元素的key是否可要插入的key相同,如果相同就直接覆盖
                if (e.hash == hash &&
					((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                 p = e;
			}
		}
		// 说明数组或者单链表中有相同的key,因此只需要将value覆盖,并将oldvalue返回即可
        if (e != null) { 
        	v oldvalue = e.value;
            if (!onlyifabsent || oldvalue == null)
            	e.value = value;
                afternodeaccess(e);
              	return oldvalue;
        }
	}
	// 说明没有key相同,因此要插入一个key-value,并记录内部结构变化次数
    ++modcount;
    // 判断是否扩容
    if (++size > threshold)
    	resize();
    afternodeinsertion(evict);
    return null;
}

数据的覆盖一

第 13 行代码是判断是否出现 hash 冲突的,假设两个线程 a、b 都在进行 put 操作,并且它们 put 数据的 key 的 hash 值是相同的,同时它们 keya == keyb 为 true 或者 keya.equals(keyb) 为 true,也就是说它们 put 数据的 value 是不相同的

当线程 a 执行完第 13 行代码后由于时间片耗尽导致被挂起,而线程 b 得到时间片后在该单链表处插入了元素,完成了正常的插入

然后线程 a 获得时间片,由于之前已经进行了 hash 冲突的判断,所有此时不会再进行判断,而是直接进行插入覆盖,这就导致了线程 b 插入的数据被线程 a 覆盖了,从而发生了线程不安全

数据的覆盖二

第 58 行处有个 ++size,我们这样想,还是线程 a、b,这两个线程同时进行 put 操作时,假设当前 hashmap 的 size 大小为 10

当线程 a 执行到第 58 行代码时,从主内存中获得 size 的值为 10 后准备进行 +1 操作,但是由于时间片耗尽只好让出 cpu

于是线程 b 得到 cpu 调度,还是从主内存中拿到 size 的值 10 进行 +1 操作,完成了 put 操作,并将 size = 11 写回了主内存

然后线程 a 再次得到 cpu 调度,并继续执行(此时 size 的值仍为10),当执行完 put 操作后,还是将 size = 11 写了回内存。

此时,线程 a、b 都执行了一次 put 操作,但是 size 的值只增加了 1,所有说还是由于数据覆盖又导致了线程不安全

// hashmap 中 size 变量
transient int size;

以上为个人经验,希望能给大家一个参考,也希望大家多多支持。

《你可知HashMap为什么是线程不安全的.doc》

下载本文的Word格式文档,以方便收藏与打印。