为何HashSet中使用PRESENT而不是null作为value

1. 为什么 hashset 中使用 present 而不是 null 作为 value

无意之中碰到了这个问题，在此记录一下

1.1. present 是个什么玩意

hashset 的部分源码如下

public class hashset<e> extends abstractset<e> implements set<e>, cloneable, java.io.serializable {
    
    static final long serialversionuid = -5024744406713321676l;
    private transient hashmap<e,object> map;
    // dummy value to associate with an object in the backing map
    private static final object present = new object();
}

1.2. hashset 的构造方法

// 默认构造函数 底层创建一个hashmap
public hashset() {
    // 调用hashmap的默认构造函数，创建map
    map = new hashmap<e,object>();
}
 
// 带集合的构造函数
public hashset(collection<? extends e> c) {
    // 创建map。
    map = new hashmap<e,object>(math.max((int) (c.size()/.75f) + 1, 16));
    // 将集合(c)中的全部元素添加到hashset中
    addall(c);
}
 
// 指定hashset初始容量和加载因子的构造函数
public hashset(int initialcapacity, float loadfactor) {
    map = new hashmap<e,object>(initialcapacity, loadfactor);
}
 
// 指定hashset初始容量的构造函数
public hashset(int initialcapacity) {
    map = new hashmap<e,object>(initialcapacity);
}
 
hashset(int initialcapacity, float loadfactor, boolean dummy) {
    map = new linkedhashmap<e,object>(initialcapacity, loadfactor);
}

1.3. present 何时会被用到

add(e) 方法
remove(object) 方法

1.3.1. hashset 中的 add(e) 方法

/**
 * add(e) 方法返回 null 时，表示 hashset 添加数据成功
 *
 * @return true 如果不包含该元素
 */
public boolean add(e e) {
    return map.put(e, present)==null;
}

直接调用的是 hashmap 的 put(k, v) 方法，此时传入的 value 值是 present

public v put(k key, v value) {
	return putval(hash(key), key, value, false, true);
}
final v putval(int hash, k key, v value, boolean onlyifabsent,
                   boolean evict) {
    // tab表示 node<k,v>类型的数组，p表示某一个具体的单链表 node<k,v> 节点               
    node<k,v>[] tab; node<k,v> p; int n, i;
    // 判断 table[] 是否为空，如果是空的就创建一个 table[]，并获取他的长度n
    if ((tab = table) == null || (n = tab.length) == 0)
    	n = (tab = resize()).length;	
    // tab[i = (n - 1) & hash] 表示数组中的某一个具体位置的数据	
    // 如果单链表 node<k,v> p == tab[i = (n - 1) & hash]) == null，
    // 就直接 put 进单链表中，说明此时并没有发生 hash 冲突
    if ((p = tab[i = (n - 1) & hash]) == null)
    	tab[i] = newnode(hash, key, value, null);
    else {
		// 说明索引位置已经放入过数据了，已经在单链表处产生了hash冲突
        node<k,v> e; k k;
		// 判断 put 的数据和之前的数据是否重复
        if (p.hash == hash &&
            // 进行 key 的 hash 值和 key 的 equals() 和 == 比较，如果都相等，则初始化数组 node<k,v> e
            ((k = p.key) == key || (key != null && key.equals(k))))   			
            e = p;
		// 判断是否是红黑树，如果是红黑树就直接插入树中
        else if (p instanceof treenode)
        	e = ((treenode<k,v>)p).puttreeval(this, tab, hash, key, value);
        else {
			// 如果不是红黑树，就遍历每个节点，判断单链表长度是否大于等于 7，
			// 如果单链表长度大于等于 7，数组的长度小于 64 时，会优先选择扩容
			// 如果单链表长度大于等于 7，数组的长度大于 64 时，才会选择单链表--->红黑树
            for (int bincount = 0; ; ++bincount) {
            	if ((e = p.next) == null) {
            		// 采用尾插法，在单链表中插入数据
                	p.next = newnode(hash, key, value, null);
                	// 如果 bincount >= 8 - 1
                    if (bincount >= treeify_threshold - 1) 
                    	treeifybin(tab, hash);
                        break;
                }
				// 判断索引每个元素的key是否可要插入的key相同，如果相同就直接覆盖
                if (e.hash == hash &&
					((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                 p = e;
			}
		}		
        if (e != null) { 
        	// 此时说明 key 的 hash 值和 key 的 equals() 和 == 比较结果都相等
        	// 说明数组或者单链表中有完全相同的 key
        	// 因此只需要将value覆盖，并将oldvalue返回即可
        	v oldvalue = e.value;
            if (!onlyifabsent || oldvalue == null)
            	e.value = value;
                afternodeaccess(e);
              	return oldvalue;
        }
	}
	// 说明没有key相同，因此要插入一个key-value，并记录内部结构变化次数
    ++modcount;
    // 判断是否扩容
    if (++size > threshold)
    	resize();
    afternodeinsertion(evict);
    return null;
}

关于 hashmap 的 put(k, v) 方法的

如果 return oldvalue 说明发生了 value 覆盖，也就是说此时返回了 present，自然而然 hashmap 添加数据失败
如果 return null 说明 hashmap 添加数据成功

而如果将 present 替换为 null 作为 value 值，那么 hashset 的 add(e) 方法将无法判断添加元素的成功与失败；因为不管是成功与失败都会返回结果 null

1.3.2. hashmap 进行 put 元素示例

1.3.3. hashset 中的 remove(object) 方法

hashset 的 remove(object) 方法源码

public boolean remove(object o) {
    return map.remove(o)==present;
}

hashset 的 remove(object) 依旧直接使用 hashmap 的 remove(object) 方法

public v remove(object key) {
    node<k,v> e;
    return (e = removenode(hash(key), key, null, false, true)) == null ?
        null : e.value;
}

hashmap 的 remove(object) 方法会返回 null 或 value

有该值，返回 value 也就是 present，表示 remove 成功
无该值，返回 null，自然而然 remove 失败

而如果将 present 替换为 null 作为 value 值，那么 hashset 的 remove(object) 方法将无法判断移除元素的成功与失败；因为不管是成功与失败都会返回结果 null

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

为何HashSet中使用PRESENT而不是null作为value

1. 为什么 hashset 中使用 present 而不是 null 作为 value

1.1. present 是个什么玩意

1.2. hashset 的构造方法

1.3. present 何时会被用到

相关推荐

JS中null和undefined有什么区别

尽量使用translate而不是改变top/left进行动画（翻译）

Activity 之间的交互

JavaScript中null的介绍以及用法是怎样的

C++中nullptr和NULL怎么用

详解mysql不等于null和等于null的写法

MySQL中NULL和NOT NULL一样吗？

MySQL中空值Null和空字符怎么使用