java collections framework是java编程语言的核心部分之一。集合几乎用于任何编程语言中。大多数编程语言都支持各种类型的集合,例如list, set, queue, stack等。
1.什么是java collections framework?
集合就像容器一样,将多个项目组合在一个单元中。例如,一罐巧克力,一组名称等。
某个编程语言都使用了collections,当java出现时,它也带有一些collection类-vector,stack,hashtable和array。
java 1.2提供了collections framework,这是一种以标准方式表示和操作java中collections的体系结构。java collections由以下部分组成:
-
接口:java集合框架接口提供抽象数据类型来表示集合
java.util.collection
。是集合框架的根接口。它在集合框架层次结构的顶部,它包含一些重要的方法,如size()
, ,iterator()
,add()
,remove()
,clear()
每一个集合类必须实现。其他一些重要的接口是
java.util.list
,java.util.set
,java.util.queue
和java.util.map
。map是唯一一个不从collection接口继承的接口,但它是collections框架的一部分。所有集合框架接口都存在于
java.util
包中。 -
实现类:java collections是框架提供了集合的核心实现类。我们可以使用它们在java程序中创建不同类型的集合。
一些重要的集合类是
arraylist
,linkedlist
,hashmap
,treemap
,hashset
,treeset
。这些类满足了我们大多数的编程需求,但是如果我们需要一些特殊的集合类,我们可以扩展它们以创建我们的自定义集合类。
java 1.5中提供了线程安全的集合类,该类允许在迭代它的同时修改集合。其中有些是
copyonwritearraylist
,concurrenthashmap
,copyonwritearrayset
。这些类位于java.util.concurrent包中。所有集合类都存在于
java.util
和java.util.concurrent
包中。 -
算法:算法是提供一些常用功能的有用方法,例如搜索,排序和改组。
下面的类图显示了collections框架的层次结构。为简单起见,我仅包括常用的接口和类。
2. java collections framework的好处
java collections具有以下优点:
- 减少的开发工作量 –几乎包含了所有常见类型的集合,并提供有用的方法来转换和处理数据。因此,我们可以将更多的放置业务逻辑上,而不是设计集合api。
- 提高质量 –使用经过良好测试的核心集合类可以提高我们的程序质量,而不是使用任何自行开发的数据结构。
- 可重用性和互操作性
- 减少工作量 –如果我们使用核心集合api类,则可以学习任何新的api。
3. java collection接口
java的集合接口是java的集合框架的基础。请注意,所有核心集合接口都是通用的。例如public interface collection<e>
, 适用语法泛型,当我们声明集合时,应该使用它来指定它可以包含的对象的类型。通过在编译时对对象进行类型检查,它有助于减少运行时错误。
为了使核心集合接口的数量易于管理,java平台没有为每个集合类型的每个变体提供单独的接口。如果调用了不受支持的操作,则收集实现将引发unsupportedoperationexception
。
3.1)collection 接口
这是集合层次结构的根。集合表示一个称为其元素的对象。java平台不提供此接口的任何直接实现。
该接口有方法来告诉你有多少元素集合中(size
,isempty
),检查给定对象是否存在于集合中(contains
),添加和从集合中删除元素(add
,remove
),并提供了一个迭代器集合(iterator
)。
collection 接口还提供了对整个集合工作批量操作方法- containsall
,addall
,removeall``retainall``clear
。
3.2)iterator 接口
迭代器接口提供了对任何集合进行迭代的方法。我们可以使用iterator
方法从集合中获取迭代器实例。enumeration
在java集合框架中,迭代器代替了。迭代器允许调用者在迭代过程中从基础集合中删除元素。集合类中的iterator 实现“ 迭代器设计模式。
3.3)set 接口
set是一个不能包含重复元素的集合。此接口对数学集合的抽象进行建模,并表示集合,例如纸牌组。
java的平台包含三个通用设置实现:hashset
,treeset
和linkedhashset
。设置接口不允许随机访问集合中的元素。您可以使用迭代器或的foreach循环遍历集合的元素。
3.4)list 接口
list是一个有序的集合,可以包含重复的元素。您可以从其索引访问任何元素。列表更像是具有动态长度的数组。列表是最常用的集合类型之一。arraylist
并且linkedlist
的英文名单接口的实现类。
列表接口提供了有用的方法,可以在特定索引处添加元素,基于索引删除/替换元素以及使用索引获取子列表。
list strlist = new arraylist<>(); //add at last strlist.add(0, "0"); //add at specified index strlist.add(1, "1"); //replace strlist.set(1, "2"); //remove strlist.remove("1");
集合类列表提供了一些有用的算法sort
,shuffle
,reverse
,binarysearch
等。
3.5)queue 接口
队列的英文用于在处理之前保存多个元素的集合。除了基本的集合操作外,队列还提供其他插入,提取和检查操作。
队列通常但不一定以fifo(先进先出)的方式对元素进行排序。优先队列除外,它们根据提供的比较器或元素的自然顺序对元素进行排序。无论使用哪种顺序,队列的开头都是将通过调用remove或poll删除的元素。在fifo级别中,所有新元素都插入串联的尾部。
3.6)dequeue 接口
支持在两端插入和删除元素的线性集合。双端队列这个名称是“双端队列”的缩写,通常发音为“deck”。大多数的deque实现对它们可能包含的元素数量没有固定的限制,但是此接口支持容量平均值的双端数值以及没有固定大小限制的双端数值。
此接口定义访问双端双向对称的元素的方法。提供了用于插入,删除和检查元素的方法。
3.7)map 接口
java map是一个将键映射到值的对象。映射不能包含重复的键:每个键最多可以映射到一个值。
java的平台包含三个通用map实现hashmap
,treemap
和linkedhashmap
。
map的基本操作是put
,get
,containskey
,containsvalue
,size
,和isempty
。
3.8)listiterator 接口
列表的迭代器允许程序员在任一方向上遍历列表,在迭代过程中修改列表,并获取迭代器在列表中的当前位置。
java listiterator 没有当前元素;它的光标位置始终位于通过调用previous()返回上一个元素和通过调用next()返回下一个元素。
3.9)sortedset 接口
sortedset是一个set,它按升序维护其元素。提供了一些其他操作以利用排序的优势。排序的集合用于自然排序的集合,例如单词列表和成员列表。
3.10)sortedmap 接口
以升序顺序维护其映射的map。这是sortedset的map模拟。排序后的map使用键/值对的自然排序集合,例如字典和电话簿。
4. java集合类
java集合框架带有许多接口实现类。最常见的实现是arraylist,hashmap和hashset。java 1.5中包含并发实现; 例如concurrenthashmap中和的copyonwritearraylist。通常,集合类不是线程安全的,并且其迭代器是fast-fail的。
4.1)hashset类
java hashset是由hashmap支持的set接口的基本实现。它不保证集合的继承顺序,并允许使用null元素。
这个类提供了固定的时间表现为基本操作(add
,remove
,contains
和size
),假定哈希函数将分散的桶中正确的元素。我们可以为此集合设置初始容量和负载因子。负载因子是散列映射被允许在自动增加其容量之前获得的填充程度的尺寸。
4.2)treeset类
navigableset
基于的实现treemap
。元素使用其自然顺序进行排序,或者通过comparator
在设置创建时提供的元素进行排序,具体取决于所使用的构造函数。
此实现为基本操作(添加,删除和包含)提供了保证的log(n)时间成本。
请注意,如果要正确实现set接口,则由集合(无论是否提供显式比较器)维护的顺序必须等于equals。(有关与equals一致的精确定义,请参见comparable或comparator。)之所以这样,是因为set接口是根据等于操作定义的,但是treeset实例使用其compareto(或compare)方法执行所有元素比较,因此两个从集合的角度来看,此方法认为替代的元素是类似的。
4.3)arraylist类
java arraylist是list接口的可调整大小的数组实现。实现所有可选的列表操作,并允许所有元素,包括null。除了实现list接口之外,此类还提供一些方法来操纵内部用于存储列表的数组的大小。(此类与向量大致等效,但它是不同步的)。
size isempty,get,set,iterator和list迭代器操作在恒定的时间运行。加法运算以固定的固定时间运行,则,添加n个元素需要o(n)时间。所有其他操作均以线性时间运行(大致而言)。与linkedlist实现比例,常数因子降低。
4.4)linkedlist类
list和deque接口的双链接列表实现。实现所有可选的列表操作,并允许所有元素(包括null)。
所有操作均按双链表的预期执行。索引到列表中的操作初始化开头或结尾遍历列表,以更接近指定索引的位置为准。
4.5)hashmap类
基于哈希表的map接口的实现。此实现提供所有可选的映射操作,并允许空值和空键。hashmap的类与hashtable的大致等效,但它是不同步的,并且允许为空。此类无法保证map的顺序。
此实现为基本操作(get
和put
)提供了恒定时间的性能。它为构造函数提供了设置集合的初始容量和负载因子的功能。
4.6)treemap类
基于红黑树的navigablemap实现。根据映射键的自然顺序或在映射创建时提供的比较器对映射进行排序,具体而言所使用的构造函数。
此实现为containskey,get,put和remove操作提供了保证的log(n)时间成本。算法是对cormen,leiserson和rivest的“算法简介”中的算法的改编。
请注意,treemap维护的排序(与任何排序的映射相同)以及是否提供显式比较器必须与equals一致,杀死此排序的映射正确实现map连接。(有关与equals一致的精确定义,请参见comparable或之所以这样,是因为map接口是根据等于操作定义的,但是排序后的map使用其compareto(或compare)方法执行所有键比较,因此两个从已排序映射的角度来看,此方法认为相等的键是相等的。排序后的映射的行为是明确定义的,即使其排序与等于不一致也是如此,它只是不遵守该map接口的一般约定。
4.7)priorityqueue类
队列按fifo顺序处理其元素,但有时我们希望根据元素的优先级对其进行处理。在这种情况下,我们可以使用的priorityqueue,并且在实例化的priorityqueue时需要提供比较器实现。priorityqueue中不允许空值,和它是无界的。
5.collections类
java collections类仅由对集合进行操作或返回集合的静态方法组成。它包含对集合进行操作的多态算法,“包装器”(包装器),这些包装器返回由指定集合支持的新集合,以及其他一些零碎的结局。
此类包含用于集合框架算法的方法,例如二进制搜索,排序,改组,反向等。
6.synchronized包装器
同步包装器将自动同步(线程安全)添加到任意集合。六个核心集合接口(collection,set,list,map,sortedset和sortedmap)中的每个都有一个静态工厂方法。
public static collection synchronizedcollection(collection c); public static set synchronizedset(set s); public static list synchronizedlist(list list); public static <k,v> map<k,v> synchronizedmap(map<k,v> m); public static sortedset synchronizedsortedset(sortedset s); public static <k,v> sortedmap<k,v> synchronizedsortedmap(sortedmap<k,v> m);
这些方法中的每一个都返回一个由指定集合备份的同步(线程安全)集合。
7.不可修改的包装器
不可修改的包装器通过拦截所有会修改集合并抛出的操作,从而丧失了修改集合的能力unsupportedoperationexception
。其主要用途是;
- 使集合一旦建立便便不可变。在这种情况下,最好不要保留对后备集合的引用。这绝对保证了不变性。
- 这样,在您保持完全访问权限的同时,客户端可以查看但不能修改。允许某些客户端以预定方式访问您的数据结构。您保留对后备集合的引用,但分配对包装器的引用。
这些方法是:
public static collection unmodifiablecollection(collection<? extends t> c); public static set unmodifiableset(set<? extends t> s); public static list unmodifiablelist(list<? extends t> list); public static <k,v> map<k, v> unmodifiablemap(map<? extends k, ? extends v> m); public static sortedset unmodifiablesortedset(sortedset<? extends t> s); public static <k,v> sortedmap<k, v> unmodifiablesortedmap(sortedmap<k, ? extends v> m);
8.线程安全集合
java 1.5的并发包(java.util.concurrent
)包含线程安全的集合类,这些类允许在迭代时修改集合。通过设计迭代器是快速失败的,并抛出concurrentmodificationexception的。有些班是copyonwritearraylist
,concurrenthashmap
,copyonwritearrayset
。
9.collections api算法
java collections framework提供了常用的算法实现,例如排序和搜索。集合类包含这些方法实现。这些算法大多数都可以在列表上使用,但是其中一些算法适用于所有类型的集合。
9.1)排序
排序算法对list进行重新排序,ike其元素根据排序关系以升序排列。提供了两种形式的操作。简单形式采用一个list,并根据其元素的自然顺序进行进行排序。排序的第二种形式除列表外还包含一个comparator,并使用comparator对元素进行排序。
9.2)改组
随机播放算法会破坏列表中可能存在的任何顺序跟踪。即,该算法基于来自随机性源的输入对列表进行重新排序,从而合理合理的随机性源,所有可能的划分均以相同的可能性发生。该算法在实施机会游戏中很有用。
9.3)搜索
binarysearch算法在排序列表中搜索指定的元素。该算法有两种形式。第一个带有一个list和一个要搜索的元素(“搜索关键字”)。
此格式预先列出根据其元素的自然顺序以升序排序。
第二种形式除列表和搜索键外还采用比较器,并根据指定的比较器将列表按升序排序。
排序算法可用于在调用binarysearch之前对list进行排序。
9.4)组成
频率算法和不相交算法测试一个或多个集合的组成的某些方面。
- 频率:计算指定元素在指定集合中出现的次数
- 不相交:确定两个集合是否不相交;也就是说,这些是否不包含共同点
9.5)预测和可靠性
最小和最大算法分别返回指定collection中包含的最小和最大元素。这两种操作都有两个形式。简单形式仅采用collection并根据元素的自然顺序返回最小(或最大)元素。
第二种形式除外collection之外还采用comparator,并根据指定的comparator返回最小(或最大)元素。
10. java 8 collections api功能
java 8的最大变化与collection api有关。一些重要的更改和改进是:
- 有关有关顺序处理和并行处理的stream api的介绍
- 可重复接口已使用for foreach()替代方法扩展,可用于遍历集合。
- lambda表达式和功能性接口最适合collection api类。
11. java 10 collections api的更改
- list.copyof,set.copyof和map.copyof方法,以创建不可修改的集合。
- 收藏家类获得各种方法来收集不可修改的集合(设置,为list,map)。这些方法名称为tounmodifiablelist,tounmodifiableset和tounmodifiablemap。
package com.journaldev.collections; import java.util.arraylist; import java.util.list; import java.util.stream.collectors; public class jdk10collectionfunctions { public static void main(string[] args) { // 1. list, set, map copyof(collection) method list<string> actors = new arraylist<>(); actors.add("jack nicholson"); actors.add("marlon brando"); system.out.println(actors); // prints [jack nicholson, marlon brando] // new api added - creates an unmodifiable list from a list. list<string> copyofactors = list.copyof(actors); system.out.println(copyofactors); // prints [jack nicholson, marlon brando] // copyofactors.add("robert de niro"); will generate // unsupportedoperationexception actors.add("robert de niro"); system.out.println(actors); // prints [jack nicholson, marlon brando, robert de niro] system.out.println(copyofactors); // prints [jack nicholson, marlon brando] // 2. collectors class tounmodifiablelist, tounmodifiableset, and // tounmodifiablemap methods list<string> collect = actors.stream().collect(collectors.tounmodifiablelist()); system.out.println(collect); } }
12. java 11 collections api的更改
toarray(intfunction<t[]> generator)
集合界面中添加了一个新的替代方法。此方法使用提供的生成器函数分配返回的数组,该数组返回包含此集合中所有元素的数组。
package com.journaldev.collections; import java.util.arraylist; import java.util.arrays; import java.util.list; public class jdk11collectionfunctions { public static void main(string[] args) { /* * jdk 11 new method in collection interface * default <t> t[] toarray(intfunction<t[]> generator) { * return toarray(generator.apply(0)); } */ list<string> strlist = new arraylist<>(); strlist.add("java"); strlist.add("python"); strlist.add("android"); string[] strarray = strlist.toarray(size -> new string[size]); system.out.println(arrays.tostring(strarray)); strarray = strlist.toarray(size -> new string[size + 5]); system.out.println(arrays.tostring(strarray)); strarray = strlist.toarray(size -> new string[size * 3]); system.out.println(arrays.tostring(strarray)); } }
输出:
[java,python,android] [java,python,android,null,null] [java,python,android]
13.总结类中的集合类
下表提供了常用集合类的基本详细信息。
集合 | 排序 | 随机访问 | key-value | 重复元素 | 空元素 | 线程安全 |
---|---|---|---|---|---|---|
arraylist | ✅ | ✅ | ❌ | ✅ | ✅ | ❌ |
linkedlist | ✅ | ❌ | ❌ | ✅ | ✅ | ❌ |
hashset | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ |
treeset | ✅ | ❌ | ❌ | ❌ | ❌ | ❌ |
hashmap | ❌ | ✅ | ✅ | ❌ | ✅ | ❌ |
treemap | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
vector | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
hashtable | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
properties | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
stack | ✅ | ❌ | ❌ | ✅ | ✅ | ✅ |
copyonwritearraylist | ✅ | ✅ | ❌ | ✅ | ✅ | ✅ |
concurrenthashmap | ❌ | ✅ | ✅ | ❌ | ❌ | ✅ |
copyonwritearrayset | ❌ | ❌ | ❌ | ❌ | ✅ | ✅ |
“不积跬步,无以至千里”,希望未来的你能:有梦为马 随处可栖!加油,少年!
关注公众号:「java 知己」,每天更新java知识哦,期待你的到来!
- 发送「group」,与 10 万程序员一起进步。
- 发送「面试」,领取batj面试资料、面试视频攻略。
- 发送「玩转算法」,领取《玩转算法》系列视频教程。
- 千万不要发送「1024」...