Collection，List，Set和Map用法和區(qū)別

2019-11-14 12:46:10

字體：大中小

供稿：網(wǎng)友

以下內(nèi)容轉(zhuǎn)自：http://blog.csdn.net/an341221/article/details/50514664

作者：zccst

java sPRing MVC框架的調(diào)用關(guān)系是弄明白了，可是發(fā)現(xiàn)后面要走的路還很長，有很多東西對我還是很神秘，比如list，set，map等，今天就來一一解開他們的面紗。當(dāng)還還有一大堆需要記憶的系統(tǒng)已經(jīng)封裝好的類、接口等等，這些內(nèi)容會在以后，慢慢道來。

首先看一下他們之間的關(guān)系

Collection 接口的接口對象的集合├List 子接口 按進(jìn)入先后有序保存可重復(fù)│├LinkedList 接口實現(xiàn)類鏈表插入刪除沒有同步線程不安全│├ArrayList 接口實現(xiàn)類數(shù)組隨機(jī)訪問沒有同步線程不安全│└Vector 接口實現(xiàn)類數(shù)組同步線程安全│　└Stack└Set 子接口 僅接收一次，并做內(nèi)部排序

├HashSet

│　└LinkedHashSet└TreeSet

對于List，關(guān)心的是順序，它保證維護(hù)元素特定的順序（允許有相同元素），使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引（元素在List中的位置，類似于數(shù)組下標(biāo)）來訪問List中的元素。

對于Set，只關(guān)心某元素是否屬于Set（不允許有相同元素），而不關(guān)心它的順序。

Map 接口鍵值對的集合├Hashtable 接口實現(xiàn)類同步線程安全├HashMap 接口實現(xiàn)類沒有同步線程不安全

│├LinkedHashMap

│└WeakHashMap

├TreeMap└IdentifyHashMap

對于Map，最大的特點是鍵值映射，且為一一映射，鍵不能重復(fù)，值可以，所以是用鍵來索引值。方法put(Objectkey, Object value)添加一個“值”(想要得東西)和與“值”相關(guān)聯(lián)的“鍵”(key) (使用它來查找)。方法get(Object key)返回與給定“鍵”相關(guān)聯(lián)的“值”。

Map同樣對每個元素保存一份，但這是基于"鍵"的，Map也有內(nèi)置的排序，因而不關(guān)心元素添加的順序。如果添加元素的順序?qū)δ愫苤匾瑧?yīng)該使用 LinkedHashSet或者LinkedHashMap.

對于效率，Map由于采用了哈希散列，查找元素時明顯比ArrayList快。

但我有一個自己的原則想法：復(fù)雜的問題簡單化。即把很多晦澀難懂的問題用通俗直白的話，一下子就看明白了，而不是大段大段的寫。不得不指出的是現(xiàn)在部分所謂的“專家”往往把簡單的問題復(fù)雜化，讓人看了生畏，甚至望而卻步，以此來顯示他的高深莫測，當(dāng)然也可能有別的用意，那我就不得而知了。

更為精煉的總結(jié)：

Collection是對象集合，Collection有兩個子接口List和Set

List可以通過下標(biāo)(1,2..)來取得值，值可以重復(fù)

而Set只能通過游標(biāo)來取值，并且值是不能重復(fù)的

ArrayList，Vector，LinkedList是List的實現(xiàn)類

ArrayList是線程不安全的，Vector是線程安全的，這兩個類底層都是由數(shù)組實現(xiàn)的

LinkedList是線程不安全的，底層是由鏈表實現(xiàn)的

Map是鍵值對集合

HashTable和HashMap是Map的實現(xiàn)類 HashTable是線程安全的，不能存儲null值 HashMap不是線程安全的，可以存儲null值

所以，如果你是想在一個很短的時間來弄明白這些問題，比如1~2分鐘。沒有也不想花大量時間于此，那么建議你現(xiàn)在就可以收兵走人了。

如果你想對此做一個詳細(xì)的了解，請繼續(xù)看下去。

眾所周知，Java來源于C++，屏蔽了其底層實現(xiàn)，簡化了對底層實現(xiàn)的管理，使開發(fā)者專注于上層功能的實現(xiàn)。在C/C++里關(guān)于數(shù)據(jù)的存儲需要程序員非常清楚，而Java程序員可以完全不管這些，那么，Java是怎么管理的呢？其實Java還是需要面臨這些問題，只不過經(jīng)過封裝后，變得面目全非。所以對于像我這種從C/C++轉(zhuǎn)向Java的人還需要一段時間適應(yīng)，Collection、List、Set、Map等概念還需要一個接受的過程。其實到后來發(fā)現(xiàn)，不管是什么語言，其底層存儲不外乎數(shù)組、線性表、棧、隊列、串、樹和圖等數(shù)據(jù)結(jié)構(gòu)。想明白了這些，一切都敞亮了。

一、容器（Collection）接口　　容器（Collection）是最基本的集合接口，一個容器（Collection）保存一組對象（Object），即對象是容器的元素（Elements）。一些 Collection允許相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接繼承自Collection的類，Java SDK提供的類都是繼承自Collection的“子接口”如List和Set。　　所有實現(xiàn)Collection接口的類都必須提供兩個標(biāo)準(zhǔn)的構(gòu)造函數(shù)：無參數(shù)的構(gòu)造函數(shù)用于創(chuàng)建一個空的Collection，有一個 Collection參數(shù)的構(gòu)造函數(shù)用于創(chuàng)建一個新的Collection，這個新的Collection與傳入的Collection有相同的元素。后一個構(gòu)造函數(shù)允許用戶復(fù)制一個Collection。　　如何遍歷Collection中的每一個元素？不論Collection的實際類型如何，它都支持一個iterator()的方法，該方法返回一個迭代子，使用該迭代子即可逐一訪問Collection中每一個元素。典型的用法如下：　　　　Iterator it = collection.iterator(); // 獲得一個迭代子　　　　while(it.hasNext()) {　　　　　　Object obj = it.next(); // 得到下一個元素　　　　}

由Collection接口派生的兩個接口是List和Set。List按對象進(jìn)入的順序保存對象，不做排序或編輯操作。Set對每個對象只接受一次，并使用自己內(nèi)部的排序方法(通常，你只關(guān)心某個元素是否屬于Set,而不關(guān)心它的順序--否則應(yīng)該使用List)。

1，List接口　　List是有序的Collection，次序是List最重要的特點：它保證維護(hù)元素特定的順序。使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引（元素在List中的位置，類似于數(shù)組下標(biāo)）來訪問List中的元素，這類似于Java的數(shù)組。和下面要提到的Set不同，List允許有相同的元素。　　除了具有Collection接口必備的iterator()方法外，List還提供一個listIterator()方法，返回一個ListIterator接口，和標(biāo)準(zhǔn)的Iterator接口相比，ListIterator多了一些add()之類的方法，允許添加，刪除，設(shè)定元素，還能向前或向后遍歷。　　實現(xiàn)List接口的常用類有LinkedList，ArrayList，Vector和Stack。其中，最常用的是LinkedList和 ArrayList兩個。LinkedList類　　LinkedList實現(xiàn)了List接口，允許null元素。此外LinkedList提供額外的addFirst(),addLast(), getFirst(), getLast(), removeFirst(), removeLast(), insertFirst(),insertLast()方法在 LinkedList的首部或尾部，這些方法（沒有在任何接口或基類中定義過）使LinkedList可被用作堆棧（stack），隊列（queue）或雙向隊列（deque）。

注意LinkedList沒有同步方法。如果多個線程同時訪問一個List，則必須自己實現(xiàn)訪問同步。一種解決方法是在創(chuàng)建List時構(gòu)造一個同步的List：　　　　List list = Collections.synchronizedList(new LinkedList(...));

特點：對順序訪問進(jìn)行了優(yōu)化，向List中間插入與刪除的開銷并不大。隨機(jī)訪問則相對較慢。(使用ArrayList代替。)ArrayList類　　ArrayList是由數(shù)組實現(xiàn)的List，并且實現(xiàn)了可變大小的數(shù)組。它允許所有元素，包括null。ArrayList沒有同步。size，isEmpty，get，set方法運行時間為常數(shù)。但是add方法開銷為分?jǐn)偟某?shù)，添加n個元素需要O(n)的時間。其他的方法運行時間為線性。　　每個ArrayList實例都有一個容量（Capacity），即用于存儲元素的數(shù)組的大小。這個容量可隨著不斷添加新元素而自動增加，但是增長算法并沒有定義。當(dāng)需要插入大量元素時，在插入前可以調(diào)用ensureCapacity方法來增加ArrayList的容量以提高插入效率。　　和LinkedList一樣，ArrayList也是非同步的（unsynchronized）。

特點：允許對元素進(jìn)行快速隨機(jī)訪問，但是向List中間插入與移除元素的速度很慢。ListIterator只應(yīng)該用來由后向前遍歷ArrayList,而不是用來插入和移除元素。因為那比LinkedList開銷要大很多。

Vector類　　Vector非常類似ArrayList，但是Vector是同步的。由Vector創(chuàng)建的Iterator，雖然和ArrayList創(chuàng)建的 Iterator是同一接口，但是，因為Vector是同步的，當(dāng)一個Iterator被創(chuàng)建而且正在被使用，另一個線程改變了Vector的狀態(tài)（例如，添加或刪除了一些元素），這時調(diào)用Iterator的方法時將拋出ConcurrentModificationException，因此必須捕獲該異常。 Stack 類：Stack繼承自Vector，實現(xiàn)一個后進(jìn)先出的堆棧。Stack提供5個額外的方法使得Vector得以被當(dāng)作堆棧使用。基本的push和pop 方法，還有peek方法得到棧頂?shù)脑兀琫mpty方法測試堆棧是否為空，search方法檢測一個元素在堆棧中的位置。Stack剛創(chuàng)建后是空棧。2，Set接口　　Set具有與Collection完全一樣的接口，因此沒有任何額外的功能，不像前面有幾個不同的List。實際上Set就是 Collection，只是行為不同。（這是繼承與多態(tài)思想的典型應(yīng)用：表現(xiàn)不同的行為）。其次，Set是一種不包含重復(fù)的元素的Collection，加入Set的元素必須定義equals()方法以確保對象的唯一性（即任意的兩個元素e1和e2都有e1.equals(e2)=false），與List不同的是，Set接口不保證維護(hù)元素的次序。最后，Set最多有一個null元素。　　很明顯，Set的構(gòu)造函數(shù)有一個約束條件，傳入的Collection參數(shù)不能包含重復(fù)的元素。　　請注意：必須小心操作可變對象（Mutable Object）。如果一個Set中的可變元素改變了自身狀態(tài)導(dǎo)致Object.equals(Object)=true將導(dǎo)致一些問題。

HashSet類

為快速查找設(shè)計的Set。存入HashSet的對象必須定義hashCode()。

LinkedHashSet類：具有HashSet的查詢速度，且內(nèi)部使用鏈表維護(hù)元素的順序(插入的次序)。于是在使用迭代器遍歷Set時，結(jié)果會按元素插入的次序顯示。

TreeSet類

保存次序的Set, 底層為樹結(jié)構(gòu)。使用它可以從Set中提取有序的序列。

二、Map接口　　請注意，Map沒有繼承Collection接口，Map提供key到value的映射，你可以通過“鍵”查找“值”。一個Map中不能包含相同的key，每個key只能映射一個 value。Map接口提供3種集合的視圖，Map的內(nèi)容可以被當(dāng)作一組key集合，一組value集合，或者一組key-value映射。

方法put(Object key,Object value)添加一個“值”(想要得東西)和與“值”相關(guān)聯(lián)的“鍵”(key) (使用它來查找)。方法get(Object key)返回與給定“鍵”相關(guān)聯(lián)的“值”。可以用containsKey()和containsValue()測試Map中是否包含某個“鍵”或“值”。標(biāo)準(zhǔn)的Java類庫中包含了幾種不同的Map：HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它們都有同樣的基本接口Map，但是行為、效率、排序策略、保存對象的生命周期和判定“鍵”等價的策略等各不相同。

執(zhí)行效率是Map的一個大問題。看看get()要做哪些事，就會明白為什么在ArrayList中搜索“鍵”是相當(dāng)慢的。而這正是HashMap提高速度的地方。HashMap使用了特殊的值，稱為“散列碼”(hash code)，來取代對鍵的緩慢搜索。“散列碼”是“相對唯一”用以代表對象的int值，它是通過將該對象的某些信息進(jìn)行轉(zhuǎn)換而生成的（在下面總結(jié)二：需要的注意的地方有更進(jìn)一步探討）。所有Java對象都能產(chǎn)生散列碼，因為hashCode()是定義在基類Object中的方法。HashMap就是使用對象的hashCode()進(jìn)行快速查詢的。此方法能夠顯著提高性能。

Hashtable類　　Hashtable繼承Map接口，實現(xiàn)一個key-value映射的哈希表。任何非空（non-null）的對象都可作為key或者value。　　添加數(shù)據(jù)使用put(key, value)，取出數(shù)據(jù)使用get(key)，這兩個基本操作的時間開銷為常數(shù)。 Hashtable 通過初始化容量(initialcapacity) 和負(fù)載因子(load factor)兩個參數(shù)調(diào)整性能。通常缺省的load factor 0.75較好地實現(xiàn)了時間和空間的均衡。增大load factor可以節(jié)省空間但相應(yīng)的查找時間將增大，這會影響像get和put這樣的操作。使用Hashtable的簡單示例如下，將1，2，3放到Hashtable中，他們的key分別是”one”，”two”，”three”：　　　　Hashtable numbers = new Hashtable();　　　　numbers.put(“one”, new Integer(1));　　　　numbers.put(“two”, new Integer(2));　　　　numbers.put(“three”, new Integer(3));　　要取出一個數(shù)，比如2，用相應(yīng)的key：　　　　Integer n = (Integer)numbers.get(“two”);　　　　System.out.println(“two = ” + n);　　由于作為key的對象將通過計算其散列函數(shù)來確定與之對應(yīng)的value的位置，因此任何作為key的對象都必須實現(xiàn)hashCode方法和equals方法。hashCode方法和equals方法繼承自根類Object，如果你用自定義的類當(dāng)作key的話，要相當(dāng)小心，按照散列函數(shù)的定義，如果兩個對象相同，即obj1.equals(obj2)=true，則它們的hashCode必須相同，但如果兩個對象不同，則它們的hashCode不一定不同，如果兩個不同對象的hashCode相同，這種現(xiàn)象稱為沖突，沖突會導(dǎo)致操作哈希表的時間開銷增大，所以盡量定義好的hashCode()方法，能加快哈希表的操作。　　如果相同的對象有不同的hashCode，對哈希表的操作會出現(xiàn)意想不到的結(jié)果（期待的get方法返回null），要避免這種問題，只需要牢記一條：要同時復(fù)寫equals方法和hashCode方法，而不要只寫其中一個。　　Hashtable是同步的。HashMap類　　HashMap和Hashtable類似，也是基于散列表的實現(xiàn)。不同之處在于HashMap是非同步的，并且允許null，即null value和null key。將HashMap視為Collection時（values()方法可返回Collection），插入和查詢“鍵值對”的開銷是固定的，但其迭代子操作時間開銷和HashMap 的容量成比例。因此，如果迭代操作的性能相當(dāng)重要的話，不要將HashMap的初始化容量(initial capacity)設(shè)得過高，或者負(fù)載因子(load factor)過低。

　　LinkedHashMap 類：類似于HashMap，但是迭代遍歷它時，取得“鍵值對”的順序是其插入次序，或者是最近最少使用(LRU)的次序。只比HashMap慢一點。而在迭代訪問時發(fā)而更快，因為它使用鏈表維護(hù)內(nèi)部次序。

WeakHashMap類：弱鍵（weak key）Map是一種改進(jìn)的HashMap，它是為解決特殊問題設(shè)計的，對key實行“弱引用”，如果一個key不再被外部所引用（沒有map之外的引用），那么該key可以被垃圾收集器(GC)回收。

TreeMap類

基于紅黑樹數(shù)據(jù)結(jié)構(gòu)的實現(xiàn)。查看“鍵”或“鍵值對”時，它們會被排序(次序由Comparabel或Comparator決定)。TreeMap的特點在于，你得到的結(jié)果是經(jīng)過排序的。TreeMap是唯一的帶有subMap()方法的Map，它可以返回一個子樹。

IdentifyHashMap類

使用==代替equals()對“鍵”作比較的hashmap。專為解決特殊問題而設(shè)計。

總結(jié)一：比較

1，數(shù)組(Array)，數(shù)組類(Arrays)

Java所有“存儲及隨機(jī)訪問一連串對象”的做法，array是最有效率的一種。但缺點是容量固定且無法動態(tài)改變。array還有一個缺點是，無法判斷其中實際存有多少元素，length只是告訴我們array的容量。

Java中有一個數(shù)組類(Arrays)，專門用來操作array。數(shù)組類(arrays)中擁有一組static函數(shù)。

equals()：比較兩個array是否相等。array擁有相同元素個數(shù)，且所有對應(yīng)元素兩兩相等。

fill()：將值填入array中。

sort()：用來對array進(jìn)行排序。

binarySearch()：在排好序的array中尋找元素。

System.arraycopy()：array的復(fù)制。

若編寫程序時不知道究竟需要多少對象，需要在空間不足時自動擴(kuò)增容量，則需要使用容器類庫，array不適用。

2，容器類與數(shù)組的區(qū)別

容器類僅能持有對象引用（指向?qū)ο蟮闹羔槪皇菍ο笮畔opy一份至數(shù)列某位置。一旦將對象置入容器內(nèi)，便損失了該對象的型別信息。

3，容器(Collection)與Map的聯(lián)系與區(qū)別

Collection類型，每個位置只有一個元素。

Map類型，持有 key-value 對(pair)，像個小型數(shù)據(jù)庫。

Collections是針對集合類的一個幫助類。提供了一系列靜態(tài)方法實現(xiàn)對各種集合的搜索、排序、線程完全化等操作。相當(dāng)于對Array進(jìn)行類似操作的類——Arrays。

如，Collections.max(Collection coll); 取coll中最大的元素。

Collections.sort(List list); 對list中元素排序

List，Set，Map將持有對象一律視為Object型別。

Collection、List、Set、Map都是接口，不能實例化。繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class，這些才可被實例化。

vector容器確切知道它所持有的對象隸屬什么型別。vector不進(jìn)行邊界檢查。

總結(jié)二：需要注意的地方

1、Collection只能通過iterator()遍歷元素，沒有g(shù)et()方法來取得某個元素。

2、Set和Collection擁有一模一樣的接口。但排除掉傳入的Collection參數(shù)重復(fù)的元素。

3、List，可以通過get()方法來一次取出一個元素。使用數(shù)字來選擇一堆對象中的一個，get(0)...。(add/get)

4、Map用 put(k,v) /get(k)，還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。

HashMap會利用對象的hashCode來快速找到key。

哈希碼(hashing)就是將對象的信息經(jīng)過一些轉(zhuǎn)變形成一個獨一無二的int值，這個值存儲在一個array中。我們都知道所有存儲結(jié)構(gòu)中，array查找速度是最快的。所以，可以加速查找。發(fā)生碰撞時，讓array指向多個values。即，數(shù)組每個位置上又生成一個梿表。

5、Map中元素，可以將key序列、value序列單獨抽取出來。

使用keySet()抽取key序列，將map中的所有keys生成一個Set。

使用values()抽取value序列，將map中的所有values生成一個Collection。

為什么一個生成Set，一個生成Collection？那是因為，key總是獨一無二的，value允許重復(fù)。

總結(jié)三：如何選擇從效率角度：

在各種Lists，對于需要快速插入，刪除元素，應(yīng)該使用LinkedList（可用LinkedList構(gòu)造堆棧stack、隊列queue），如果需要快速隨機(jī)訪問元素，應(yīng)該使用ArrayList。最好的做法是以ArrayList作為缺省選擇。Vector總是比ArrayList慢，所以要盡量避免使用。

在各種Sets中，HashSet通常優(yōu)于HashTree（插入、查找）。只有當(dāng)需要產(chǎn)生一個經(jīng)過排序的序列，才用TreeSet。HashTree存在的唯一理由：能夠維護(hù)其內(nèi)元素的排序狀態(tài)。

在各種Maps中HashMap用于快速查找。

最后，當(dāng)元素個數(shù)固定，用Array，因為Array效率是最高的。

所以結(jié)論：最常用的是ArrayList，HashSet，HashMap，Array。

更近一步分析：

如果程序在單線程環(huán)境中，或者訪問僅僅在一個線程中進(jìn)行，考慮非同步的類，其效率較高，如果多個線程可能同時操作一個類，應(yīng)該使用同步的類。要特別注意對哈希表的操作，作為key的對象要同時正確復(fù)寫equals方法和hashCode方法。盡量返回接口而非實際的類型，如返回List而非ArrayList，這樣如果以后需要將ArrayList換成LinkedList時，客戶端代碼不用改變。這就是針對抽象編程。

注：本文參考部分網(wǎng)絡(luò)文獻(xiàn)。

上一篇：C++筆記之析構(gòu)函數(shù)

下一篇：只能打開一次應(yīng)用程序