以下內(nèi)容轉(zhuǎn)自:http://blog.csdn.net/an341221/article/details/50514664
Collection,List,Set和Map用法和區(qū)別
作者:zccst
java sPRing MVC框架的調(diào)用關(guān)系是弄明白了,可是發(fā)現(xiàn)后面要走的路還很長,有很多東西對我還是很神秘,比如list,set,map等,今天就來一一解開他們的面紗。當(dāng)還還有一大堆需要記憶的系統(tǒng)已經(jīng)封裝好的類、接口等等,這些內(nèi)容會在以后,慢慢道來。
首先看一下他們之間的關(guān)系
Collection 接口的接口 對象的集合├List 子接口 按進(jìn)入先后有序保存 可重復(fù)│├LinkedList 接口實現(xiàn)類 鏈表 插入刪除 沒有同步 線程不安全│├ArrayList 接口實現(xiàn)類 數(shù)組 隨機(jī)訪問 沒有同步 線程不安全│└Vector 接口實現(xiàn)類 數(shù)組 同步 線程安全│ └Stack└Set 子接口 僅接收一次,并做內(nèi)部排序
├HashSet
│ └LinkedHashSet└TreeSet
對于List,關(guān)心的是順序,它保證維護(hù)元素特定的順序(允許有相同元素),使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引(元素在List中的位置,類似于數(shù)組下標(biāo))來訪問List中的元素。
對于Set,只關(guān)心某元素是否屬于Set(不允許有相同元素),而不關(guān)心它的順序。
Map 接口 鍵值對的集合├Hashtable 接口實現(xiàn)類 同步 線程安全├HashMap 接口實現(xiàn)類 沒有同步 線程不安全
│├LinkedHashMap
│└WeakHashMap
├TreeMap└IdentifyHashMap
對于Map,最大的特點是鍵值映射,且為一一映射,鍵不能重復(fù),值可以,所以是用鍵來索引值。方法put(Objectkey, Object value)添加一個“值”(想要得東西)和與“值”相關(guān)聯(lián)的“鍵”(key) (使用它來查找)。方法get(Object key)返回與給定“鍵”相關(guān)聯(lián)的“值”。
Map同樣對每個元素保存一份,但這是基于"鍵"的,Map也有內(nèi)置的排序,因而不關(guān)心元素添加的順序。如果添加元素的順序?qū)δ愫苤匾瑧?yīng)該使用 LinkedHashSet或者LinkedHashMap.
對于效率,Map由于采用了哈希散列,查找元素時明顯比ArrayList快。
但我有一個自己的原則想法:復(fù)雜的問題簡單化。即把很多晦澀難懂的問題用通俗直白的話,一下子就看明白了,而不是大段大段的寫。不得不指出的是現(xiàn)在部分所謂的“專家”往往把簡單的問題復(fù)雜化,讓人看了生畏,甚至望而卻步,以此來顯示他的高深莫測,當(dāng)然也可能有別的用意,那我就不得而知了。
更為精煉的總結(jié):
Collection是對象集合,Collection有兩個子接口List和Set
List可以通過下標(biāo)(1,2..)來取得值,值可以重復(fù)
而Set只能通過游標(biāo)來取值,并且值是不能重復(fù)的
ArrayList,Vector,LinkedList是List的實現(xiàn)類
ArrayList是線程不安全的,Vector是線程安全的,這兩個類底層都是由數(shù)組實現(xiàn)的
LinkedList是線程不安全的,底層是由鏈表實現(xiàn)的
Map是鍵值對集合
HashTable和HashMap是Map的實現(xiàn)類 HashTable是線程安全的,不能存儲null值 HashMap不是線程安全的,可以存儲null值
所以,如果你是想在一個很短的時間來弄明白這些問題,比如1~2分鐘。沒有也不想花大量時間于此,那么建議你現(xiàn)在就可以收兵走人了。
如果你想對此做一個詳細(xì)的了解,請繼續(xù)看下去。
眾所周知,Java來源于C++,屏蔽了其底層實現(xiàn),簡化了對底層實現(xiàn)的管理,使開發(fā)者專注于上層功能的實現(xiàn)。在C/C++里關(guān)于數(shù)據(jù)的存儲需要程序員非常清楚,而Java程序員可以完全不管這些,那么,Java是怎么管理的呢?其實Java還是需要面臨這些問題,只不過經(jīng)過封裝后,變得面目全非。所以對于像我這種從C/C++轉(zhuǎn)向Java的人還需要一段時間適應(yīng),Collection、List、Set、Map等概念還需要一個接受的過程。其實到后來發(fā)現(xiàn),不管是什么語言,其底層存儲不外乎數(shù)組、線性表、棧、隊列、串、樹和圖等數(shù)據(jù)結(jié)構(gòu)。想明白了這些,一切都敞亮了。
一、容器(Collection)接口 容器(Collection)是最基本的集合接口,一個容器(Collection)保存一組對象(Object),即對象是容器的元素(Elements)。一些 Collection允許相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接繼承自Collection的類,Java SDK提供的類都是繼承自Collection的“子接口”如List和Set。 所有實現(xiàn)Collection接口的類都必須提供兩個標(biāo)準(zhǔn)的構(gòu)造函數(shù):無參數(shù)的構(gòu)造函數(shù)用于創(chuàng)建一個空的Collection,有一個 Collection參數(shù)的構(gòu)造函數(shù)用于創(chuàng)建一個新的Collection,這個新的Collection與傳入的Collection有相同的元素。后一個構(gòu)造函數(shù)允許用戶復(fù)制一個Collection。 如何遍歷Collection中的每一個元素?不論Collection的實際類型如何,它都支持一個iterator()的方法,該方法返回一個迭代子,使用該迭代子即可逐一訪問Collection中每一個元素。典型的用法如下: Iterator it = collection.iterator(); // 獲得一個迭代子 while(it.hasNext()) { Object obj = it.next(); // 得到下一個元素 }
由Collection接口派生的兩個接口是List和Set。List按對象進(jìn)入的順序保存對象,不做排序或編輯操作。Set對每個對象只接受一次,并使用自己內(nèi)部的排序方法(通常,你只關(guān)心某個元素是否屬于Set,而不關(guān)心它的順序--否則應(yīng)該使用List)。
1,List接口 List是有序的Collection,次序是List最重要的特點:它保證維護(hù)元素特定的順序。使用此接口能夠精確的控制每個元素插入的位置。用戶能夠使用索引(元素在List中的位置,類似于數(shù)組下標(biāo))來訪問List中的元素,這類似于Java的數(shù)組。和下面要提到的Set不同,List允許有相同的元素。 除了具有Collection接口必備的iterator()方法外,List還提供一個listIterator()方法,返回一個ListIterator接口,和標(biāo)準(zhǔn)的Iterator接口相比,ListIterator多了一些add()之類的方法,允許添加,刪除,設(shè)定元素,還能向前或向后遍歷。 實現(xiàn)List接口的常用類有LinkedList,ArrayList,Vector和Stack。其中,最常用的是LinkedList和 ArrayList兩個。LinkedList類 LinkedList實現(xiàn)了List接口,允許null元素。此外LinkedList提供額外的addFirst(),addLast(), getFirst(), getLast(), removeFirst(), removeLast(), insertFirst(),insertLast()方法在 LinkedList的首部或尾部,這些方法(沒有在任何接口或基類中定義過)使LinkedList可被用作堆棧(stack),隊列(queue)或雙向隊列(deque)。
注意LinkedList沒有同步方法。如果多個線程同時訪問一個List,則必須自己實現(xiàn)訪問同步。一種解決方法是在創(chuàng)建List時構(gòu)造一個同步的List: List list = Collections.synchronizedList(new LinkedList(...));
特點:對順序訪問進(jìn)行了優(yōu)化,向List中間插入與刪除的開銷并不大。隨機(jī)訪問則相對較慢。(使用ArrayList代替。)ArrayList類 ArrayList是由數(shù)組實現(xiàn)的List,并且實現(xiàn)了可變大小的數(shù)組。它允許所有元素,包括null。ArrayList沒有同步。size,isEmpty,get,set方法運行時間為常數(shù)。但是add方法開銷為分?jǐn)偟某?shù),添加n個元素需要O(n)的時間。其他的方法運行時間為線性。 每個ArrayList實例都有一個容量(Capacity),即用于存儲元素的數(shù)組的大小。這個容量可隨著不斷添加新元素而自動增加,但是增長算法并沒有定義。當(dāng)需要插入大量元素時,在插入前可以調(diào)用ensureCapacity方法來增加ArrayList的容量以提高插入效率。 和LinkedList一樣,ArrayList也是非同步的(unsynchronized)。
特點:允許對元素進(jìn)行快速隨機(jī)訪問,但是向List中間插入與移除元素的速度很慢。ListIterator只應(yīng)該用來由后向前遍歷ArrayList,而不是用來插入和移除元素。因為那比LinkedList開銷要大很多。
Vector類 Vector非常類似ArrayList,但是Vector是同步的。由Vector創(chuàng)建的Iterator,雖然和ArrayList創(chuàng)建的 Iterator是同一接口,但是,因為Vector是同步的,當(dāng)一個Iterator被創(chuàng)建而且正在被使用,另一個線程改變了Vector的狀態(tài)(例如,添加或刪除了一些元素),這時調(diào)用Iterator的方法時將拋出ConcurrentModificationException,因此必須捕獲該異常。 Stack 類:Stack繼承自Vector,實現(xiàn)一個后進(jìn)先出的堆棧。Stack提供5個額外的方法使得Vector得以被當(dāng)作堆棧使用。基本的push和pop 方法,還有peek方法得到棧頂?shù)脑兀琫mpty方法測試堆棧是否為空,search方法檢測一個元素在堆棧中的位置。Stack剛創(chuàng)建后是空棧。2,Set接口 Set具有與Collection完全一樣的接口,因此沒有任何額外的功能,不像前面有幾個不同的List。實際上Set就是 Collection,只是行為不同。(這是繼承與多態(tài)思想的典型應(yīng)用:表現(xiàn)不同的行為)。其次,Set是一種不包含重復(fù)的元素的Collection,加入Set的元素必須定義equals()方法以確保對象的唯一性( 即任意的兩個元素e1和e2都有e1.equals(e2)=false),與List不同的是,Set接口不保證維護(hù)元素的次序。最后,Set最多有一個null元素。 很明顯,Set的構(gòu)造函數(shù)有一個約束條件,傳入的Collection參數(shù)不能包含重復(fù)的元素。 請注意:必須小心操作可變對象(Mutable Object)。如果一個Set中的可變元素改變了自身狀態(tài)導(dǎo)致Object.equals(Object)=true將導(dǎo)致一些問題。
HashSet類
為快速查找設(shè)計的Set。存入HashSet的對象必須定義hashCode()。
LinkedHashSet類:具有HashSet的查詢速度,且內(nèi)部使用鏈表維護(hù)元素的順序(插入的次序)。于是在使用迭代器遍歷Set時,結(jié)果會按元素插入的次序顯示。
TreeSet類
保存次序的Set, 底層為樹結(jié)構(gòu)。使用它可以從Set中提取有序的序列。
二、Map接口 請注意,Map沒有繼承Collection接口,Map提供key到value的映射,你可以通過“鍵”查找“值”。一個Map中不能包含相同的key,每個key只能映射一個 value。Map接口提供3種集合的視圖,Map的內(nèi)容可以被當(dāng)作一組key集合,一組value集合,或者一組key-value映射。
方法put(Object key,Object value)添加一個“值”(想要得東西)和與“值”相關(guān)聯(lián)的“鍵”(key) (使用它來查找)。方法get(Object key)返回與給定“鍵”相關(guān)聯(lián)的“值”。可以用containsKey()和containsValue()測試Map中是否包含某個“鍵”或“值”。標(biāo)準(zhǔn)的Java類庫中包含了幾種不同的Map:HashMap, TreeMap, LinkedHashMap, WeakHashMap, IdentityHashMap。它們都有同樣的基本接口Map,但是行為、效率、排序策略、保存對象的生命周期和判定“鍵”等價的策略等各不相同。
Map同樣對每個元素保存一份,但這是基于"鍵"的,Map也有內(nèi)置的排序,因而不關(guān)心元素添加的順序。如果添加元素的順序?qū)δ愫苤匾瑧?yīng)該使用 LinkedHashSet或者LinkedHashMap.
執(zhí)行效率是Map的一個大問題。看看get()要做哪些事,就會明白為什么在ArrayList中搜索“鍵”是相當(dāng)慢的。而這正是HashMap提高速度的地方。HashMap使用了特殊的值,稱為“散列碼”(hash code),來取代對鍵的緩慢搜索。“散列碼”是“相對唯一”用以代表對象的int值,它是通過將該對象的某些信息進(jìn)行轉(zhuǎn)換而生成的(在下面總結(jié)二:需要的注意的地方有更進(jìn)一步探討)。所有Java對象都能產(chǎn)生散列碼,因為hashCode()是定義在基類Object中的方法。HashMap就是使用對象的hashCode()進(jìn)行快速查詢的。此方法能夠顯著提高性能。
Hashtable類 Hashtable繼承Map接口,實現(xiàn)一個key-value映射的哈希表。任何非空(non-null)的對象都可作為key或者value。 添加數(shù)據(jù)使用put(key, value),取出數(shù)據(jù)使用get(key),這兩個基本操作的時間開銷為常數(shù)。 Hashtable 通過初始化容量(initialcapacity) 和負(fù)載因子(load factor)兩個參數(shù)調(diào)整性能。通常缺省的load factor 0.75較好地實現(xiàn)了時間和空間的均衡。增大load factor可以節(jié)省空間但相應(yīng)的查找時間將增大,這會影響像get和put這樣的操作。 使用Hashtable的簡單示例如下,將1,2,3放到Hashtable中,他們的key分別是”one”,”two”,”three”: Hashtable numbers = new Hashtable(); numbers.put(“one”, new Integer(1)); numbers.put(“two”, new Integer(2)); numbers.put(“three”, new Integer(3)); 要取出一個數(shù),比如2,用相應(yīng)的key: Integer n = (Integer)numbers.get(“two”); System.out.println(“two = ” + n); 由于作為key的對象將通過計算其散列函數(shù)來確定與之對應(yīng)的value的位置,因此任何作為key的對象都必須實現(xiàn)hashCode方法和equals方法。hashCode方法和equals方法繼承自根類Object,如果你用自定義的類當(dāng)作key的話,要相當(dāng)小心,按照散列函數(shù)的定義,如果兩個對象相同,即obj1.equals(obj2)=true,則它們的hashCode必須相同,但如果兩個對象不同,則它們的hashCode不一定不同,如果兩個不同對象的hashCode相同,這種現(xiàn)象稱為沖突,沖突會導(dǎo)致操作哈希表的時間開銷增大,所以盡量定義好的hashCode()方法,能加快哈希表的操作。 如果相同的對象有不同的hashCode,對哈希表的操作會出現(xiàn)意想不到的結(jié)果(期待的get方法返回null),要避免這種問題,只需要牢記一條:要同時復(fù)寫equals方法和hashCode方法,而不要只寫其中一個。 Hashtable是同步的。HashMap類 HashMap和Hashtable類似,也是基于散列表的實現(xiàn)。不同之處在于HashMap是非同步的,并且允許null,即null value和null key。將HashMap視為Collection時(values()方法可返回Collection),插入和查詢“鍵值對”的開銷是固定的,但其迭代子操作時間開銷和HashMap 的容量成比例。因此,如果迭代操作的性能相當(dāng)重要的話,不要將HashMap的初始化容量(initial capacity)設(shè)得過高,或者負(fù)載因子(load factor)過低。
LinkedHashMap 類:類似于HashMap,但是迭代遍歷它時,取得“鍵值對”的順序是其插入次序,或者是最近最少使用(LRU)的次序。只比HashMap慢一點。而在迭代訪問時發(fā)而更快,因為它使用鏈表維護(hù)內(nèi)部次序。
WeakHashMap類:弱鍵(weak key)Map是一種改進(jìn)的HashMap,它是為解決特殊問題設(shè)計的,對key實行“弱引用”,如果一個key不再被外部所引用(沒有map之外的引用),那么該key可以被垃圾收集器(GC)回收。
TreeMap類
基于紅黑樹數(shù)據(jù)結(jié)構(gòu)的實現(xiàn)。查看“鍵”或“鍵值對”時,它們會被排序(次序由Comparabel或Comparator決定)。TreeMap的特點在于,你得到的結(jié)果是經(jīng)過排序的。TreeMap是唯一的帶有subMap()方法的Map,它可以返回一個子樹。
IdentifyHashMap類
使用==代替equals()對“鍵”作比較的hashmap。專為解決特殊問題而設(shè)計。
總結(jié)一:比較
1,數(shù)組(Array),數(shù)組類(Arrays)
Java所有“存儲及隨機(jī)訪問一連串對象”的做法,array是最有效率的一種。但缺點是容量固定且無法動態(tài)改變。array還有一個缺點是,無法判斷其中實際存有多少元素,length只是告訴我們array的容量。
Java中有一個數(shù)組類(Arrays),專門用來操作array。數(shù)組類(arrays)中擁有一組static函數(shù)。
equals():比較兩個array是否相等。array擁有相同元素個數(shù),且所有對應(yīng)元素兩兩相等。
fill():將值填入array中。
sort():用來對array進(jìn)行排序。
binarySearch():在排好序的array中尋找元素。
System.arraycopy():array的復(fù)制。
若編寫程序時不知道究竟需要多少對象,需要在空間不足時自動擴(kuò)增容量,則需要使用容器類庫,array不適用。
2,容器類與數(shù)組的區(qū)別
容器類僅能持有對象引用(指向?qū)ο蟮闹羔槪皇菍ο笮畔opy一份至數(shù)列某位置。一旦將對象置入容器內(nèi),便損失了該對象的型別信息。
3,容器(Collection)與Map的聯(lián)系與區(qū)別
Collection類型,每個位置只有一個元素。
Map類型,持有 key-value 對(pair),像個小型數(shù)據(jù)庫。
Collections是針對集合類的一個幫助類。提供了一系列靜態(tài)方法實現(xiàn)對各種集合的搜索、排序、線程完全化等操作。相當(dāng)于對Array進(jìn)行類似操作的類——Arrays。
如,Collections.max(Collection coll); 取coll中最大的元素。
Collections.sort(List list); 對list中元素排序
List,Set,Map將持有對象一律視為Object型別。
Collection、List、Set、Map都是接口,不能實例化。繼承自它們的 ArrayList, Vector, HashTable, HashMap是具象class,這些才可被實例化。
vector容器確切知道它所持有的對象隸屬什么型別。vector不進(jìn)行邊界檢查。
總結(jié)二:需要注意的地方
1、Collection只能通過iterator()遍歷元素,沒有g(shù)et()方法來取得某個元素。
2、Set和Collection擁有一模一樣的接口。但排除掉傳入的Collection參數(shù)重復(fù)的元素。
3、List,可以通過get()方法來一次取出一個元素。使用數(shù)字來選擇一堆對象中的一個,get(0)...。(add/get)
4、Map用 put(k,v) /get(k),還可以使用containsKey()/containsValue()來檢查其中是否含有某個key/value。
HashMap會利用對象的hashCode來快速找到key。
哈希碼(hashing)就是將對象的信息經(jīng)過一些轉(zhuǎn)變形成一個獨一無二的int值,這個值存儲在一個array中。我們都知道所有存儲結(jié)構(gòu)中,array查找速度是最快的。所以,可以加速查找。發(fā)生碰撞時,讓array指向多個values。即,數(shù)組每個位置上又生成一個梿表。
5、Map中元素,可以將key序列、value序列單獨抽取出來。
使用keySet()抽取key序列,將map中的所有keys生成一個Set。
使用values()抽取value序列,將map中的所有values生成一個Collection。
為什么一個生成Set,一個生成Collection?那是因為,key總是獨一無二的,value允許重復(fù)。
總結(jié)三:如何選擇從效率角度:
在各種Lists,對于需要快速插入,刪除元素,應(yīng)該使用LinkedList(可用LinkedList構(gòu)造堆棧stack、隊列queue),如果需要快速隨機(jī)訪問元素,應(yīng)該使用ArrayList。最好的做法是以ArrayList作為缺省選擇。Vector總是比ArrayList慢,所以要盡量避免使用。
在各種Sets中,HashSet通常優(yōu)于HashTree(插入、查找)。只有當(dāng)需要產(chǎn)生一個經(jīng)過排序的序列,才用TreeSet。HashTree存在的唯一理由:能夠維護(hù)其內(nèi)元素的排序狀態(tài)。
在各種Maps中HashMap用于快速查找。
最后,當(dāng)元素個數(shù)固定,用Array,因為Array效率是最高的。
所以結(jié)論:最常用的是ArrayList,HashSet,HashMap,Array。
更近一步分析:
如果程序在單線程環(huán)境中,或者訪問僅僅在一個線程中進(jìn)行,考慮非同步的類,其效率較高,如果多個線程可能同時操作一個類,應(yīng)該使用同步的類。要特別注意對哈希表的操作,作為key的對象要同時正確復(fù)寫equals方法和hashCode方法。盡量返回接口而非實際的類型,如返回List而非ArrayList,這樣如果以后需要將ArrayList換成LinkedList時,客戶端代碼不用改變。這就是針對抽象編程。
注:本文參考部分網(wǎng)絡(luò)文獻(xiàn)。
| 
 
 | 
新聞熱點
疑難解答