1、什么是xml、xml的作用
2、xml的語法
3、DTD約束xml
4、Schema約束xml
5、DOM解析xml
在前面學(xué)習(xí)的html語言,html是超文本標(biāo)記語言,使用html語言規(guī)定好的標(biāo)簽來封裝文本數(shù)據(jù)。而html使用的標(biāo)簽html語言規(guī)定好的,每個標(biāo)簽都有自己特定的功能。
xml語言,可擴(kuò)展的標(biāo)記語言,這門語言它沒有定義任何的標(biāo)記,而標(biāo)記是由使用者自己來定義,但是由于標(biāo)簽名稱以及屬性名稱都由用戶自己來命名,導(dǎo)致別人在使用的時候很不方便。有給xml語言定義了一些約束文檔,這些約束文檔就專門用來約束當(dāng)前這個xml中能夠書寫的具體的標(biāo)簽以及屬性等信息。
xml作用: 1、存儲和傳輸復(fù)雜的關(guān)系模型數(shù)據(jù) 2、作為配置文件存在,xml中主要配置的一些具有復(fù)雜的層級關(guān)系的數(shù)據(jù),PRoperties文件中主要配置的一些key和value這樣的數(shù)據(jù)。 在軟件系統(tǒng)中,作為配置文件使用 為提高系統(tǒng)的靈活性,它所啟動的模塊通常由其配置文件決定 例如一個軟件在啟動時,它需要啟動A、B兩個模塊,而A、B這兩個模塊在啟動時,又分別需要A1、A2和B1、B2模塊的支持,為了準(zhǔn)確描述這種關(guān)系,此時使用XML文件最為合適不過。 <soft> <A> <A1></A1> <A2></A2> </A> <B> <B1></B1> <B2></B2> </B> </soft>
來聲明當(dāng)前的xml類型。<?xml ?> 在這個尖括號中書寫標(biāo)簽的屬性來聲明當(dāng)前的xml類型限定。屬性:版本號 字符編碼 是否是獨立存在的xml文檔<?xml version=”1.0” encoding=”編碼表” standalone=”yes|no” ?>例如:<?xml version=”1.0” encoding=”UTF-8” ?>在定義xml的文檔聲明時 <?之間不能有空白的內(nèi)容 ?> 它們之間也不能有空格中間書寫的屬性使用空格隔開。
xml中的標(biāo)簽也分成單標(biāo)簽和雙標(biāo)簽。注意在xml所有的標(biāo)簽必須閉合。xml中的標(biāo)簽區(qū)別大小寫。<a1> <A1>表示2個不同的標(biāo)簽。xml中的標(biāo)簽可以嵌套,但是不能交差嵌套。<a1><b1></b1></a1><a1><b1></a1></b1>xml的標(biāo)簽只能有一個根標(biāo)簽。同時xml標(biāo)簽中的空白內(nèi)容也會被解析成文本內(nèi)容。<網(wǎng)址>www.itcast.cn</網(wǎng)址>標(biāo)簽不能以數(shù)字開始,不建議以下劃線開始,同時在標(biāo)簽名中不要使用冒號。標(biāo)簽名可以是中文,但是一定指定能夠識別中文的碼表。但不建議書寫中文。
在定義標(biāo)簽的時候,可以在標(biāo)簽上書寫屬性,屬性是由key和alue值組成。屬性名書寫的時候也遵守標(biāo)簽名的規(guī)則。屬性值也不能以數(shù)字開始。屬性和值之間使用=連接,屬性值可以使用單引號也可以使用雙引號。<user uid=”u001” name=”zhang’san”></user>另外:在xml技術(shù)中,標(biāo)簽屬性所代表的信息,也可以改為用子元素的形式來描述,如:<input><type>text</type></input>
xml中的注釋和html注釋相同。<!-- 這里書寫具體的注釋內(nèi)容 -->在eclipse中可以使用ctrl + shift + c 給每行添加注釋,也可以使用ctrl + shift + / 添加注釋 ctrl + shift + / 取消注釋注釋不能加在聲明中及聲明前。
在編寫XML文件時,有些內(nèi)容可能不想讓解析引擎解析執(zhí)行,而是當(dāng)作原始內(nèi)容處理。遇到此種情況,可以把這些內(nèi)容放在CDATA區(qū)里,對于CDATA區(qū)域內(nèi)的內(nèi)容,XML解析程序不會處理,而是直接原封不動的輸出。語法:<![CDATA[ 內(nèi)容 ]]> <![CDATA[ <itcast> <br/> </itcast> ]]>對于一些單個字符,若想顯示其原始樣式,也可以使用轉(zhuǎn)義的形式予以處理。

處理指令,簡稱PI (processing instruction)。處理指令用來指揮解析引擎如何解析XML文檔內(nèi)容。例如,在XML文檔中可以使用xml-stylesheet指令,通知XML解析引擎,應(yīng)用CSS文件顯示xml文檔內(nèi)容。 <?xml-stylesheet type="text/css" href="1.css"?>處理指令必須以“<?”作為開頭,以“?>”作為結(jié)尾,XML聲明語句就是最常見的一種處理指令。
所有xml元素必須有閉合標(biāo)簽;Xml標(biāo)簽區(qū)分大小寫;Xml必須正確地嵌套順序;Xml文檔必須有根元素(且只有一個);Xml屬性值須加引號特殊字符必須轉(zhuǎn)義——CDATA;Xml中的空格、回車換行會被解析!由于xml的標(biāo)簽由用戶自己定義,因此在開發(fā)的時候,每個人都可以根據(jù)自己的需求來定義xml標(biāo)簽,這樣導(dǎo)致項目中的xml難以維護(hù),因此需要使用一定的規(guī)范機制來約束xml文件中的標(biāo)簽書寫。
第一步:先自己定義一個xml文件
<?xml version="1.0" encoding="UTF-8"?><users> <user> <name>zhangsan</name> <age>23</age> <addr>shanghai</addr> </user> <user> <name>lisi</name> <age>24</age> <addr>beijing</addr> </user></users>
第二步:書寫DTD文件來約束xml文件
DTD文件在定義的時候,擴(kuò)展名就是dtd。
在xml文件中有多少個標(biāo)簽,就在dtd中書寫多少個ELEMENT標(biāo)簽
<?xml version="1.0" encoding="UTF-8" ?><!ELEMENT users (user+) ><!ELEMENT user (name,age,addr) ><!ELEMENT name (#PCDATA) ><!ELEMENT age (#PCDATA)><!ELEMENT addr (#PCDATA)>
DTD主要用來約束xml文件,DTD可以單獨寫在文件中,也可以直接定義在xml中,可以在xml中引入第三方的公共DTD。外部DTD的引入方式:外部DTD主要指的一個獨立的DTD文件。首先要書寫DTD文件,然后在要被約束的xml文件中引入。<!DOCTYPE 文檔根結(jié)點 SYSTEM "DTD文件的URL">文檔根結(jié)點 指的是當(dāng)前xml中的根標(biāo)簽。SYSTEM 引入的系統(tǒng)中存在文件"DTD文件的URL" DTD存放的位置引入公共的DTD:<!DOCTYPE 文檔根結(jié)點 PUBLIC "DTD名稱" "DTD文件的URL">文檔根結(jié)點 指的是當(dāng)前xml中的根標(biāo)簽。PUBLIC 表示當(dāng)前引入的DTD是公共的DTD在xml中直接書寫DTD<!DOCTYPE 根標(biāo)簽名 [具體的標(biāo)簽的約束]>
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE users[ <!ELEMENT users (user+) > <!ELEMENT user (name,age,addr) > <!ELEMENT name (#PCDATA) > <!ELEMENT age (#PCDATA) > <!ELEMENT addr (#PCDATA) > ]><users> <user> <name>zhangsan</name> <age>23</age> <addr>shanghai</addr> </user> <user> <name>lisi</name> <age>24</age> <addr>beijing</addr> </user></users>
當(dāng)定義DTD約束xml時候,這時需要在DTD中使用ELEMENT來定義當(dāng)前xml中可以出現(xiàn)的標(biāo)簽名稱。格式:<!ELEMENT 標(biāo)簽名 約束> 約束來限定當(dāng)前標(biāo)簽中可以有的子標(biāo)簽,或者當(dāng)前標(biāo)簽中可以書寫的內(nèi)容在定義標(biāo)簽名的時候,約束中可以使用一些符號標(biāo)簽具體出現(xiàn)次數(shù)? 零次或者一次* 零次或者多次+ 一次或者多次 users (user+) 表示當(dāng)前的users標(biāo)簽下可以有一個或者多個user標(biāo)簽, 用來限定當(dāng)前的子標(biāo)簽出現(xiàn)的順序user (name,age,addr) user標(biāo)簽下只能有name age addr 子標(biāo)簽,并且必須按照name age addr的順序書寫| user (name|age,addr) user下可以name或者age ,但必須有addr,并且addr必須name或age后面#PCDATA 表明該元素可包含任何字符數(shù)據(jù),但不能在其中包含任何子元素。只有 PCDATA 的元素通過圓括號中的 #PCDATA 進(jìn)行聲明EMPTY 表明該元素不能有任何子元素或文本,僅可以使用屬性。ANY 表該元素中可以包含任何DTD中定義的元素內(nèi)容 如:<!ELEMENT note ANY><!ELEMENT age EMPTY > 當(dāng)前的age標(biāo)簽是個空標(biāo)簽,它不能有文本內(nèi)容。
在xml中的標(biāo)簽上是可以書寫屬性的,在DTD中就需要對屬性進(jìn)行約束。格式:<!ATTLIST 標(biāo)簽名 屬性名 屬性的類型 屬性的約束>如果一個標(biāo)簽上有多個屬性<!ATTLIST 標(biāo)簽名 屬性名 屬性的類型 屬性的約束 屬性名 屬性的類型 屬性的約束 屬性名 屬性的類型 屬性的約束><標(biāo)簽名 屬性1=”” 屬性2=”” 屬性3=”” >
屬性的類型:CDATA  屬性的value值可以是文本數(shù)據(jù)(值1 | 值2 | 值3....   )  表示當(dāng)前的屬性的value值只能是當(dāng)前括號中的值ID 表示唯一。對當(dāng)前標(biāo)簽上的id屬性進(jìn)行限定,并且同一個xml中id不能重復(fù) 類型    描述CDATA    值為字符數(shù)據(jù) (character data)(en1|en2|..)    此值是枚舉列表中的一個值ID    值為唯一的 idIDREF    值為另外一個元素的 idIDREFS    值為其他 id 的列表NMTOKEN    值為合法的 XML 名稱NMTOKENS    值為合法的 XML 名稱的列表ENTITY    值是一個實體ENTITIES    值是一個實體列表NOTATION    此值是符號的名稱xml:    值是一個預(yù)定義的 XML 值屬性的約束:REQUIRED 屬性是必須書寫的Implied 屬性是可選得#fixed value 屬性的value是固定的值 “值” 代表屬性的默認(rèn)值user name CDATA fixed “zhangsan”<user name=”zhangsan”>user name CDATA “張三”<user />
屬性的類型和約束的組合:CDATA   REQUIREDCDATA   ImpliedCDATA   fixedCDATA  “值” (值1 | 值2 | 值3....   )  REQUIREDID   REQUIRED實體用于為一段內(nèi)容創(chuàng)建一個別名,以后在XML文檔中就可以使用別名引用這段內(nèi)容了。在DTD定義中,一條<!ENTITY …>語句用于定義一個實體。實體可以理解成java中預(yù)先定義好的一個常量,然后xml文件中就可以引入當(dāng)前這個定義的實體。
<?xml version="1.0" encoding="UTF-8"?><!DOCTYPE users[ <!ELEMENT users (user+) > <!ELEMENT user (name,age,addr) > <!ELEMENT name (#PCDATA) > <!ELEMENT age EMPTY > <!ELEMENT addr (#PCDATA) > <!ATTLIST user id ID #REQUIRED > <!ENTITY abc "上海傳智播客123123">]><users> <user id="u001"> <name>zhangsan</name> <age></age> <addr>&abc;</addr> </user> <user id="u002"> <name>lisi</name> <age/> <addr>&abc;</addr> </user></users>
Schema它也來約束xml文件的,DTD在約束xml的時候一個xml中只能引入一個DTD,同時DTD它無法對屬性以及標(biāo)簽中的數(shù)據(jù)做數(shù)據(jù)類型的限定。Schema它是用來代替DTD來約束xml。Schema文件本身就是使用xml文件書寫的,同時它對需要約束的xml中的數(shù)據(jù)有嚴(yán)格的限定。學(xué)習(xí)Schema主要來學(xué)習(xí)W3C組織定義的如何在Schema中去約束xml的標(biāo)簽以及屬性,還有屬性的數(shù)據(jù)類型,以及標(biāo)簽中子標(biāo)簽的順序。要定義一個Schema文件,這時它的擴(kuò)展名必須是.xsd。在這個文件中根元素必須是schema。使用Schema來約束xml,Schema在書寫的時候,只需要使用W3C組織提前定義的限定標(biāo)簽的,以及限定的屬性的那個標(biāo)簽即可。第一步:書寫xml文件
<?xml version="1.0" encoding="UTF-8"?><books> <book> <name>JavaWEB</name> <author>老畢</author> <price>182</price> </book> <book> <name>SSH</name> <author>老于</author> <price>152</price> </book></books>
第二步:定義schema文件
在定義Schema文件的時候,由于這個Schema文件本身就是xml,它也要受到別的約束。而這個約束是W3C組織提前定義好的,在Schema文件中需要提前引入進(jìn)來在根標(biāo)簽中使用屬性進(jìn)行進(jìn)入:<schema xmlns="http://www.w3.org/2001/XMLSchema" 引入W3C定義的schema書寫的規(guī)范targetNamespace="http://www.itcast.org/book" 給當(dāng)前的Schema文件起名字(命名空間)作用是當(dāng)哪個xml要引入這個schema約束的時候,必須通過當(dāng)前targetNamespace 后面書寫的uri地址來引入
<?xml version="1.0" encoding="UTF-8"?><schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.itcast.org/book" elementFormDefault="qualified"> <element name="books"> <complexType> <sequence> <element name="book"> <complexType> <sequence> <element name="name"></element> <element name="author"></element> <element name="price"></element> </sequence> </complexType> </element> </sequence> </complexType> </element></schema>
第三步:在xml文件中引入當(dāng)前的這個Schema
<books xmlns="http://www.itcast.org/book" 它是schema文件中的targetNamespace 屬性后面的值 xsi:schemaLocation="http://www.itcast.org/book book.xsd" 這個是在引入當(dāng)前的schema文件的真實路徑 xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" 說明當(dāng)前的xml是schema一個實例文檔>
在定義Schema文件的時候,需要在<schema>根標(biāo)簽中使用targetNamespace 屬性定義當(dāng)前schema定義名稱(只是一個分配的名字,根本沒有指向任何文件),在被約束的xml文件中先根據(jù)這個名稱引入當(dāng)前的schema文件,然后在使用xsi:schemaLocation=”” 引入具體的schema文件。(因為targetNamespace屬性定義的schema名稱,只是一個名稱而已,所以在xml文件中需要通過schemaLocation來聲明指定所遵循的Schema文件的具體位置)(xsi:schemaLocation 使用它引入某個schema時,先要使用名稱空間, 空格 ,文件名)名稱空間主要功能是用于來elementFormDefault="qualified|unqualified" 在schema中書寫qualified ,在限定xml中的定義的標(biāo)簽名必須使用定義的名稱空間。unqualified 要求根元素必須使用名稱空間,而子元素不能使用名稱空間。
Book2.xsd
<?xml version="1.0" encoding="UTF-8"?><schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.itcast2.org/book" elementFormDefault="qualified"> <element name="books"> <!--name代表當(dāng)前的xml中可以書寫標(biāo)簽名稱 type數(shù)據(jù)類型--> <complexType ><!-- complexType 當(dāng)前的element聲明的標(biāo)簽是復(fù)雜標(biāo)簽時 ,需要使用complexType來聲明子標(biāo)簽--> <sequence> <!-- 復(fù)雜標(biāo)簽是指有屬性,或者有子標(biāo)簽,或者有屬性有子標(biāo)簽的標(biāo)簽 簡單標(biāo)簽是指只有文本內(nèi)容的標(biāo)簽 <name>zhangsan</name> 簡單標(biāo)簽 <name id="u001"></name> 復(fù)雜標(biāo)簽 sequence 代表當(dāng)前子標(biāo)簽的順序 --> <element name="book" maxOccurs="unbounded"> <complexType mixed="true"><!—mixed屬性值為true,book元素間就可以出現(xiàn)字符文本數(shù)據(jù)了--> <sequence> <element name="name"></element> <element name="author"></element> <element name="price" type="integer"></element> <any></any> </sequence> </complexType> </element> </sequence> </complexType> </element></schema>
Name.xsd
<schema xmlns="http://www.w3.org/2001/XMLSchema" targetNamespace="http://www.example.org/name" elementFormDefault="qualified"> <element name="name"></element></schema>
Book2.xml
<?xml version="1.0" encoding="UTF-8"?><aa:books xmlns:aa="http://www.itcast2.org/book" xmlns:bb="http://www.example.org/name" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.itcast2.org/book book2.xsd http://www.example.org/name name.xsd" > <aa:book> aa:sjdlkfjlkdsjflk <aa:name >JavaWEB</aa:name> <aa:author >老畢</aa:author> <aa:price>182</aa:price> <bb:name>sdgs</bb:name> </aa:book></aa:books>
w3c組織在定義xml的時候,就規(guī)范了如何去解析xml文件,其中就定義了使用dom技術(shù)來解析xml文件。DOM:Document Object Medel。文檔對象模型。w3c給出的dom解析,第一步是先把整個xml文件加載到內(nèi)存,然后在內(nèi)存中形成了一顆dom樹。特點:    一次將所有數(shù)據(jù)全部加載到內(nèi)存中;    對xml文檔中每個節(jié)點都當(dāng)成一個Node對象處理。包括元素、文本、屬性。    缺點就是當(dāng)文檔數(shù)據(jù)量很大時,對內(nèi)存有占用很大,所以不適合解析大量的數(shù)據(jù)。Xml文檔的屬性結(jié)構(gòu)

DOM解析是把整個xml文檔加載到內(nèi)存中,然后形成一個dom樹,這樣就可以獲取樹中的所有標(biāo)簽,屬性,文本內(nèi)容。Java實現(xiàn)了相應(yīng)的dom解析技術(shù):  使用Java提供的Dom技術(shù)來解析xml文件    DocumentBuilderFactory:這個是一個工廠類,主要負(fù)責(zé)生產(chǎn)一個解析xml的解析器對象      newDocumentBuilder()靜態(tài)方法可以獲取到一個用于解析xml的解析器對象          DocumentBuilderFactory.newDocumentBuilder();          獲取到了DocumentBuilder對象    DocumentBuilder 這個類可以從xml中獲得DOM對象          使用parse方法解析一個文件路徑,就可以得到當(dāng)前xml文件對象  解析xml文件首先要獲取到xml文件對象即就是Document對象// 獲取DOM標(biāo)簽的信息 @Test public void get() throws Exception { // 獲取工廠實例對象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // 獲取解析器對象 DocumentBuilder db = dbf.newDocumentBuilder(); // 解析xml獲取dom對象 Document dom = db.parse("book.xml"); // 獲取根元素: Node node = dom.getFirstChild(); // 獲取標(biāo)簽的名字 System.out.println(node.getNodeName()); // 獲取到每個標(biāo)簽對象,都是一個element的實例對象 Element root = (Element) node; // 獲取books下面的所有book標(biāo)簽 NodeList nl = root.getElementsByTagName("book"); for (int i = 0; i < nl.getLength(); i++) { // 獲取到每個book標(biāo)簽對象 Element book = (Element) nl.item(i); // NodeList book_child = book.getChildNodes(); Element name = (Element) book.getElementsByTagName("name").item(0); Element author = (Element) book.getElementsByTagName("author") .item(0); Element price = (Element) book.getElementsByTagName("price") .item(0); // 獲取name標(biāo)簽下的文本值 System.out.println(name.getTextContent()); // 獲取標(biāo)簽上的屬性值 System.out.println(name.getAttribute("id")); // 獲取author標(biāo)簽下的文本值 System.out.println(author.getTextContent()); // 獲取price標(biāo)簽下的文本值 System.out.println(price.getTextContent()); System.out.println("-------------------"); } }
/* * 修改dom中標(biāo)簽的信息 * 把books中的第二個book標(biāo)簽中的price的值改為100 * */ @Test public void update() throws Exception { // 獲取工廠實例對象 DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance(); // 獲取解析器對象 DocumentBuilder db = dbf.newDocumentBuilder(); // 解析xml獲取dom對象 Document dom = db.parse("book.xml"); //使用dom樹直接根據(jù)標(biāo)簽名獲取對應(yīng)的標(biāo)簽對象 Element book = (Element) dom.getElementsByTagName("book").item(1); //獲取price標(biāo)簽 Element price = (Element) book.getElementsByTagName("price").item(0); price.setTextContent("100"); System.out.println(price.getTextContent()); //把修改的整個dom樹重新寫到文件中 TransformerFactory tff = TransformerFactory.newInstance(); //獲取轉(zhuǎn)換器 Transformer transformer = tff.newTransformer(); //和文件關(guān)聯(lián)出去結(jié)果對象 StreamResult sr = new StreamResult("book.xml"); //把dom轉(zhuǎn)成原始數(shù)據(jù)對象 DOMSource ds = new DOMSource(dom); //保存數(shù)據(jù) transformer.transform(ds, sr); }
當(dāng)要把修改后的xml中的數(shù)據(jù)保存到xml中需要使用Transformer 類中的transform方法
TransformerFactory這個工廠負(fù)責(zé)生產(chǎn)一個把dom樹寫到文件中的對象
Transformer 負(fù)責(zé)把一個dom寫到文件中。
總結(jié):
Java提供的dom操作方式:
第一步:需要獲取到相應(yīng)的工廠
第二步:根據(jù)工廠獲取相應(yīng)的工具或者解析器對象
第三步:根據(jù)解析器獲取dom對象,再操作dom樹中的節(jié)點,或者是獲取到相應(yīng)的工具,然后使用工具對dom樹進(jìn)行保存等操作
新聞熱點
疑難解答