XML介绍

时间:2022-02-11作者:klpeng分类:Java技术浏览:301评论:0

XML

什么是XML

  • XML 指可扩展标记语言(EXtensible Markup Language

    • 标记:也叫标签,有固定的使用格式
      • <开始标签>标签体</结束标签>
    • 可扩展:标签的名称自己定义,随意
      • <Person>aaa</Person>
      • <afdsafdsafdsafsa>adfadsfads</afdsafdsafdsafsa>
      • <a>aaaa</a>
  • XML 是 W3C (万维网联盟)的推荐标准

    W3C在1988年2月发布1.0版本,2004年2月又发布1.1版本,单因为1.1版本不能向下兼容1.0版本,所以1.1没有人用。同时,在2004年2月W3C又发布了1.0版本的第三版。我们要学习的还是1.0版本。

XML和HXML的主要差异

  • XML:
    • 作用:存储数据,会获取出xml中存储的数据使用
    • 可扩展的,标签的名称可以自定义
  • HTML:
    • 作用:展示数据,给别人看的(页面)
    • 标签的名称都是固定的

XML的组成元素

XML文件中常见的组成元素有:文档声明、元素、属性、注释、转义字符、字符区。

Xml文件扩展名必须为xml

XML语法(重点)

1.)文档声明

<?xml version="1.0"  encoding="UTF-8" ?>
  1. 使用IDE创建xml文件时就带有文档声明.
  2. 文档声明必须为<?xml开头,以?>结束
  3. 文档声明必须从文档的0行0列位置开始
  4. 文档声明中常见的两个属性:
    • version:指定XML文档版本。必须属性,这里一般选择1.0;
    • enconding:指定当前文档的编码,可选属性,默认值是utf-8;

2.)元素element

注意:元素就是标签

格式1:<person>aaaa</person>
格式2:<person/>  空元素 自闭和标签
  1. 元素是XML文档中最重要的组成部分;
  2. 普通元素的结构由开始标签、元素体、结束标签组成。
  3. 元素体:元素体可以是元素,也可以是文本,例如:<person><name>张三</name></person>
  4. 空元素:空元素只有开始标签,而没有结束标签,但元素必须自己闭合,例如:<sex/>
  5. 元素命名
    • 区分大小写
    • 不能使用空格,不能使用冒号
    • 不建议以XML、xml、Xml开头
    • 不能以数字开头
  6. 格式化良好的XML文档,有且仅有一个根元素。
<?xml version="1.0" encoding="UTF-8" ?>
<beans>
    <bean>
        <property></property>
        <property></property>
    </bean>
    <bean>
        <property/>
    </bean>
</beans>

3.)属性attribute

格式:

<person></person>
<person  id="110" age="18"  name="aaa" ></person>
<person id="110" ></person>
  1. 属性是元素的一部分,它必须出现在元素的开始标签中
  2. 属性的定义格式:属性名=“属性值”,其中属性值必须使用单引或双引号括起来
  3. 一个元素可以有0~N个属性,但一个元素中不能出现同名属性
  4. 属性名不能使用空格 , 不要使用冒号等特殊字符,且必须以字母开头
  5. 属性不区分先后顺序,写在前边和写在后边的作用是一样的
<?xml version="1.0" encoding="UTF-8" ?>
<beans>
<bean className="com.llz.demo01.Person">
    <property age="18" name='jack'></property>
    <property name="rose" age="18"></property>
</bean>
<bean className="com.llz.demo01.Student">
    <property name="tom" age="5"></property>
    <property name="jerry" age="3"></property>
</bean>
</beans>

4.)注释

<!--
    xml文件中的注释:
        可以在注释中写一个内容,对代码进行解释说明,方便程序员看
        不会被xml解析器解析(不会被读取出来)
    添加|删除注释的快捷键:
        ctrl+shift+/
 -->
<!--这是定义一个根元素-->
<beans>
    <!--<bean className="com.llz.demo01.Person">
        <property age="18" name='jack'></property>
        <property name="rose" age="18"></property>
    </bean>-->
    <bean className="com.llz.demo01.Student">
        <!--<property name="tom" age="5"></property>-->
        <property name="jerry" age="3"></property>
    </bean>
</beans>

5.)转义字符

Java中的转义字符(了解)

/*
    java中的转义字符: \
    作用:
        1.可以把普通的字符转义为有特殊含义的字符
        2.可以把有特殊含义的字符转换为普通的字符
 */
public class Demo01 {
    public static void main(String[] args) {
        char c1 = 'a';
        System.out.println(c1);

        //1.可以把普通的字符转义为有特殊含义的字符
        char c2 = 't';
        System.out.println(c2);

        System.out.println("你好t我好t大家好");
        System.out.println("你好\t我好\t大家好");//把普通的t转义有有特殊含义的制表符 tab


        //2.可以把有特殊含义的字符转换为普通的字符
        char c3 = '\'';//把有特殊含义的'转换为普通'
        System.out.println(c3);//'
        System.out.println("c:\\a.txt");//把有特殊含义的\使用转义字符编程普通的\

    }
}

XML文件中的转义字符
XML中的转义字符与HTML一样。因为很多符号已经被文档结构所使用,所以在元素体或属性值中想使用这些符号就必须使用转义字符(也叫实体字符),例如:">"、"<"、"’"、"""、"&"。

| < | &lt; | 小于 |
| > | &gt; | 大于 |
| " | &quot; | 双引号 |
| ’ | &apos; | 单引号 |
| & | &amp; | 和号 |

XML文件的约束

在XML技术里,可以编写一个文档来约束一个XML文档的书写规范,这称之为XML约束。

常见的xml约束:DTD、Schema

学习约束文档的目的:根据约束文档写出xml文档

1.)dtd约束文档

DTD是文档类型定义(Document Type Definition)。

DTD约束的作用:约束xml文档中元素属性如何编写
XML介绍

基本使用(重点)

bean.dtd

<?xml version="1.0" encoding="UTF-8"?>
<!--
	模拟spring规范,如果开发人员需要在xml使用当前DTD约束,必须包括DOCTYPE。
	格式如下:
	<!DOCTYPE beans SYSTEM "bean.dtd">
-->
<!ELEMENT beans (bean*,import*) >
<!ELEMENT bean (property*)>
<!ELEMENT property (#PCDATA)>

<!ELEMENT import (#PCDATA)>

<!ATTLIST bean id CDATA #REQUIRED
			   className CDATA #REQUIRED
>

<!ATTLIST property name CDATA #REQUIRED
			   	   value CDATA #REQUIRED
>

<!ATTLIST import resource CDATA #REQUIRED>

复制dtd约束文档到模块中,一般都和xml文档放在同一个文件夹下
XML介绍
demo01-dtd.xml

<?xml version="1.0" encoding="UTF-8" ?>
<!--
    dtd约束文档的使用步骤:
        1.在每个dtd约束文档中都有一个以<!DOCTYPE开头的代码,复制到xml文档中
            <!DOCTYPE beans SYSTEM "bean.dtd">
            a.<!DOCTYPE:是dtd约束文档的固定声明格式
            b.beans:dtd约束文档,约束在xml文件中写根元素必须叫beans
            c.SYSTEM:系统的意思,说明dtd约束文档来源于本地的操作系统中
            d."bean.dtd":dtd约束文档的路径
                一般都会把约束文档和xml文件放在同一个文件夹下
                所以可以直接使用相对路径
       2.根据约束文档的要求,写出根元素
       3.在根元素中,根据提示写出其它的元素(写<就有提示我们可以写什么内容)
-->
<!DOCTYPE beans SYSTEM "bean.dtd">
<beans>
    <bean id="" className="">
        <property name="" value="">
            <!--在dtd文档中写<没有提示,说明只能写文本了-->
            adfadsfa普通文本
        </property>
        <property name="" value="">1</property>
        <property name="" value="">2</property>
        <property name="" value="">3</property>
        <property name="" value="">4</property>
    </bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <bean id="" className=""></bean>
    <import resource=""></import>
    <import resource="">
        只能写文本
    </import>
    <import resource=""></import>
    <import resource=""></import>
    <import resource=""></import>
</beans>

2.)scheme约束

概述
Schema 语言也可作为 XSD(XML Schema Definition)。

Schema 比DTD强大,是DTD代替者。

Schema 本身也是XML文档,但是Schema文档扩展名为xsd,而不是xml。

Schema 功能更强大,数据类型约束更完善。
Schema支持命名空间
XML介绍

schema基本使用(重点)

<?xml version="1.0" encoding="UTF-8"?>
<!-- 
	模拟spring规范,如果开发人员需要在xml使用当前Schema约束,必须包括指定命名空间。
	格式如下:
	<beans xmlns="http://www.baidu.cn/bean"
	   xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
	   xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
	>
-->
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
		targetNamespace="http://www.baiwu.cn/bean"
		xmlns:xsd="http://www.w3.org/2001/XMLSchema"
		xmlns:tns="http://www.weibo.cn/bean" 
		elementFormDefault="qualified">
	<element name="beans">
		<complexType>
			<choice minOccurs="0" maxOccurs="3">
				<element name="bean">
					<complexType>
						<sequence minOccurs="0" maxOccurs="unbounded">
							<element name="property">
								<complexType>
									<attribute name="name" use="optional"></attribute>
									<attribute name="value" use="required"></attribute>
								</complexType>
							</element>
						</sequence>
						<attribute name="id" use="required"></attribute>
						<attribute name="className" use="required"></attribute>
					</complexType>
				</element>
				<element name="import">
					<complexType>
						<attribute name="resource" use="required"></attribute>
					</complexType>
				</element>
			</choice>
		</complexType>
	</element>
</schema>

demo01-schema.xml

<?xml version="1.0" encoding="UTF-8" ?>
<!--
    schema约束文档使用步骤:
        1.在schema约束文档中有一个根元素的开始标签,复制到xml文档中,添加结束标签
        2.在根元素中,根据提示(<出现提示),写出其他的元素和属性
-->
<beans xmlns="http://www.baidu.cn/bean"
       xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
       xsi:schemaLocation="http://www.weibo.cn/bean bean-schema.xsd"
>
    <!--
        写元素的时候,元素的标签体,写任何的内容都报错,说明这个元素是一个自闭和标签
    -->
    <import resource=""/>
    <import resource=""/>
    <import resource=""/>
    <bean id="" className=""></bean>
    <import resource=""></import>
    <bean id="" className="">
        <property value="" name="可选的">嘻嘻</property>
        <property value=""/>
        <property value=""/>
        <property value=""/>
    </bean>
</beans>

XML解析

当将数据存储在XML后,我们就希望通过程序获取XML的内容。使用IO流是可以完成的,不过要非常繁琐的操作才可以完成,且开发中会遇到不同问题(只读、读写)。人们为不同问题提供不同的解析方式,使用不同的解析器进行解析,方便开发人员操作XML

解析方式和解析器

  • 开发中比较常见的解析方式有三种,如下:

    1. DOM:要求解析器把整个XML文档装载到内存,并解析成一个Document对象

      a)优点:元素与元素之间保留结构关系,故可以进行增删改查操作。

      b)缺点:XML文档过大,可能出现内存溢出

    2. SAX:是一种速度更快,更有效的方法。她逐行扫描文档,一边扫描一边解析。并以事件驱动的方式进行具体解析,每执行一行,都触发对应的事件。

      a)优点:处理速度快,可以处理大文件

      b)缺点:只能读,逐行后将释放资源,解析操作繁琐。

    3. PULL:Android内置的XML解析方式,类似SAX。

  • 解析器,就是根据不同的解析方式提供具体实现。有的解析器操作过于繁琐,为了方便开发人员,又提供易于操作的解析开发包。
    XML介绍
    常见的解析开发包

  • JAXP:sun公司提供支持DOM和SAX开发包

  • Dom4j:比较简单的的解析开发包(常用)

  • JDom:与Dom4j类似

  • Jsoup:功能强大DOM方式的XML解析开发包,尤其对HTML解析更加方便。

DOM解析原理及模型结构

XML介绍

使用dom4j解析XML文件(重点)

<?xml version="1.0" encoding="UTF-8"?>
<beans>
	<bean id="001" className="cn.itcast.demo.User">
		<property name="user" value="jack">文本1</property>
		<property name="user" value="rose">文本2</property>
	</bean>
	<bean id="002" className="cn.itcast.demo.Admin">
		<property name="user" value="admin">文本3</property>
		<property name="user" value="write">文本4</property>
	</bean>
</beans>
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.io.SAXReader;

import java.util.List;
/*
    使用dom4j解析xml文件
        获取xml文件中的元素,属性和文本
    解析步骤:
        1.导入dom4j的jar包
        2.创建dom4j核心类对象SAXReader
        3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
        4.使用Document对象中的方法getRootElement获取根元素beans
        5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
        6.遍历List集合,获取每一个bean元素
        7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
        8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
        9.遍历List集合,获取每一个property元素
        10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
        11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
 */
public class Demo01UseDom4jParseXML {
    public static void main(String[] args) throws DocumentException {
        //1.导入dom4j的jar包
        //2.创建dom4j核心类对象SAXReader
        SAXReader sax = new SAXReader();
        //3.使用SAXReader对象中的方法read,读取xml文件到内存中,生成Document对象
        Document document = sax.read("day21\\beans.xml");
        //4.使用Document对象中的方法getRootElement获取根元素beans
        Element rootElement = document.getRootElement();
        System.out.println(rootElement.getName());
        //5.使用根元素Element对象中的方法elements获取根元素benns下边所有的子元素bean,多个bean元素存储到一个List集合中返回
        List<Element> beanElementList = rootElement.elements();
        //6.遍历List集合,获取每一个bean元素
        for (Element beanElement : beanElementList) {
            System.out.println("\t"+beanElement.getName());
            //7.使用bean元素Element中的方法attributeValue,根据属性名获取属性值(id,className)
            String id = beanElement.attributeValue("id");
            String className = beanElement.attributeValue("className");
            System.out.println("\t\tbean元素的属性id:"+id);
            System.out.println("\t\tbean元素的属性className:"+className);
            //8.使用bean元素Element中的方法elements获取bean元素下边的所有子元素property元素,多个property元素存储到一个List集合中返回
            List<Element> propertyElementList = beanElement.elements();
            //9.遍历List集合,获取每一个property元素
            for (Element propertyElement : propertyElementList) {
                System.out.println("\t\t\t"+propertyElement.getName());
                //10.使用property元素Element中的方法attributeValue,根据属性名获取属性值(name,value)
                String name = propertyElement.attributeValue("name");
                String value = propertyElement.attributeValue("value");
                System.out.println("\t\t\t\tproperty元素的属性name:"+name);
                System.out.println("\t\t\t\tproperty元素的属性value:"+value);
                //11.使用property元素Element中的方法getText,获取property元素上的文本(标签体)
                String text = propertyElement.getText();
                System.out.println("\t\t\t\tproperty元素的文本:"+text);
            }
        }
    }
}

结果:

beans
	bean
		bean元素的属性id:001
		bean元素的属性className:cn.itcast.demo.User
			property
				property元素的属性name:user
				property元素的属性value:jack
				property元素的文本:文本1
			property
				property元素的属性name:user
				property元素的属性value:rose
				property元素的文本:文本2
	bean
		bean元素的属性id:002
		bean元素的属性className:cn.itcast.demo.Admin
			property
				property元素的属性name:user
				property元素的属性value:admin
				property元素的文本:文本3
			property
				property元素的属性name:user
				property元素的属性value:write
				property元素的文本:文本4

使用xpath和dom4j快读定位解析xml文件(重点)

beans.xml

<?xml version="1.0" encoding="UTF-8"?>
<beans>
    <bean id="001" className="cn.itcast.demo.User">
        <property name="user" value="jack">文本1</property>
        <property name="user" value="rose">文本2</property>
        <bean id="005" className="cn.itcast.demo.Animal">
            <property name="user" value="小猫">文本9</property>
            <property name="user" value="小狗">文本10</property>
        </bean>
    </bean>
    <bean id="002" className="cn.itcast.demo.Admin">
        <property name="user" value="admin">文本3</property>
        <property name="user" value="write">文本4</property>
    </bean>
    <bean id="003" >
        <property name="user" value="张三">文本5</property>
        <property name="user" value="李四">文本6</property>
    </bean>
    <bean id="004" className="cn.itcast.demo.Student">
        <property name="user" value="王五">文本7</property>
        <property name="user" value="赵六">文本8</property>
    </bean>
</beans>
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.io.SAXReader;

import java.util.List;

/*
    使用xpath和dom4j快读定位解析xml文件
    使用前提:
        xpath使用dom4j中的方法,必须先引入dom4j的jar包
    使用步骤:
        1.导入dom4j和xpath的jar包
        2.创建dom4j核心类对象SAXReader
        3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
        4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
            List selectNodes("xpath表达式") 获取符合表达式的元素集合
            Element selectSingleNode("xpath表达式") 获取符合表达式的唯一元素
            Element extends Node
    常用的xpath表达式:
        第一种查询形式:
            //*:获取所有的元素
        第二种查询方式:
            /AAA/BBB/CCC:表示一层一层获取,获取AAA里边BBB里边的CCC
            /beans/bean
        第三种查询方法:
            //BBB:表示获取和BBB名称相同的,只要是BBB都能获取到
            //bean
        第四种查询方式:
            //BBB[1]:表示获取第一个BBB元素
            //BBB[last()]:表示获取最后一个BBB元素
        第五种查询方式:
            //BBB[@id]:表示只要BBB元素上面有id的属性都能获取到
        第六种查询方式:
            //BBB[@id='002'] :表示元素名称是BBB,在BBB上面有id属性,并且id的属性值是002
 */
public class Demo02UseXpathAndDom4jParseXML {
    public static void main(String[] args) throws DocumentException {
        //1.导入dom4j和xpath的jar包
        //2.创建dom4j核心类对象SAXReader
        SAXReader sax = new SAXReader();
        //3.使用SAXReader对象中的方法read,读取xml文档到内存中,生成Document对象
        Document document = sax.read("day21\\beans.xml");
        //4.使用Document对象中的方法selectNodes|selectSingleNode解析xml文件
        //获取beans下边所有的bean
        List<Element> list01 = document.selectNodes("/beans/bean");
        for (Element beanElement : list01) {
            System.out.println(beanElement.getName()+"\t"+beanElement.attributeValue("id"));
        }
        System.out.println("--------------------");
        //获取beans下边bean中的property
        List<Element> list02 = document.selectNodes("/beans/bean/property");
        for (Element propertyElement : list02) {
            System.out.println(propertyElement.getName()+"\t"+propertyElement.attributeValue("value"));
        }
        System.out.println("--------------------");
        //获取xml文档中所有的元素
        List<Element> list03 = document.selectNodes("//*");
        for (Element element : list03) {
            System.out.println(element.getName());
        }
        System.out.println("--------------------");
        //获取所有bean元素中的第一个bean元素
        Element firstBeanElement = (Element)document.selectSingleNode("//bean[1]");
        System.out.println(firstBeanElement.getName()+"\t"+firstBeanElement.attributeValue("id"));
        //获取所有bean元素中的第最后一个bean元素
        Element lastBeanElement = (Element)document.selectSingleNode("//bean[last()]");
        System.out.println(lastBeanElement.getName()+"\t"+lastBeanElement.attributeValue("id"));
        System.out.println("--------------------");
        //获取所有bean元素中有className属性的
        List<Element> list04 = document.selectNodes("//bean[@className]");
        for (Element element : list04) {
            System.out.println(element.getName()+"\t"+element.attributeValue("id"));
        }
        System.out.println("--------------------");
        //获取所有property元素中有value属性的,并且value属性值是小猫的
        Element catElement = (Element)document.selectSingleNode("//property[@value='小猫']");
        System.out.println(catElement.getName()+"\t"+catElement.attributeValue("value"));
    }
}
打赏
文章版权声明:除非注明,否则均为彭超的博客原创文章,转载或复制请以超链接形式并注明出处。
相关推荐

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

猜你喜欢