解析xml文件的三种方式,python怎么解析xml文件

解析xml文件的三种方式,python怎么解析xml文件详细介绍

本文目录一览： XML的XmlPullParser解析

xml文件的解析有三种方式：
以下使用XmlPullParser来进行解析。
xml可以用在内容判断的时候，比如多种显示例如a客户需要123 b客户只需要23
xml的读取方式： 1.获取当前的xml 2.对当前的xml以文档的形式进行遍历
想要读取xml需要使用XmlPullParser
这里需要注意的是XmlResourceParser构建的xmlPullParser不再需要额外设置解码类型和xml。可以直接获取。
存放在res下，存放的目录不同读取的情况也不同。
XmlResourceParser在得到xml内容后不需要再设置解码方式。 XmlResourceParser是继承了XmlPullParser的
一般情况在本地的xml读取会判断一下xml是否存在。
下面以存放在raw目录下，使用XmlPullParserFactory来进行读取的方法
首先是xml
知识点补充：
如果还存在不懂的地方可以联系一下作者，我会帮忙解答！

android中怎么解析复杂的xml文件

本文主要讲解Android开发中如何对XML文件的解析，由于XML文件具有与平台无关，广泛应用于数据通信中，因此解析XML文件就显得很有意义。Android对XML文件解析的方法主要有3种。通常有三种方式:DOM、SAX和PULL，下面就分别针对这三种方式来进行讨论。
文件内容如下所示：
那么就是要对此XML文件做解析。下面我们就分别用DOM,SAX和PULL三种方式，分别对此XML文件做解析。
DOM方式
DOM方式解析xml是先把xml文档都读到内存中，然后再用DOM API来访问树形结构，并获取数据。由DOM解析的方式可以知道，如果XML文件很大的时候，处理效率就会变得比较低，这也是DOM方式的一个缺点。
现在我们来解析上文中提到的有关天气预报信息相关的xml文件。什么是解析呢？说的通俗一点，就是将这个带标签的XML文件识别出来，并抽取一些相关的，对我们有用的信息来给我们使用。那在这个文件里，时间，天气，温度，以及图标对我们来说是需要得到的。我们要对其做解析。
解析的具体思路是：
1. 将XML文件加载进来。
2. 获取文档的根节点
3. 获取文档根节点中所有子节点的列表
4. 获取子节点列表中需要读取的节点信息
根据这4个步骤，我们进行开发：
首先就是如何加载XML文件，假设此文件来源于网络。
SAX方式
SAX是Simple API for XML的缩写。是一个包也可以看成是一些接口。
相比于DOM而言SAX是一种速度更快，更有效，占用内存更少的解析XML文件的方法。它是逐行扫描，可以做到边扫描边解析，因此SAX可以在解析文档的任意时刻停止解析。非常适用于Android等移动设备。
SAX是基于事件驱动的。所谓事件驱动就是说，它不用解析完整个文档，在按内容顺序解析文档过程中，SAX会判断当前读到的字符是否符合XML文件语法中的某部分。如果符合某部分，则会触发事件。所谓触发事件，就是调用一些回调方法。当然android的事件机制是基于回调方法的，在用SAX解析xml文档时候，在读取到文档开始和结束标签时候就会回调一个事件，在读取到其他节点与内容时候也会回调一个事件。在SAX接口中，事件源是org.xml.sax包中的XMLReader，它通过parser()方法来解析XML文档，并产生事件。事件处理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler，以及EntityResolver这4个接口。
这四个接口的详细说明如下：
事件处理器名称

事件处理器处理的事件

XMLReader注册方法

ContentHander

XML文档的开始与结束，
XML文档标签的开始与结束，接收字符数据，跳过实体，接收元素内容中可忽略的空白等。

setContentHandler(ContentHandler h)

DTDHander

处理DTD解析时产生的相应事件

setDTDHandler(DTDHandler h)

ErrorHandler

处理XML文档时产生的错误

setErrorHandler(ErrorHandler h)

EntityResolver

处理外部实体

setEntityResolver(EntityResolver e)

我们用来做内容解析的回调方法一般都定义在ContentHandler接口中。
ContentHandler接口常用的方法：
startDocument()
当遇到文档的开头的时候，调用这个方法，可以在其中做一些预处理的工作。
endDocument()
当文档结束的时候，调用这个方法，可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName,String qName, Attributes atts)
当读到开始标签的时候，会调用这个方法。namespaceURI就是命名空间，localName是不带命名空间前缀的标签名，qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。
endElement(String uri, String localName, String name)
在遇到结束标签的时候，调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容。例如：
主要目的是获取high标签中的值。
第一个参数用于存放文件的内容，后面两个参数是读到的字符串在这个数组中的起始位置和长度，使用new String(ch,start,length)就可以获取内容。
注意：
SAX的一个重要特点就是它的流式处理，当遇到一个标签的时候，它并不会纪录下之前所碰到的标签，即在startElement()方法中，所有能够知道的信息，就是标签的名字和属性，至于标签的嵌套结构，上层标签的名字，是否有子元属等等其它与结构相关的信息，都是不知道的，都需要你的程序来完成。这使得SAX在编程处理上没有DOM方便。
现在我们截取一段XML文件来做解析，其调用方法是这样的：
----------> startDocument()

----------> startElement

----------> startElement

beijing ----------> characters

----------> endElement

----------> endElement

----------> endElement
文档结束 ----------> endDocument()
SAX的解析步骤：
首先需要注意的是：
SAX还为其制定了一个Helper类：DefaultHandler它实现了ContentHandler这个接口，但是其所有的方法体都为空，在实现的时候，你只需要继承这个类，然后重载相应的方法即可。
使用SAX解析XML文件一般有以下五个步骤：
1、创建一个SAXParserFactory对象；
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象；
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象；
4、实例化一个DefaultHandler对象
5、连接事件源对象XMLReader到事件处理类DefaultHandler中
6、调用XMLReader的parse方法从输入源中获取到的xml数据
7、通过DefaultHandler返回我们需要的数据集合。
我们仍然来解析上述那个天气预报的XML文件。
编写代码如下：
[java] view plaincopy
mySAX.setOnClickListener(new Button.OnClickListener(){
@Override
public void onClick(View v) {
try{
String url = "http://www.google.com/ig/api?&weather=beijing";
DefaultHttpClient client = new DefaultHttpClient();
HttpUriRequest req = new HttpGet(url);
HttpResponse resp = client.execute(req);
HttpEntity ent = resp.getEntity();
InputStream stream = ent.getContent(); //将文件导入流，因此用InputStream

SAXParserFactory saxFactory = SAXParserFactory.newInstance(); //获取一个对象
SAXParser saxParser = saxFactory.newSAXParser();//利用获取到的对象创建一个解析器
XMLContentHandler handler = new XMLContentHandler();//设置defaultHandler
saxParser.parse(stream, handler);//进行解析
stream.close();//关闭流
/*XMLReader xmlReader = saxFactory.newSAXParser().getXMLReader(); //获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(new InputSource(stream));
stream.close();*/
}catch(Exception e){
e.printStackTrace();
}
}
});
}
public class XMLContentHandler extends DefaultHandler {
private static final String TAG = "XMLContentHandler";

@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
Log.i(TAG, "解析内容："+new String(ch,start,length));
}
@Override
public void endDocument() throws SAXException {
super.endDocument();
Log.i(TAG, "文档解析完毕。");
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
Log.i(TAG, localName+"解析完毕");
}
@Override
public void startDocument() throws SAXException {
Log.i(TAG, "开始解析... ...");
}
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
Log.i(TAG, "解析元素："+localName);

if(localName.equals("high")){
Log.i(TAG, "解析元素："+localName);
i++;
if(i==2){
highestTmp.setText(String.valueOf((Integer.parseInt(attributes.getValue(0))-32)*5/9));
}
}
}
}
上面的那段注释：
[java] view plaincopy
/*XMLReader xmlReader =saxFactory.newSAXParser().getXMLReader(); //获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(newInputSource(stream));
stream.close();*/
是用XMLReader来做解析的另外一种方法。效果是一样的。这里可以传流，也可以传一个字符串，如下所示：是传字符串。
[java] view plaincopy
xmlReader.parse(new InputSource(new StringReader(xmlStr)));
PULL方式
除了可以使用 SAX和DOM解析XML文件，也可以使用Android内置的Pull解析器解析XML文件。 Pull解析器的运行方式与 SAX 解析器相似。它也是事件触发的。Pull解析方式让应用程序完全控制文档该怎么样被解析。比如开始和结束元素事件，使用parser.next()可以进入下一个元素并触发相应事件。通过Parser.getEventType()方法来取得事件的代码值，解析是在开始时就完成了大部分处理。事件将作为数值代码被发送，因此可以使用一个switch对感兴趣的事件进行处理。
Pull解析是一个遍历文档的过程，每次调用next()，nextTag(), nextToken()和nextText()都会向前推进文档，并使Parser停留在某些事件上面，但是不能倒退。然后把文档设置给Parser。
Android中对Pull方法提供了支持的API，主要是
org.xmlpull.v1.XmlPullParser;
org.xmlpull.v1.XmlPullParserFactory;
二个类，其中主要使用的是XmlPullParser，XmlPullParserFactory是一个工厂，用于构建XmlPullParser对象。
应用程序通过调用XmlPullParser.next()等方法来产生Event，然后再处理Event。
我们仍然拿上述天气预报的XML文件的一部分来做例子。
例如：需要解析的XML文件是：
[java] view plaincopy

这部分XML文件中day_of_week,low,high等是TAG，data是ATTRIBUTEA。当然，如果有<>夹在开始和结束符号之间的部分，则为TXET。
要想解析文档先要构建一个XmlPullParser对象。
[java] view plaincopy
final XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
factory.setNamespaceAware(true);
final XmlPullParser parser = factory.newPullParser();
parser.setInput(new StringReader("xmlStr");
这里的xmlStr就是上边的XML文件。
此时，文档刚被初始化，所以它应该位于文档的开始，事件为START_DOCUMENT，可以通过XmlPullParser.getEventType()来获取。然后调用next()会产生
START_TAG，这个事件告诉应用程序一个标签已经开始了，调用getName()会返回" day_of_week ";若有TEXT，则再next()会产生TEXT事件，调用getText()会返回TEXT，由于此处没有，所以再next()，会产生END_TAG，这个告诉你一个标签已经处理完了，再next()直到最后处理完TAG，会产生END_DOCUMENT，它告诉你整个文档已经处理完成了。除了next()外，nextToken()也可以使用，只不过它会返回更加详细的事件，比如COMMENT, CDSECT, DOCDECL, ENTITY等等非常详细的信息。如果程序得到比较底层的信息，可以用nextToken()来驱动并处理详细的事件。需要注意一点的是TEXT事件是有可能返回空白的White Spaces比如换行符或空格等。
nextTag()--会忽略White Spaces，如果可以确定下一个是START_TAG或END_TAG，就可以调用nextTag()直接跳过去。通常它有二个用处：当START_TAG时，如果能确定这个TAG含有子TAG，那么就可以调用nextTag()产生子标签的START_TAG事件；当END_TAG时，如果确定不是文档结尾，就可以调用nextTag()产生下一个标签的START_TAG。在这二种情况下如果用next()会有TEXT事件，但返回的是换行符或空白符。
nextText()--只能在START_TAG时调用。当下一个元素是TEXT时，TEXT的内容会返回；当下一个元素是END_TAG时，也就是说这个标签的内容为空，那么空字串返回；这个方法返回后，Parser会停在END_TAG上。
小结一下，如果在一个XML文档中我们只需要前面一部分数据，但是使用SAX方式或DOM方式会对整个文档进行解析，尽管XML文档中后面的大部分数据我们其实都不需要解析，因此这样实际上就浪费了处理资源。使用PULL方式正合适。
当点击三种方式的任何一个按钮时，均能够得到相同的结果

python怎么解析xml文件

python对XML的解析
常见的XML编程接口有DOM和SAX，这两种接口处理XML文件的方式不同，当然使用场合也不同。
python有三种方法解析XML，SAX，DOM，以及ElementTree:
1.SAX (simple API for XML )
python 标准库包含SAX解析器，SAX用事件驱动模型，通过在解析XML的过程中触发一个个的事件并调用用户定义的回调函数来处理XML文件。
2.DOM(Document Object Model)
将XML数据在内存中解析成一个树，通过对树的操作来操作XML。
3.ElementTree(元素树)
ElementTree就像一个轻量级的DOM，具有方便友好的API。代码可用性好，速度快，消耗内存少。
注：因DOM需要将XML数据映射到内存中的树，一是比较慢，二是比较耗内存，而SAX流式读取XML文件，比较快，占用内存少，但需要用户实现回调函数（handler）。

在java中解析xml有哪几种方法

1、JDOM生成和解析XML
为减少DOM、SAX的编码量,出现了JDOM
优点:20-80原则,极大减少了代码量。
使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。
2、SAX生成和解析XML文档
为解决DOM的问题,出现了SAX,SAX 事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少。SAX解析器代码比DOM解析器代码小,适于Applet下载。
缺点:不是持久的,事件过后若没保存数据,那么数据就丢了。无状态性,从事件中只能得到文本,但不知该文本属于哪个元素。
使用场合:Applet。只需XML文档的少量内容,很少回头访问,机器内存少。
3、DOM生成和解析XML文档
为XML文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作,支持删除、修改、重新排列等多种功能。
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间。
使用场合:一旦解析了文档还需多次访问这些数据,硬件资源充足(内存、CPU)。
4、DOM4J生成和解析XML文档
DOM4J
是一个非常非常优秀的Java XML
API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J
来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。
DOM
DOM Document Object Model 文档对象模型。
SAX
SAX的全称是Simple API for XML,即XML简单应用程序接口
SAX的工作原理
SAX的工作原理简单地说就是对文档进行顺序扫描，
PULL解析(Android)
PULL解析器的运行方式和SAX类似，都是基于事件的模式
SAX解析
我会在项目的assets目录中放置一个XML文档person.xml，
(1)DOM解析
DOM是html和xml的应用程序接口(API)，以层次结构（类似于树型）来组织节点和信息片段，映射XML文档的结构，允许获取
和操作文档的任意部分，是W3C的官方标准
【优点】
①允许应用程序对数据和结构做出更改。
②访问是双向的，可以在任何时候在树中上下导航，获取和操作任意部分的数据。
【缺点】
①通常需要加载整个XML文档来构造层次结构，消耗资源大。
【解析详解】
①构建Document对象：
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = bdf.newDocumentBuilder();
InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);
Document doc = bd.parse(is);
②遍历DOM对象
Document： XML文档对象，由解析器获取
NodeList：节点数组
Node：节点(包括element、#text)
Element：元素，可用于获取属性参数
(2)SAX(Simple API for XML)解析
流模型中的"推"模型分析方式。通过事件驱动，每发现一个节点就引发一个事件，事件推给事件处理器，通过回调方法
完成解析工作，解析XML文档的逻辑需要应用程序完成
【优势】
①不需要等待所有数据都被处理，分析就能立即开始。
②只在读取数据时检查数据，不需要保存在内存中。
③可以在某个条件得到满足时停止解析，不必解析整个文档。
④效率和性能较高，能解析大于系统内存的文档。
【缺点】
①需要应用程序自己负责TAG的处理逻辑（例如维护父/子关系等），文档越复杂程序就越复杂。
②单向导航，无法定位文档层次，很难同时访问同一文档的不同部分数据，不支持XPath。
【原理】
简单的说就是对文档进行顺序扫描，当扫描到文档(document)开始与结束、元素(element)开始与结束时通知事件
处理函数(回调函数)，进行相应处理，直到文档结束
【事件处理器类型】
①访问XML DTD：DTDHandler
②低级访问解析错误：ErrorHandler
③访问文档内容：ContextHandler
【DefaultHandler类】
SAX事件处理程序的默认基类，实现了DTDHandler、ErrorHandler、ContextHandler和EntityResolver接口，通常
做法是，继承该基类，重写需要的方法，如startDocument()
【创建SAX解析器】
SAXParserFactory saxf = SAXParserFactory.newInstance();
SAXParser sax = saxf.newSAXParser();
注：关于遍历
①深度优先遍历(Depthi-First Traserval)
②广度优先遍历(Width-First Traserval)
(3)JDOM(Java-based Document Object Model)
Java特定的文档对象模型。自身不包含解析器，使用SAX
【优点】
①使用具体类而不是接口，简化了DOM的API。
②大量使用了Java集合类，方便了Java开发人员。
【缺点】
①没有较好的灵活性。
②性能较差。
(4)DOM4J(Document Object Model for Java)
简单易用，采用Java集合框架，并完全支持DOM、SAX和JAXP
【优点】
①大量使用了Java集合类，方便Java开发人员，同时提供一些提高性能的替代方法。
②支持XPath。
③有很好的性能。
【缺点】
①大量使用了接口，API较为复杂。
(5)StAX(Streaming API for XML)
流模型中的拉模型分析方式。提供基于指针和基于迭代器两种方式的支持,JDK1.6新特性
【和推式解析相比的优点】
①在拉式解析中，事件是由解析应用产生的，因此拉式解析中向客户端提供的是解析规则，而不是解析器。
②同推式解析相比，拉式解析的代码更简单，而且不用那么多库。
③拉式解析客户端能够一次读取多个XML文件。
④拉式解析允许你过滤XML文件和跳过解析事件。
【简介】
StAX API的实现是使用了Java Web服务开发（JWSDP）1.6，并结合了Sun Java流式XML分析器(SJSXP)-它位于
javax.xml.stream包中。XMLStreamReader接口用于分析一个XML文档，而XMLStreamWriter接口用于生成一个
XML文档。XMLEventReader负责使用一个对象事件迭代子分析XML事件-这与XMLStreamReader所使用的光标机制
形成对照。

如何解析XML文件

1. 介绍
1）DOM(JAXP Crimson解析器)

DOM是用与平台和语言无关的方式表示XML文档的官方W3C标准。DOM是以层次结构组织的节点或信息片断的集合。这个层次结构允许开发人员在树中寻找
特定信息。分析该结构通常需要加载整个文档和构造层次结构，然后才能做任何工作。由于它是基于信息层次的，因而DOM被认为是基于树或基于对象的。DOM
以及广义的基于树的处理具有几个优点。首先，由于树在内存中是持久的，因此可以修改它以便应用程序能对数据和结构作出更改。它还可以在任何时候在树中上下
导航，而不是像SAX那样是一次性的处理。DOM使用起来也要简单得多。
2）SAX

SAX处理的优点非常类似于流媒体的优点。分析能够立即开始，而不是等待所有的数据被处理。而且，由于应用程序只是在读取数据时检查数据，因此不需要将数
据存储在内存中。这对于大型文档来说是个巨大的优点。事实上，应用程序甚至不必解析整个文档；它可以在某个条件得到满足时停止解析。一般来说，SAX还比
它的替代者DOM快许多。
　　选择DOM还是选择SAX？对于需要自己编写代码来处理XML文档的开发人员来说，选择DOM还是SAX解析模型是一个非常重要的设计决策。 DOM采用建立树形结构的方式访问XML文档，而SAX采用的事件模型。
　　DOM解析器把XML文档转化为一个包含其内容的树，并可以对树进行遍历。用DOM解析模型的优点是编程容易，开发人员只需要调用建树的指令，然后利
用navigation APIs访问所需的树节点来完成任务。可以很容易的添加和修改树中的元素。然而由于使用DOM解析器的时候需要处理整个XML文
档，所以对性能和内存的要求比较高，尤其是遇到很大的XML文件的时候。由于它的遍历能力，DOM解析器常用于XML文档需要频繁的改变的服务中。
　　SAX解析器采用了基于事件的模型，它在解析XML文档的时候可以触发一系列的事件，当发现给定的tag的时候，它可以激活一个回调方法，告诉该方法
制定的标签已经找到。SAX对内存的要求通常会比较低，因为它让开发人员自己来决定所要处理的tag。特别是当开发人员只需要处理文档中所包含的部分数据
时，SAX这种扩展能力得到了更好的体现。但用SAX解析器的时候编码工作会比较困难，而且很难同时访问同一个文档中的多处不同数据。
3）JDOM http://www.jdom.org/

JDOM的目的是成为Java特定文档模型，它简化与XML的交互并且比使用DOM实现更快。由于是第一个Java特定模型，JDOM一直得到大力推广和
促进。正在考虑通过“Java规范请求JSR-102”将它最终用作“Java标准扩展”。从2000年初就已经开始了JDOM开发。
　　JDOM与DOM主要有两方面不同。首先，JDOM仅使用具体类而不使用接口。这在某些方面简化了API，但是也限制了灵活性。第二，API大量使用了Collections类，简化了那些已经熟悉这些类的Java开发者的使用。
　　JDOM文档声明其目的是“使用20%(或更少)的精力解决80%(或更多)Java/XML问题”(根据学习曲线假定为20%)。JDOM对于大多
数Java/XML应用程序来说当然是有用的，并且大多数开发者发现API比DOM容易理解得多。JDOM还包括对程序行为的相当广泛检查以防止用户做任
何在XML中无意义的事。然而，它仍需要您充分理解XML以便做一些超出基本的工作(或者甚至理解某些情况下的错误)。这也许是比学习DOM或JDOM接
口都更有意义的工作。
　　JDOM自身不包含解析器。它通常使用SAX2解析器来解析和验证输入XML文档(尽管它还可以将以前构造的DOM表示作为输入)。它包含一些转换器
以将JDOM表示输出成SAX2事件流、DOM模型或XML文本文档。JDOM是在Apache许可证变体下发布的开放源码。
4）DOM4J http://dom4j.sourceforge.net/

虽然DOM4J代表了完全独立的开发结果，但最初，它是JDOM的一种智能分支。它合并了许多超出基本XML文档表示的功能，包括集成的XPath支持、
XML Schema支持以及用于大文档或流化文档的基于事件的处理。它还提供了构建文档表示的选项，它通过DOM4J
API和标准DOM接口具有并行访问功能。从2000下半年开始，它就一直处于开发之中。
　　为支持所有这些功能，DOM4J使用接口和抽象基本类方法。DOM4J大量使用了API中的Collections类，但是在许多情况下，它还提供一
些替代方法以允许更好的性能或更直接的编码方法。直接好处是，虽然DOM4J付出了更复杂的API的代价，但是它提供了比JDOM大得多的灵活性。
　　在添加灵活性、XPath集成和对大文档处理的目标时，DOM4J的目标与JDOM是一样的：针对Java开发者的易用性和直观操作。它还致力于成为
比JDOM更完整的解决方案，实现在本质上处理所有Java/XML问题的目标。在完成该目标时，它比JDOM更少强调防止不正确的应用程序行为。
　　DOM4J是一个非常非常优秀的Java XML
API，具有性能优异、功能强大和极端易用使用的特点，同时它也是一个开放源代码的软件。如今你可以看到越来越多的Java软件都在使用DOM4J来读写
XML，特别值得一提的是连Sun的JAXM也在用DOM4J。
2.. 比较
1）DOM4J性能最好，连Sun的JAXM也在用DOM4J。目前许多开源项目中大量采用DOM4J，例如大名鼎鼎的Hibernate也用DOM4J来读取XML配置文件。如果不考虑可移植性，那就采用DOM4J.
2）JDOM和DOM在性能测试时表现不佳，在测试10M文档时内存溢出。在小文档情况下还值得考虑使用DOM和JDOM。虽然JDOM的开发者已经说明
他们期望在正式发行版前专注性能问题，但是从性能观点来看，它确实没有值得推荐之处。另外，DOM仍是一个非常好的选择。DOM实现广泛应用于多种编程语
言。它还是许多其它与XML相关的标准的基础，因为它正式获得W3C推荐(与基于非标准的Java模型相对)，所以在某些类型的项目中可能也需要它(如在
JavaScript中使用DOM)。
3）SAX表现较好，这要依赖于它特定的解析方式－事件驱动。一个SAX检测即将到来的XML流，但并没有载入到内存(当然当XML流被读入时，会有部分文档暂时隐藏在内存中)。
3. 四种xml操作方式的基本使用方法
[java] view plain copy
xml文件：

1）DOM

import java.io.*;

import java.util.*;

import org.w3c.dom.*;

import javax.xml.parsers.*;

public class MyXMLReader{

　public static void main(String arge[]){

　　long lasting =System.currentTimeMillis();

　　try{

　　　File f=new File("data_10k.xml");

　　　DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();

　　　DocumentBuilder builder=factory.newDocumentBuilder();

　　　Document doc = builder.parse(f);

　　　NodeList nl = doc.getElementsByTagName("VALUE");

　　　for (int i=0;i＜nl.getLength();i++){

　　　　System.out.print("车牌号码:" + doc.getElementsByTagName("NO").item(i).getFirstChild().getNodeValue());

　　　　System.out.println("车主地址:" + doc.getElementsByTagName("ADDR").item(i).getFirstChild().getNodeValue());

　　}

　　}catch(Exception e){

　　　e.printStackTrace();

}

2）SAX

import org.xml.sax.*;

import org.xml.sax.helpers.*;

import javax.xml.parsers.*;

public class MyXMLReader extends DefaultHandler {

　java.util.Stack tags = new java.util.Stack();

　public MyXMLReader() {

　　super();

}

　public static void main(String args[]) {

　　long lasting = System.currentTimeMillis();

　　try {

　　　SAXParserFactory sf = SAXParserFactory.newInstance();

　　　SAXParser sp = sf.newSAXParser();

　　　MyXMLReader reader = new MyXMLReader();

　　　sp.parse(new InputSource("data_10k.xml"), reader);

　　} catch (Exception e) {

　　　e.printStackTrace();

　　}

　　System.out.println("运行时间：" + (System.currentTimeMillis() - lasting) + "毫秒");}

　　public void characters(char ch[], int start, int length) throws SAXException {

　　String tag = (String) tags.peek();

　　if (tag.equals("NO")) {

　　　System.out.print("车牌号码：" + new String(ch, start, length));

}

if (tag.equals("ADDR")) {

　　System.out.println("地址:" + new String(ch, start, length));

}

}

　　public void startElement(String uri,String localName,String qName,Attributes attrs) {

　　tags.push(qName);}

}

阅读更多 >>> word变成xml怎么改回来,doc转xml

3） JDOM

import java.io.*;

import java.util.*;

import org.jdom.*;

import org.jdom.input.*;

public class MyXMLReader {

　public static void main(String arge[]) {

　　long lasting = System.currentTimeMillis();

　　try {

　　　SAXBuilder builder = new SAXBuilder();

　　　Document doc = builder.build(new File("data_10k.xml"));

　　　Element foo = doc.getRootElement();

　　　List allChildren = foo.getChildren();

　　　for(int i=0;i＜allChildren.size();i++) {

　　　　System.out.print("车牌号码:" + ((Element)allChildren.get(i)).getChild("NO").getText());

　　　　System.out.println("车主地址:" + ((Element)allChildren.get(i)).getChild("ADDR").getText());

　　　}

　　} catch (Exception e) {

　　　e.printStackTrace();

}

}

4）DOM4J

import java.io.*;

import java.util.*;

import org.dom4j.*;

import org.dom4j.io.*;

public class MyXMLReader {

　public static void main(String arge[]) {

　　long lasting = System.currentTimeMillis();

　　try {

　　　File f = new File("data_10k.xml");

　　　SAXReader reader = new SAXReader();

　　　Document doc = reader.read(f);

　　　Element root = doc.getRootElement();

　　　Element foo;

　　　for (Iterator i = root.elementIterator("VALUE"); i.hasNext();) {

　　　　foo = (Element) i.next();

　　　　System.out.print("车牌号码:" + foo.elementText("NO"));

　　　　System.out.println("车主地址:" + foo.elementText("ADDR"));

　　　}

　　} catch (Exception e) {

　　　e.printStackTrace();

}

}

Android 中有哪几种解析 xml 的类，官方推荐哪种

在Android中提供了三种解析XML的方式:SAX(Simple API XML),DOM(Document Objrect Model),以及Android推荐的Pull解析方式.下面就对三种解析方式一一详细阐述。
首先介绍SAX解析，SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描，当扫描到文档（document）开始与结束、元素（element）开始与结束、文档（document）结束等地方时通知事件处理函数，由事件处理函数做相应动作，然后继续同样的扫描，直至文档结束
下面介绍DOM解析，DOM，即对象文档模型，它是将整个XML文档载入内存(所以效率较低，不推荐使用)，每一个节点当做一个对象
下面介绍Pull解析，是Android推荐使用，更适合移动设备，以下代码讲解
public class PulPersonService {
public List

getPersons(InputStream instream) throws Exception {

List

persons = null;

Person person = null;

XmlPullParser parser = Xml.newPullParser();//得到Pull解析器

parser.setInput(instream, "UTF-8");//设置下输入流的编码

int eventType = parser.getEventType();//得到第一个事件类型

while (eventType != XmlPullParser.END_DOCUMENT) {//如果事件类型不是文档结束的话则不断处理事件

switch (eventType) {

case (XmlPullParser.START_DOCUMENT)://如果是文档开始事件

persons = new ArrayList

();创建一个person集合

break;

case (XmlPullParser.START_TAG)://如果遇到标签开始

String tagName = parser.getName();// 获得解析器当前元素的名称

if ("person".equals(tagName)) {//如果当前标签名称是

person = new Person();//创建一个person

person.setId(new Integer(parser.getAttributeValue(0)));//将元素的属性值赋值给id

}

if (person != null) {//如果person已经创建完成

if ("name".equals(tagName))//如果当前节点标记是name

person.setName(new String(parser.nextText()));

else if ("age".equals(tagName))//如果当前元素节点标记是age

person.setAge(new Short(parser.nextText()));

}

break;

case (XmlPullParser.END_TAG)://如果遇到标签结束

if ("person".equals(parser.getName())) {//如果是person标签结束

persons.add(person);//将创建完成的person加入集合

person = null;//并且置空

}

break;

}

eventType=parser.next();//进入下一个事件处理

}

return persons;

}

java解析xml的几种方式哪种最好？

(1)DOM解析
DOM是html和xml的应用程序接口(API)，以层次结构（类似于树型）来组织节点和信息片段，映射XML文档的结构，允许获取;
(2)SAX(Simple API for XML)解析
流模型中的"推"模型分析方式。通过事件驱动，每发现一个节点就引发一个事件，事件推给事件处理器，通过回调方法;
(1)、dom解析
dom解析是html和xml的应用程序接口(api) 以层次结构(类似与树形)来组织节点和信息片段映射xml文档的结构允许获取和操作文档的任意部分是官方标准
(2)、sax解析
流模型中in个的推模型分析方式通过事件驱动没发现一个节点就引发一个事件事件推给事件处理期遍历回调方法
(3)、stax
流模型中的拉模型分析方式提供基于指针和基于迭代器两种方式的支持1.6新特征
(4)、jdom
java特定的文档对象模型自身不包含解析器使用sax
(5)、jdom4j
简单易用采用java集合框架兵完全支持dom sax 和jaxp

java 解析xml有哪几种方式

DOM(Document Object Model) 生成和解析XML文档。由W3C提供的接口，它将整个XML文档读入内存，构建一个DOM树来对各个节点(Node)进行操作。
SAX(Simple API for XML) 生成和解析XML文档。SAX不用将整个文档加载到内存，基于事件驱动的API(Observer模式)，用户只需要注册自己感兴趣的事件即可。
DOM4J生成和解析XML文档。dom4j是目前在xml解析方面是最优秀的(Hibernate、Sun的JAXM也都使用dom4j来解析XML)，它合并了许多超出基本 XML 文档表示的功能，包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理
JDOM生成和解析XML 。 JDOM与DOM非常类似，它是处理XML的纯JAVA API，API大量使用了Collections类，且JDOM仅使用具体类而不使用接口。

Android将这xml文件用sax方式解析怎么弄

SAX是一个解析速度快并且占用内存少的xml解析器，非常适合用于Android等移动设备。 SAX解析XML文件采用的是事件驱动，也就是说，它并不需要解析完整个文档，在按内容顺序解析文档的过程中，SAX会判断当前读到的字符是否合法XML 语法中的某部分，如果符合就会触发事件。所谓事件，其实就是一些回调（callback）方法，这些方法(事件)定义在ContentHandler接口。下面是一些ContentHandler接口常用的方法：
startDocument()：当遇到文档的开头的时候，调用这个方法，可以在其中做一些预处理的工作。
endDocument()：和上面的方法相对应，当文档结束的时候，调用这个方法，可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName, String qName, Attributes atts)
当读到一个开始标签的时候，会触发这个方法。 namespaceURI就是命名空间，localName是不带命名空间前缀的标签名，qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。要注意的是SAX中一个重要的特点就是它的流式处理，当遇到一个标签的时候，它并不会纪录下以前所碰到的标签，也就是说，在 startElement()方法中，所有你所知道的信息，就是标签的名字和属性，至于标签的嵌套结构，上层标签的名字，是否有子元属等等其它与结构相关的信息，都是不得而知的，都需要你的程序来完成。这使得SAX在编程处理上没有DOM来得那么方便。
endElement(String uri, String localName, String name)：这个方法和上面的方法相对应，在遇到结束标签的时候，调用这个方法。
characters(char[] ch, int start, int length) ：这个方法用来处理在XML文件中读到的内容，第一个参数为文件的字符串内容，后面两个参数是读到的字符串在这个数组中的起始位置和长度，使用new String(ch,start,length)就可以获取内容。
注意：一个标签之间的字符比较多时，或者字符串中包含有”\n”等特殊字符时，就会出现字符丢失的现象。遇到这种问题不要怀疑SAX不能解析标签中含有”\n”或字符比较多的XML。实际上是我们写的Handler是有问题的。SAX在解析XML时，当遇到一个标签中的内容比较多时，就会多次调用characters。所以我们在写Handler时要考虑到这种情况。就不会丢字符了。以下是一种解决方案：新建一个临时变量temp，在调用characters方法中用temp接收数据，在endElement方法中把临时变量temp赋值给目标变量，并给临时变量temp清空，避免出现脏数据，这样就可以解决sax读取XML时不能读取换行符号后面的内容的问题。
在 Android中解析XML文主要有三种方式，分别为Simple API for XML(SAX)、Document Object Model(DOM)和Android附带的PULL解析器。其中SAX是一个解析速度非常快并且占用内存少的XML解析器，非常适合Android手机等移动设备。
SAX解析XML文件采用事件驱动的方式进行，也就是说，SAX是逐行扫描文件，遇到符合条件的设定条件后就会触发特定的事件，回调你写好的事件处理程序。使用SAX的优势在于其解析速度较快，占用内存较少(相对于DOM而言)。而且SAX在解析文件的过程中得到自己需要的信息后可以随时终止解析，并不一定要等文件全部解析完毕。凡事有利必有弊，其劣势在于SAX采用的是流式处理方式，当遇到某个标签的时候，它并不会记录下以前所遇到的标签，也就是说，在处理某个标签的时候，比如在 startElement方法中，所能够得到的信息就是标签的名字和属性，至于标签内部的嵌套结构，上层标签、下层标签以及其兄弟节点的名称等等与其结构相关的信息都是不得而知的。实际上就是把XML文件的结构信息丢掉了，如果需要得到这些信息的话，只能你自己在程序里进行处理了。所以相对DOM而言，SAX处理XML文档没有DOM方便，SAX处理的过程相对DOM而言也比较复杂。
使用SAX解析XML文件一般有以下五个步骤：
1、创建一个SAXParserFactory对象(通过类名很容易得知它利用工厂方法模式实现的)；
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象；
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象；
4、在XMLReader中注册事件处理接口，一般有ContentHandler、ErrorHandler、DTDHandler、EntityHandler四种；
5、调用XMLReader中的parse方法解析指定的XML字符串对象；
步骤四中提到的四个Handler是事件处理接口，SAX的事件处理函数就定义在这四个接口中，利用SAX解析XML文件需要重写接口中的方法。其中ContentHandler用来处理XML中的内容，ErrorHandler用来处理错误，DTDHandler用来处理DTD，EntityHandler用来处理XML文档中的实体；最常用的是ContentHandler这个接口，下面是该接口中的一些常用方法：
startDocument()
当遇到文档的开头的时候，调用这个方法，可以在其中做一些预处理的工作。
endDocument()
和上面的方法相对应，当文档结束的时候，调用这个方法，可以在其中做一些善后的工作。
startElement(String uri, String localName, String qName, Attributes atts)
当读到一个开始标签的时候，会触发这个方法。uri是命名空间(通过xmlns声明)，localName是不带命名空间前缀的标签名，qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。注意，如果没有指定Namespace，则qName可能为空，当然不同的SAX实现会有所不同，比如在Android中qName为空，而J2SE中localName为空，所以想要总是得到标签名，就需要检查这两个参数的值了。
endElement(String uri, String localName, String name)
这个方法和上面的方法相对应，在遇到结束标签的时候，调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容，第一个参数为文件的字符串内容，后面两个参数是读到的字符串在这个数组中的起始位置和长度，使用new String(ch,start,length)就可以获取内容。
下面是利用SAX解析XML文件的DEMO程序，首先定义一个XML文件users.xml，内容如下：
01

02

wuxianglong

199098

wuwenyuan

199189

11

其中第二个user标签中字符串long就是所谓的前缀，标签中的id则是该标签的一个属性。
然后我们来实现ContentHandler这个接口，并重写其中的方法来处理上面的XML文件，代码如下：
01 package sax.test;
02
03 import java.util.ArrayList;
04
05 import org.xml.sax.Attributes;
06 import org.xml.sax.SAXException;
07 import org.xml.sax.helpers.DefaultHandler;
08
09 public class MyHandler extends DefaultHandler {
10 private ArrayList

阅读更多 >>> 域名未解析是什么意思，域名解析未成功

users;

11 private User user;

12 private String content;

13

14 public ArrayList

getUsers() {

15 return users;

16 }

17

18 @Override

19 public void startDocument() throws SAXException {

20 super.startDocument();

21 users = new ArrayList

();

22 System.out.println("----------Start Parse Document----------" );

23 }

24

25 @Override

26 public void endDocument() throws SAXException {

27 System.out.println("----------End Parse Document----------" );

28 }

29

30 @Override

31 public void characters(char[] ch, int start, int length)

32 throws SAXException {

33 super.characters(ch, start, length);

34 // 获得标签中的文本

35 content = new String(ch, start, length);

36 }

37

38 @Override

39 public void startElement(String uri, String localName, String qName,

40 Attributes attributes) throws SAXException {

41 super.startElement(uri, localName, qName, attributes);

42 // 打印出localname和qName

43 System.out.println("LocalName->" + localName);

44 System.out.println("QName->" + qName);

45 if ("user".equals(localName)) {

46 user = new User();

47 user.setId(Integer.parseInt(attributes.getValue("id")));

48 }

49 }

50

51 @Override

52 public void endElement(String uri, String localName, String qName)

53 throws SAXException {

54 super.endElement(uri, localName, qName);

55 if ("name".equals(localName)) {

56 user.setName(content);

57 } else if ("password".equals(localName)) {

58 user.setPassword(content);

59 } else if ("user".equals(localName)) {

60 users.add(user);

61 }

62 }

63 }

最后我们编辑TestSAX这个类，获取users.xml这个文件中的内容，并利用SAX进行解析，代码如下：

01 package sax.test;

02

03 import java.io.IOException;

04

05 import javax.xml.parsers.ParserConfigurationException;

06 import javax.xml.parsers.SAXParser;

07 import javax.xml.parsers.SAXParserFactory;

08

09 import org.xml.sax.InputSource;

10 import org.xml.sax.SAXException;

11 import org.xml.sax.XMLReader;

12

13 import android.app.Activity;

14 import android.os.Bundle;

15 import android.widget.TextView;

16

17 public class TestSAX extends Activity {

18 private TextView text;

19

20 /** Called when the activity is first created. */

21 @Override

22 public void onCreate(Bundle savedInstanceState) {

23 super.onCreate(savedInstanceState);

24 setContentView(R.layout.main);

25

26 text = (TextView) findViewById(R.id.result);

27

28 try {

29 // 创建一个工厂对象

30 SAXParserFactory factory = SAXParserFactory.newInstance();

31 // 通过工厂对象得到一个解析器对象

32 SAXParser parser = factory.newSAXParser();

33 // 通过parser得到XMLReader对象

34 XMLReader reader = parser.getXMLReader();

35 // 为reader对象注册事件处理接口

36 MyHandler handler = new MyHandler();

37 reader.setContentHandler(handler);

38 // 解析指定XML字符串对象

39 reader.parse(newInputSource(TestSAX.class.getClassLoader().getResourceAsStream("users.xml")));

40

41 String usersInfo = "";

42 for (User user : handler.getUsers()) {

43 usersInfo += "ID->" + user.getId() + "\n";

44 usersInfo += "NAME->" + user.getName() + "\n";

45 usersInfo += "PASSWORD->" + user.getPassword() + "\n";

46 usersInfo += "\n\n";

47 }

48 text.setText(usersInfo);

49 } catch (SAXException e) {

50 e.printStackTrace();

51 } catch (ParserConfigurationException e) {

52 e.printStackTrace();

53 } catch (IOException e) {

54 e.printStackTrace();

55 }

56 }

57

58 }

← 上一篇: fields是什么意思,fields是什么意思 fields是的意思下一篇: java如何打开编程窗口,怎么打开电脑的编程界面→

解析xml文件的三种方式,python怎么解析xml文件

解析xml文件的三种方式,python怎么解析xml文件详细介绍

相关文章：

文章数据信息: