xml解析的三种方式,Java解析XML的几种方法

xml解析的三种方式,Java解析XML的几种方法详细介绍

本文目录一览： android中XML解析有哪几种？各自优缺点是什么？

【答案】：基本的解析方式有三种: DOM,SAX,Pull
1.dom解析解析器读入整个文档，然后构建一个驻留内存的树结构，然后代码就可以使用 DOM 接口来操作这个树结构的优点是对文档增删改查比较方便，缺点占用内存比较大。
2.sax解析基于事件驱动型,优点占用内存少，解析速度快，缺点是只适合做文档的读取，不适合做文档的增删改查。
3.pull解析同样基于事件驱动型,android 官方API提供,可随时终止

XML的XmlPullParser解析

xml文件的解析有三种方式：
以下使用XmlPullParser来进行解析。
xml可以用在内容判断的时候，比如多种显示例如a客户需要123 b客户只需要23
xml的读取方式： 1.获取当前的xml 2.对当前的xml以文档的形式进行遍历
想要读取xml需要使用XmlPullParser
这里需要注意的是XmlResourceParser构建的xmlPullParser不再需要额外设置解码类型和xml。可以直接获取。
存放在res下，存放的目录不同读取的情况也不同。
XmlResourceParser在得到xml内容后不需要再设置解码方式。 XmlResourceParser是继承了XmlPullParser的
一般情况在本地的xml读取会判断一下xml是否存在。
下面以存放在raw目录下，使用XmlPullParserFactory来进行读取的方法
首先是xml
知识点补充：
如果还存在不懂的地方可以联系一下作者，我会帮忙解答！

android中怎么解析复杂的xml文件

本文主要讲解Android开发中如何对XML文件的解析，由于XML文件具有与平台无关，广泛应用于数据通信中，因此解析XML文件就显得很有意义。Android对XML文件解析的方法主要有3种。通常有三种方式:DOM、SAX和PULL，下面就分别针对这三种方式来进行讨论。
文件内容如下所示：
那么就是要对此XML文件做解析。下面我们就分别用DOM,SAX和PULL三种方式，分别对此XML文件做解析。
DOM方式
DOM方式解析xml是先把xml文档都读到内存中，然后再用DOM API来访问树形结构，并获取数据。由DOM解析的方式可以知道，如果XML文件很大的时候，处理效率就会变得比较低，这也是DOM方式的一个缺点。
现在我们来解析上文中提到的有关天气预报信息相关的xml文件。什么是解析呢？说的通俗一点，就是将这个带标签的XML文件识别出来，并抽取一些相关的，对我们有用的信息来给我们使用。那在这个文件里，时间，天气，温度，以及图标对我们来说是需要得到的。我们要对其做解析。
解析的具体思路是：
1. 将XML文件加载进来。
2. 获取文档的根节点
3. 获取文档根节点中所有子节点的列表
4. 获取子节点列表中需要读取的节点信息
根据这4个步骤，我们进行开发：
首先就是如何加载XML文件，假设此文件来源于网络。
SAX方式
SAX是Simple API for XML的缩写。是一个包也可以看成是一些接口。
相比于DOM而言SAX是一种速度更快，更有效，占用内存更少的解析XML文件的方法。它是逐行扫描，可以做到边扫描边解析，因此SAX可以在解析文档的任意时刻停止解析。非常适用于Android等移动设备。
SAX是基于事件驱动的。所谓事件驱动就是说，它不用解析完整个文档，在按内容顺序解析文档过程中，SAX会判断当前读到的字符是否符合XML文件语法中的某部分。如果符合某部分，则会触发事件。所谓触发事件，就是调用一些回调方法。当然android的事件机制是基于回调方法的，在用SAX解析xml文档时候，在读取到文档开始和结束标签时候就会回调一个事件，在读取到其他节点与内容时候也会回调一个事件。在SAX接口中，事件源是org.xml.sax包中的XMLReader，它通过parser()方法来解析XML文档，并产生事件。事件处理器是org.xml.sax包中ContentHander、DTDHander、ErrorHandler，以及EntityResolver这4个接口。
这四个接口的详细说明如下：
事件处理器名称

事件处理器处理的事件

XMLReader注册方法

ContentHander

XML文档的开始与结束，
XML文档标签的开始与结束，接收字符数据，跳过实体，接收元素内容中可忽略的空白等。

setContentHandler(ContentHandler h)

DTDHander

处理DTD解析时产生的相应事件

setDTDHandler(DTDHandler h)

ErrorHandler

处理XML文档时产生的错误

setErrorHandler(ErrorHandler h)

EntityResolver

处理外部实体

setEntityResolver(EntityResolver e)

我们用来做内容解析的回调方法一般都定义在ContentHandler接口中。
ContentHandler接口常用的方法：
startDocument()
当遇到文档的开头的时候，调用这个方法，可以在其中做一些预处理的工作。
endDocument()
当文档结束的时候，调用这个方法，可以在其中做一些善后的工作。
startElement(String namespaceURI, String localName,String qName, Attributes atts)
当读到开始标签的时候，会调用这个方法。namespaceURI就是命名空间，localName是不带命名空间前缀的标签名，qName是带命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。
endElement(String uri, String localName, String name)
在遇到结束标签的时候，调用这个方法。
characters(char[] ch, int start, int length)
这个方法用来处理在XML文件中读到的内容。例如：
主要目的是获取high标签中的值。
第一个参数用于存放文件的内容，后面两个参数是读到的字符串在这个数组中的起始位置和长度，使用new String(ch,start,length)就可以获取内容。
注意：
SAX的一个重要特点就是它的流式处理，当遇到一个标签的时候，它并不会纪录下之前所碰到的标签，即在startElement()方法中，所有能够知道的信息，就是标签的名字和属性，至于标签的嵌套结构，上层标签的名字，是否有子元属等等其它与结构相关的信息，都是不知道的，都需要你的程序来完成。这使得SAX在编程处理上没有DOM方便。
现在我们截取一段XML文件来做解析，其调用方法是这样的：
----------> startDocument()

----------> startElement

----------> startElement

beijing ----------> characters

----------> endElement

----------> endElement

----------> endElement
文档结束 ----------> endDocument()
SAX的解析步骤：
首先需要注意的是：
SAX还为其制定了一个Helper类：DefaultHandler它实现了ContentHandler这个接口，但是其所有的方法体都为空，在实现的时候，你只需要继承这个类，然后重载相应的方法即可。
使用SAX解析XML文件一般有以下五个步骤：
1、创建一个SAXParserFactory对象；
2、调用SAXParserFactory中的newSAXParser方法创建一个SAXParser对象；
3、然后在调用SAXParser中的getXMLReader方法获取一个XMLReader对象；
4、实例化一个DefaultHandler对象
5、连接事件源对象XMLReader到事件处理类DefaultHandler中
6、调用XMLReader的parse方法从输入源中获取到的xml数据
7、通过DefaultHandler返回我们需要的数据集合。
我们仍然来解析上述那个天气预报的XML文件。
编写代码如下：
[java] view plaincopy
mySAX.setOnClickListener(new Button.OnClickListener(){
@Override
public void onClick(View v) {
try{
String url = "http://www.google.com/ig/api?&weather=beijing";
DefaultHttpClient client = new DefaultHttpClient();
HttpUriRequest req = new HttpGet(url);
HttpResponse resp = client.execute(req);
HttpEntity ent = resp.getEntity();
InputStream stream = ent.getContent(); //将文件导入流，因此用InputStream

SAXParserFactory saxFactory = SAXParserFactory.newInstance(); //获取一个对象
SAXParser saxParser = saxFactory.newSAXParser();//利用获取到的对象创建一个解析器
XMLContentHandler handler = new XMLContentHandler();//设置defaultHandler
saxParser.parse(stream, handler);//进行解析
stream.close();//关闭流
/*XMLReader xmlReader = saxFactory.newSAXParser().getXMLReader(); //获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(new InputSource(stream));
stream.close();*/
}catch(Exception e){
e.printStackTrace();
}
}
});
}
public class XMLContentHandler extends DefaultHandler {
private static final String TAG = "XMLContentHandler";

@Override
public void characters(char[] ch, int start, int length)
throws SAXException {
Log.i(TAG, "解析内容："+new String(ch,start,length));
}
@Override
public void endDocument() throws SAXException {
super.endDocument();
Log.i(TAG, "文档解析完毕。");
}
@Override
public void endElement(String uri, String localName, String qName)
throws SAXException {
Log.i(TAG, localName+"解析完毕");
}
@Override
public void startDocument() throws SAXException {
Log.i(TAG, "开始解析... ...");
}
@Override
public void startElement(String uri, String localName, String qName,
Attributes attributes) throws SAXException {
Log.i(TAG, "解析元素："+localName);

阅读更多 >>> Word文档怎么压缩图片

if(localName.equals("high")){
Log.i(TAG, "解析元素："+localName);
i++;
if(i==2){
highestTmp.setText(String.valueOf((Integer.parseInt(attributes.getValue(0))-32)*5/9));
}
}
}
}
上面的那段注释：
[java] view plaincopy
/*XMLReader xmlReader =saxFactory.newSAXParser().getXMLReader(); //获取一个XMLReader
xmlReader.setContentHandler(handler);
xmlReader.parse(newInputSource(stream));
stream.close();*/
是用XMLReader来做解析的另外一种方法。效果是一样的。这里可以传流，也可以传一个字符串，如下所示：是传字符串。
[java] view plaincopy
xmlReader.parse(new InputSource(new StringReader(xmlStr)));
PULL方式
除了可以使用 SAX和DOM解析XML文件，也可以使用Android内置的Pull解析器解析XML文件。 Pull解析器的运行方式与 SAX 解析器相似。它也是事件触发的。Pull解析方式让应用程序完全控制文档该怎么样被解析。比如开始和结束元素事件，使用parser.next()可以进入下一个元素并触发相应事件。通过Parser.getEventType()方法来取得事件的代码值，解析是在开始时就完成了大部分处理。事件将作为数值代码被发送，因此可以使用一个switch对感兴趣的事件进行处理。
Pull解析是一个遍历文档的过程，每次调用next()，nextTag(), nextToken()和nextText()都会向前推进文档，并使Parser停留在某些事件上面，但是不能倒退。然后把文档设置给Parser。
Android中对Pull方法提供了支持的API，主要是
org.xmlpull.v1.XmlPullParser;
org.xmlpull.v1.XmlPullParserFactory;
二个类，其中主要使用的是XmlPullParser，XmlPullParserFactory是一个工厂，用于构建XmlPullParser对象。
应用程序通过调用XmlPullParser.next()等方法来产生Event，然后再处理Event。
我们仍然拿上述天气预报的XML文件的一部分来做例子。
例如：需要解析的XML文件是：
[java] view plaincopy

这部分XML文件中day_of_week,low,high等是TAG，data是ATTRIBUTEA。当然，如果有<>夹在开始和结束符号之间的部分，则为TXET。
要想解析文档先要构建一个XmlPullParser对象。
[java] view plaincopy
final XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
factory.setNamespaceAware(true);
final XmlPullParser parser = factory.newPullParser();
parser.setInput(new StringReader("xmlStr");
这里的xmlStr就是上边的XML文件。
此时，文档刚被初始化，所以它应该位于文档的开始，事件为START_DOCUMENT，可以通过XmlPullParser.getEventType()来获取。然后调用next()会产生
START_TAG，这个事件告诉应用程序一个标签已经开始了，调用getName()会返回" day_of_week ";若有TEXT，则再next()会产生TEXT事件，调用getText()会返回TEXT，由于此处没有，所以再next()，会产生END_TAG，这个告诉你一个标签已经处理完了，再next()直到最后处理完TAG，会产生END_DOCUMENT，它告诉你整个文档已经处理完成了。除了next()外，nextToken()也可以使用，只不过它会返回更加详细的事件，比如COMMENT, CDSECT, DOCDECL, ENTITY等等非常详细的信息。如果程序得到比较底层的信息，可以用nextToken()来驱动并处理详细的事件。需要注意一点的是TEXT事件是有可能返回空白的White Spaces比如换行符或空格等。
nextTag()--会忽略White Spaces，如果可以确定下一个是START_TAG或END_TAG，就可以调用nextTag()直接跳过去。通常它有二个用处：当START_TAG时，如果能确定这个TAG含有子TAG，那么就可以调用nextTag()产生子标签的START_TAG事件；当END_TAG时，如果确定不是文档结尾，就可以调用nextTag()产生下一个标签的START_TAG。在这二种情况下如果用next()会有TEXT事件，但返回的是换行符或空白符。
nextText()--只能在START_TAG时调用。当下一个元素是TEXT时，TEXT的内容会返回；当下一个元素是END_TAG时，也就是说这个标签的内容为空，那么空字串返回；这个方法返回后，Parser会停在END_TAG上。
小结一下，如果在一个XML文档中我们只需要前面一部分数据，但是使用SAX方式或DOM方式会对整个文档进行解析，尽管XML文档中后面的大部分数据我们其实都不需要解析，因此这样实际上就浪费了处理资源。使用PULL方式正合适。
当点击三种方式的任何一个按钮时，均能够得到相同的结果

Android 中有哪几种解析 xml 的类，官方推荐哪种

在Android中提供了三种解析XML的方式:SAX(Simple API XML),DOM(Document Objrect Model),以及Android推荐的Pull解析方式.下面就对三种解析方式一一详细阐述。
首先介绍SAX解析，SAX是事件驱动型XML解析的一个标准接口不会改变 SAX的工作原理简单地说就是对文档进行顺序扫描，当扫描到文档（document）开始与结束、元素（element）开始与结束、文档（document）结束等地方时通知事件处理函数，由事件处理函数做相应动作，然后继续同样的扫描，直至文档结束
下面介绍DOM解析，DOM，即对象文档模型，它是将整个XML文档载入内存(所以效率较低，不推荐使用)，每一个节点当做一个对象
下面介绍Pull解析，是Android推荐使用，更适合移动设备，以下代码讲解
public class PulPersonService {
public List

getPersons(InputStream instream) throws Exception {

List

persons = null;

Person person = null;

XmlPullParser parser = Xml.newPullParser();//得到Pull解析器

parser.setInput(instream, "UTF-8");//设置下输入流的编码

int eventType = parser.getEventType();//得到第一个事件类型

while (eventType != XmlPullParser.END_DOCUMENT) {//如果事件类型不是文档结束的话则不断处理事件

switch (eventType) {

case (XmlPullParser.START_DOCUMENT)://如果是文档开始事件

persons = new ArrayList

();创建一个person集合

break;

case (XmlPullParser.START_TAG)://如果遇到标签开始

String tagName = parser.getName();// 获得解析器当前元素的名称

if ("person".equals(tagName)) {//如果当前标签名称是

person = new Person();//创建一个person

person.setId(new Integer(parser.getAttributeValue(0)));//将元素的属性值赋值给id

}

if (person != null) {//如果person已经创建完成

if ("name".equals(tagName))//如果当前节点标记是name

person.setName(new String(parser.nextText()));

else if ("age".equals(tagName))//如果当前元素节点标记是age

person.setAge(new Short(parser.nextText()));

}

break;

case (XmlPullParser.END_TAG)://如果遇到标签结束

if ("person".equals(parser.getName())) {//如果是person标签结束

persons.add(person);//将创建完成的person加入集合

person = null;//并且置空

}

break;

}

eventType=parser.next();//进入下一个事件处理

}

return persons;

}

在java中解析xml有哪几种方法

1、JDOM生成和解析XML
为减少DOM、SAX的编码量,出现了JDOM
优点:20-80原则,极大减少了代码量。
使用场合:要实现的功能简单,如解析、创建等,但在底层,JDOM还是使用SAX(最常用)、DOM、Xanan文档。
2、SAX生成和解析XML文档
为解决DOM的问题,出现了SAX,SAX 事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时发送事件,程序员编写响应这些事件的代码,保存数据。
优点:不用事先调入整个文档,占用资源少。SAX解析器代码比DOM解析器代码小,适于Applet下载。
缺点:不是持久的,事件过后若没保存数据,那么数据就丢了。无状态性,从事件中只能得到文本,但不知该文本属于哪个元素。
使用场合:Applet。只需XML文档的少量内容,很少回头访问,机器内存少。
3、DOM生成和解析XML文档
为XML文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。
优点:整个文档树在内存中,便于操作,支持删除、修改、重新排列等多种功能。
缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间。
使用场合:一旦解析了文档还需多次访问这些数据,硬件资源充足(内存、CPU)。
4、DOM4J生成和解析XML文档
DOM4J
是一个非常非常优秀的Java XML
API,具有性能优异、功能强大和极端易用使用的特点,同时它也是一个开放源代码的软件。如今你可以看到越来越多的 Java 软件都在使用 DOM4J
来读写 XML,特别值得一提的是连 Sun 的 JAXM 也在用 DOM4J。
DOM
DOM Document Object Model 文档对象模型。
SAX
SAX的全称是Simple API for XML,即XML简单应用程序接口
SAX的工作原理
SAX的工作原理简单地说就是对文档进行顺序扫描，
PULL解析(Android)
PULL解析器的运行方式和SAX类似，都是基于事件的模式
SAX解析
我会在项目的assets目录中放置一个XML文档person.xml，
(1)DOM解析
DOM是html和xml的应用程序接口(API)，以层次结构（类似于树型）来组织节点和信息片段，映射XML文档的结构，允许获取
和操作文档的任意部分，是W3C的官方标准
【优点】
①允许应用程序对数据和结构做出更改。
②访问是双向的，可以在任何时候在树中上下导航，获取和操作任意部分的数据。
【缺点】
①通常需要加载整个XML文档来构造层次结构，消耗资源大。
【解析详解】
①构建Document对象：
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = bdf.newDocumentBuilder();
InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);
Document doc = bd.parse(is);
②遍历DOM对象
Document： XML文档对象，由解析器获取
NodeList：节点数组
Node：节点(包括element、#text)
Element：元素，可用于获取属性参数
(2)SAX(Simple API for XML)解析
流模型中的"推"模型分析方式。通过事件驱动，每发现一个节点就引发一个事件，事件推给事件处理器，通过回调方法
完成解析工作，解析XML文档的逻辑需要应用程序完成
【优势】
①不需要等待所有数据都被处理，分析就能立即开始。
②只在读取数据时检查数据，不需要保存在内存中。
③可以在某个条件得到满足时停止解析，不必解析整个文档。
④效率和性能较高，能解析大于系统内存的文档。
【缺点】
①需要应用程序自己负责TAG的处理逻辑（例如维护父/子关系等），文档越复杂程序就越复杂。
②单向导航，无法定位文档层次，很难同时访问同一文档的不同部分数据，不支持XPath。
【原理】
简单的说就是对文档进行顺序扫描，当扫描到文档(document)开始与结束、元素(element)开始与结束时通知事件
处理函数(回调函数)，进行相应处理，直到文档结束
【事件处理器类型】
①访问XML DTD：DTDHandler
②低级访问解析错误：ErrorHandler
③访问文档内容：ContextHandler
【DefaultHandler类】
SAX事件处理程序的默认基类，实现了DTDHandler、ErrorHandler、ContextHandler和EntityResolver接口，通常
做法是，继承该基类，重写需要的方法，如startDocument()
【创建SAX解析器】
SAXParserFactory saxf = SAXParserFactory.newInstance();
SAXParser sax = saxf.newSAXParser();
注：关于遍历
①深度优先遍历(Depthi-First Traserval)
②广度优先遍历(Width-First Traserval)
(3)JDOM(Java-based Document Object Model)
Java特定的文档对象模型。自身不包含解析器，使用SAX
【优点】
①使用具体类而不是接口，简化了DOM的API。
②大量使用了Java集合类，方便了Java开发人员。
【缺点】
①没有较好的灵活性。
②性能较差。
(4)DOM4J(Document Object Model for Java)
简单易用，采用Java集合框架，并完全支持DOM、SAX和JAXP
【优点】
①大量使用了Java集合类，方便Java开发人员，同时提供一些提高性能的替代方法。
②支持XPath。
③有很好的性能。
【缺点】
①大量使用了接口，API较为复杂。
(5)StAX(Streaming API for XML)
流模型中的拉模型分析方式。提供基于指针和基于迭代器两种方式的支持,JDK1.6新特性
【和推式解析相比的优点】
①在拉式解析中，事件是由解析应用产生的，因此拉式解析中向客户端提供的是解析规则，而不是解析器。
②同推式解析相比，拉式解析的代码更简单，而且不用那么多库。
③拉式解析客户端能够一次读取多个XML文件。
④拉式解析允许你过滤XML文件和跳过解析事件。
【简介】
StAX API的实现是使用了Java Web服务开发（JWSDP）1.6，并结合了Sun Java流式XML分析器(SJSXP)-它位于
javax.xml.stream包中。XMLStreamReader接口用于分析一个XML文档，而XMLStreamWriter接口用于生成一个
XML文档。XMLEventReader负责使用一个对象事件迭代子分析XML事件-这与XMLStreamReader所使用的光标机制
形成对照。

阅读更多 >>> 360浏览器中AI大会员有什么用

java解析xml的几种方式哪种最好？

(1)DOM解析
DOM是html和xml的应用程序接口(API)，以层次结构（类似于树型）来组织节点和信息片段，映射XML文档的结构，允许获取;
(2)SAX(Simple API for XML)解析
流模型中的"推"模型分析方式。通过事件驱动，每发现一个节点就引发一个事件，事件推给事件处理器，通过回调方法;
(1)、dom解析
dom解析是html和xml的应用程序接口(api) 以层次结构(类似与树形)来组织节点和信息片段映射xml文档的结构允许获取和操作文档的任意部分是官方标准
(2)、sax解析
流模型中in个的推模型分析方式通过事件驱动没发现一个节点就引发一个事件事件推给事件处理期遍历回调方法
(3)、stax
流模型中的拉模型分析方式提供基于指针和基于迭代器两种方式的支持1.6新特征
(4)、jdom
java特定的文档对象模型自身不包含解析器使用sax
(5)、jdom4j
简单易用采用java集合框架兵完全支持dom sax 和jaxp

用Python解析XML的几种常见方法的介绍

一、简介 XML（eXtensible Markup Language）指可扩展标记语言，被设计用来传输和存储数据，已经日趋成为当前许多新生技术的核心，在不同的领域都有着不同的应用。它是web发展到一定阶段的必然产物，既具有SGML的核心特征，又有着HTML的简单特性，还具有明确和结构良好等许多新的特性。 python解析XML常见的有三种方法：一是xml.dom.*模块，它是W3C DOM API的实现，若需要处理DOM API则该模块很适合，注意xml.dom包里面有许多模块，须区分它们间的不同；二是xml.sax.*模块，它是SAX API的实现，这个模块牺牲了便捷性来换取速度和内存占用，SAX是一个基于事件的API，这就意味着它可以“在空中”处理庞大数量的的文档，不用完全加载进内存；三是xml.etree.ElementTree模块（简称 ET），它提供了轻量级的Python式的API，相对于DOM来说ET 快了很多，而且有很多令人愉悦的API可以使用，相对于SAX来说ET的ET.iterparse也提供了 “在空中” 的处理方式，没有必要加载整个文档到内存，ET的性能的平均值和SAX差不多，但是API的效率更高一点而且使用起来很方便。二、详解解析的xml文件（country.xml）：在CODE上查看代码片派生到我的代码片 4 2011 59900 68 2011 13600 1、xml.etree.ElementTree ElementTree生来就是为了处理XML，它在Python标准库中有两种实现：一种是纯Python实现的，如xml.etree.ElementTree，另一种是速度快一点的xml.etree.cElementTree。注意：尽量使用C语言实现的那种，因为它速度更快，而且消耗的内存更少。在CODE上查看代码片派生到我的代码片 try: import xml.etree.cElementTree as ET except ImportError: import xml.etree.ElementTree as ET 这是一个让Python不同的库使用相同API的一个比较常用的办法，而从Python 3.3开始ElementTree模块会自动寻找可用的C库来加快速度，所以只需要import xml.etree.ElementTree就可以了。在CODE上查看代码片派生到我的代码片 #!/usr/bin/evn python #coding:utf-8 try: import xml.etree.cElementTree as ET except ImportError: import xml.etree.ElementTree as ET import sys try: tree = ET.parse("country.xml") #打开xml文档 #root = ET.fromstring(country_string) #从字符串传递xml root = tree.getroot() #获得root节点 except Exception, e: print "Error:cannot parse file:country.xml." sys.exit(1) print root.tag, "---", root.attrib for child in root: print child.tag, "---", child.attrib print "*"*10 print root[0][1].text #通过下标访问 print root[0].tag, root[0].text print "*"*10 for country in root.findall('country'): #找到root节点下的所有country节点 rank = country.find('rank').text #子节点下节点rank的值 name = country.get('name') #子节点下属性name的值 print name, rank #修改xml文件 for country in root.findall('country'): rank = int(country.find('rank').text) if rank > 50: root.remove(country) tree.write('output.xml') 运行结果：参考：https://docs.python.org/2/library/xml.etree.elementtree.html2、xml.dom.* 文件对象模型（Document Object Model，简称DOM），是W3C组织推荐的处理可扩展置标语言的标准编程接口。一个 DOM 的解析器在解析一个XML文档时，一次性读取整个文档，把文档中所有元素保存在内存中的一个树结构里，之后你可以利用DOM 提供的不同的函数来读取或修改文档的内容和结构，也可以把修改过的内容写入xml文件。python中用xml.dom.minidom来解析xml文件，例子如下：在CODE上查看代码片派生到我的代码片 #!/usr/bin/python #coding=utf-8 from xml.dom.minidom import parse import xml.dom.minidom # 使用minidom解析器打开XML文档 DOMTree = xml.dom.minidom.parse("country.xml") Data = DOMTree.documentElement if Data.hasAttribute("name"): print "name element : %s" % Data.getAttribute("name") # 在集合中获取所有国家 Countrys = Data.getElementsByTagName("country") # 打印每个国家的详细信息 for Country in Countrys: print "*****Country*****" if Country.hasAttribute("name"): print "name: %s" % Country.getAttribute("name") rank = Country.getElementsByTagName('rank')[0] print "rank: %s" % rank.childNodes[0].data year = Country.getElementsByTagName('year')[0] print "year: %s" % year.childNodes[0].data gdppc = Country.getElementsByTagName('gdppc')[0] print "gdppc: %s" % gdppc.childNodes[0].data for neighbor in Country.getElementsByTagName("neighbor"): print neighbor.tagName, ":", neighbor.getAttribute("name"), neighbor.getAttribute("direction") 运行结果：参考：https://docs.python.org/2/library/xml.dom.html3、xml.sax.* SAX是一种基于事件驱动的API，利用SAX解析XML牵涉到两个部分：解析器和事件处理器。其中解析器负责读取XML文档，并向事件处理器发送事件，如元素开始跟元素结束事件；而事件处理器则负责对事件作出相应，对传递的XML数据进行处理。python中使用sax方式处理xml要先引入xml.sax中的parse函数，还有xml.sax.handler中的ContentHandler。常使用在如下的情况下：一、对大型文件进行处理；二、只需要文件的部分内容，或者只需从文件中得到特定信息；三、想建立自己的对象模型的时候。ContentHandler类方法介绍（1）characters(content)方法调用时机：从行开始，遇到标签之前，存在字符，content的值为这些字符串。从一个标签，遇到下一个标签之前，存在字符，content的值为这些字符串。从一个标签，遇到行结束符之前，存在字符，content的值为这些字符串。标签可以是开始标签，也可以是结束标签。（2）startDocument()方法文档启动的时候调用。（3）endDocument()方法解析器到达文档结尾时调用。（4）startElement(name, attrs)方法遇到XML开始标签时调用，name是标签的名字，attrs是标签的属性值字典。（5）endElement(name)方法遇到XML结束标签时调用。在CODE上查看代码片派生到我的代码片 #coding=utf-8 #!/usr/bin/python import xml.sax class CountryHandler(xml.sax.ContentHandler): def __init__(self): self.CurrentData = "" self.rank = "" self.year = "" self.gdppc = "" self.neighborname = "" self.neighbordirection = "" # 元素开始事件处理 def startElement(self, tag, attributes): self.CurrentData = tag if tag == "country": print "*****Country*****" name = attributes["name"] print "name:", name elif tag == "neighbor": name = attributes["name"] direction = attributes["direction"] print name, "->", direction # 元素结束事件处理 def endElement(self, tag): if self.CurrentData == "rank": print "rank:", self.rank elif self.CurrentData == "year": print "year:", self.year elif self.CurrentData == "gdppc": print "gdppc:", self.gdppc self.CurrentData = "" # 内容事件处理 def characters(self, content): if self.CurrentData == "rank": self.rank = content elif self.CurrentData == "year": self.year = content elif self.CurrentData == "gdppc": self.gdppc = content if __name__ == "__main__": # 创建一个 XMLReader parser = xml.sax.make_parser() # turn off namepsaces parser.setFeature(xml.sax.handler.feature_namespaces, 0) # 重写 ContextHandler Handler = CountryHandler() parser.setContentHandler(Handler) parser.parse("country.xml") 运行结果：4、libxml2和lxml解析xml libxml2是使用C语言开发的xml解析器，是一个基于MIT License的免费开源软件，多种编程语言都有基于它的实现，python中的libxml2模块有点小不足的是：xpathEval()接口不支持类似模板的用法，但不影响使用，因libxml2采用C语言开发的，因此在使用API接口的方式上难免会有点不适应。在CODE上查看代码片派生到我的代码片 #!/usr/bin/python #coding=utf-8 import libxml2 doc = libxml2.parseFile("country.xml") for book in doc.xpathEval('//country'): if book.content != "": print "----------------------" print book.content for node in doc.xpathEval("//country/neighbor[@name = 'Colombia']"): print node.name, (node.properties.name, node.properties.content) doc.freeDoc() lxml是以libxml2为基础采用python语言开发的，从使用层面上说比lxml更适合python开发者，且xpath()接口支持类似模板的用法。在CODE上查看代码片派生到我的代码片 #!/usr/bin/python #coding=utf-8 import lxml.etree doc = lxml.etree.parse("country.xml") for node in doc.xpath("//country/neighbor[@name = $name]", name = "Colombia"): print node.tag, node.items() for node in doc.xpath("//country[@name = $name]", name = "Singapore"): print node.tag, node.items() 三、总结（1）Python中XML解析可用的类库或模块有xml、libxml2 、lxml 、xpath等，需要深入了解的还需参考相应的文档。（2）每一种解析方式都有自己的优点和缺点，选择前可以综合各个方面的性能考虑。（3）若有不足，请留言，在此先感谢！

阅读更多 >>> 字体为什么要把横线去掉

java 解析xml有哪几种方式

DOM(Document Object Model) 生成和解析XML文档。由W3C提供的接口，它将整个XML文档读入内存，构建一个DOM树来对各个节点(Node)进行操作。
SAX(Simple API for XML) 生成和解析XML文档。SAX不用将整个文档加载到内存，基于事件驱动的API(Observer模式)，用户只需要注册自己感兴趣的事件即可。
DOM4J生成和解析XML文档。dom4j是目前在xml解析方面是最优秀的(Hibernate、Sun的JAXM也都使用dom4j来解析XML)，它合并了许多超出基本 XML 文档表示的功能，包括集成的 XPath 支持、XML Schema 支持以及用于大文档或流化文档的基于事件的处理
JDOM生成和解析XML 。 JDOM与DOM非常类似，它是处理XML的纯JAVA API，API大量使用了Collections类，且JDOM仅使用具体类而不使用接口。

Java解析XML的几种方法

DOM解析
①构建Document对象：
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = bdf.newDocumentBuilder();
InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);
Document doc = bd.parse(is);
②遍历DOM对象
Document： XML文档对象，由解析器获取
NodeList：节点数组
Node：节点(包括element、#text)
Element：元素，可用于获取属性参数
SAX(Simple API for XML)解析
【DefaultHandler类】
SAX事件处理程序的默认基类，实现了DTDHandler、ErrorHandler、ContextHandler和EntityResolver接口，通常做法是，继承该基类，重写需要的方法，如startDocument()
【创建SAX解析器】
SAXParserFactory saxf = SAXParserFactory.newInstance();
SAXParser sax = saxf.newSAXParser();
注：关于遍历
①深度优先遍历(Depthi-First Traserval)
②广度优先遍历(Width-First Traserval)
JDOM(Java-based Document Object Model)
DOM4J(Document Object Model for Java)
StAX(Streaming API for XML)

← 上一篇: plsql是oracle客户端吗,oracle 客户端与PLSQL是一回事吗？下一篇: 新手怎么用电脑做表格,电脑怎么做表格初学者→

xml解析的三种方式,Java解析XML的几种方法

xml解析的三种方式,Java解析XML的几种方法详细介绍

相关文章：

文章数据信息: