dom4j中通过xpath处理带命名空间的XML文件

1.XML的命名空间：

许多XML配置文件中，通常在开头部分带有命名空间，如spring中：

在spring中，解析节点使用lazy loading方式：即先获取root节点，然后依次获取其子节点解析。在处理每个bean的命名空间时，会取其namespace与字符串“”比较，以判断是否为对应spring的bean节点。一般其它情况并不存在需要对namespace进行处理

见：org.springframework.beans.factory.xml.BeanDefinitionParserDelegate.isDefaultNamespace()

2.若要使用dom4j处理带namespace的xml文件，通过遍历根节点方式不影响命名空间。

而若通过普通的xpath方式查询，，则必须对xpath进行预处理：

首先，将namespace放入map，设置到DocumentFactory

SAXReader reader1 = new SAXReader();Map<String, String>map=new HashMap<String, String>();map.put("abc","");reader1.getDocumentFactory().setXPathNamespaceURIs(map);然后，当通过xpath查询节点或attribute时，需要将所有的节点属性前加上先前设置的map键值(attribute名不需要加)

eg,查询xpath: beans/bean[@id=’root’]

Element root=(Element) document.selectSingleNode("abc:beans/abc:bean[@id=’root’]");或者: //bean[@id=’root’]

Element root=(Element) document.selectSingleNode("//abc:bean[@id=’root’]");当然，可以使用正则表达式对原xpath进行转换

public static String getXMLNameSpaceFixed(String xpath){xpath= xpath.replaceAll("/(\\w)", "/"+"abc:$1");//replace start with "/"xpath= xpath.replaceAll("^(\\w)", "abc:$1"); //replace start with wordreturn xpath;}3.当处理另一个文档，此时若只是SAXReader reader2 = new SAXReader()，会发现仍然沿用原先的map；

而且重新设置新的namespace的map后，原有的reader1的xpath查询失效。

原因是，dom4j中默认的SAXReader初始化时调用DocumentFactory的单例对象，

因此必须使用新的工厂避免对原有工厂的影响：

SAXReader reader2 = new SAXReader(new DocumentFactory());Map<String, String>map=new HashMap<String, String>();map.put("xyz","");reader2.getDocumentFactory().setXPathNamespaceURIs(map);

旅行要学会随遇而安，淡然一点，

相关文章：

你感兴趣的文章：

标签云：