JSoup解析HTML使用笔记(一)

JSoup解析HTML使用笔记(一)

学习java有3个多月了,一直想在学习过程中写点什么,香港空间,把自己的成长历程记录下来,香港虚拟主机,但是一直不知道写些什么。这次我终于下定决心写出自己的第一篇文章,督促自己学习,希望大神勿喷,如果哪位大神有闲心阅读了一下,如有错误,希望能够指出,在下感激不尽,也希望能和像我一样的初学者共同学习进步。

Jsoup是java的一个解析和遍历HTML的API,可以把一个HTML字符串解析成一个Document文档,并且会尽可能的得到一个标准的解析结果。

例如:

main(String[] args){String html1=”<p>Jsoup<p>LKZERO”;Document doc=Jsoup.parse(html1);System.out.println(doc.toString());System.out.println(“——–“);String html2=”<td>LKZERO</td><br>” +”<tr><td>LKZERO<td></tr><br />” +”<table><tr><td>JSOUP</td></tr></table>”;Document doc2=Jsoup.parse(html2);System.out.println(doc2.toString());}

得到结果:

<html> <head></head> <body> <p>Jsoup</p> <p>LKZERO</p> </body></html>——–<html> <head></head> <body> LKZERO <br />LKZERO <br /> <table><tbody><tr><td>JSOUP</td></tr></tbody> </table> </body></html>

Jsoup解析得到的Document文档是由Document,Element,Node和TextNode组成的,其中Document继承Element,Element继承Node,香港服务器,TextNode继承Node。

parse()静态方法:Jsoup解析HTML字符串使用parse静态方法,无论HTML字符串是什么内容,都会得到一个Document文档,至少会包含<html><head><body>三个元素。parseBodyFragment()静态方法:经我测试与parse()得到的结果相同,不太明白二者区别。官方文档上说此方法把任何用户输入的HTML都会被解析为body部分,但是我测试得到的结果并不是这样。希望有大神能够指导。

posted on

却又小到连一粒嫉妒的沙石也不能容纳

JSoup解析HTML使用笔记(一)

相关文章:

你感兴趣的文章:

标签云: