pdf生成的解决方案(H2p)之H2P展望

《根据批量URL生成有书签的pdf文档的解决方案》一文作为一个完整的解决方 案,主要有四个要点

(1)详细描述了解决方案的思路,

(2)提出了一种描述URL的xml文件,称之为h2p文件

(3)根据h2p文件生成pdf文档的工具称为h2p-tool,同时h2p-tool还能对h2p 文件进行编辑,从而制作自己的pdf电子书。

(4)h2p文件是该解决方案的资源文件,收集url是件费时费力的事情,所以 该解决方案还提供了下载h2p文件的链接

H2p是我自己定义的一种xml格式,我私下里是希望这种格式能够被大家接受, 所以我定义了dtd,并且开发了一个编辑h2p文件的工具h2p-tool,而且在javaei 网站上提供了大量的h2p文件作为资源下载。有了h2p,制作自己的pdf电子书将变 得很容易。

如果想让h2p为大家所接受,h2p必须不断的发展。因为现在h2p应用还是很简 单很原始。主要表现在,生成的pdf是原html的完全再现,这是他的优点也是他的 弱点。

说是优点,是因为pdf的呈现效果和在浏览器里风格一样。

说是缺点,是因为既然生成了pdf,我们希望pdf里主要突出文章的主题内容, 而不希望有原来网页里的那么多的图片和广告,而且还希望原来是分页的内容自 动合并到一个pdf里。

所以,就此缺点,我提出两个可能的展望。

(1)制定一种规范,该规范要求网站为每篇博客提供一个为h2p专用的链接( 姑且叫h2p链接吧),根据这个链接打开的博客文章是没有广告的,那么h2p文件 的连接采用这种h2p链接,生成的pdf就没有上述的缺点了。这个想法可能与网站 的盈利相悖,因为如果提供h2p链接,很多人将会之点击h2p链接,这样,就避开 了网站投放的广告。

(2)第二种可能的展望就是,各网站提供一个webservice的编程接口,通过 该编程接口,用程序访问每篇博客文章,这样得到的文章就是没有广告的干净的 文章。

这两种展望的目的主要是为了生成干净的pdf文档,显然,要实现这两个展望 是很困难的,除非大家都很接受h2p这个思路,并且对这种应用很迫切,才会有人 来大力推动。想想rss的普及,那也是一波三折,最终还是因为其便捷的使用模式 而被大家所接受。

私下里是希望大家能接受并喜欢h2p的。

也和他共度。甚至连吵架也是重复的,

pdf生成的解决方案(H2p)之H2P展望

相关文章:

你感兴趣的文章:

标签云: