word转xml编辑器,xml如何在word里面修改
word转xml编辑器,xml如何在word里面修改详细介绍
本文目录一览: 如何将word转化为XML格式的文件?
一、使用Jacob转换Word,Excel为HTML
“JACOB一个Java-COM中间件.通过这个组件你可以在Java应用程序中调用COM组件和Win32 libraries。”
首先下载Jacob包,JDK1.5以上需要使用Jacob1.9版本(JDK1.6尚未测试),与先前的Jacob1.7差别不大
1、将压缩包解压后,Jacob.jar添加到Libraries中;
2、将Jacob.dll放至“WINDOWS\SYSTEM32”下面。
需要注意的是:
【使用IDE启动Web服务器时,系统读取不到Jacob.dll,例如用MyEclipse启动Tomcat,就需要将dll文件copy到MyEclipse安装目录的“jre\bin”下面。
一般系统没有加载到Jacob.dll文件时,报错信息为:“java.lang.UnsatisfiedLinkError: no jacob in java.library.path”】
新建类:Java代码 public class JacobUtil { public static final int WORD_HTML = 8; public static final int WORD_TXT = 7; public static final int EXCEL_HTML = 44; /** * WORD转HTML * @param docfile WORD文件全路径 * @param htmlfile 转换后HTML存放路径 */ public static void wordToHtml(String docfile, String htmlfile) { ActiveXComponent app = new ActiveXComponent("Word.Application"); // 启动word try { app.setProperty("Visible", new Variant(false)); Dispatch docs = app.getProperty("Documents").toDispatch(); Dispatch doc = Dispatch.invoke( docs, "Open", Dispatch.Method, new Object[] { docfile, new Variant(false), new Variant(true) }, new int[1]).toDispatch(); Dispatch.invoke(doc, "SaveAs", Dispatch.Method, new Object[] { htmlfile, new Variant(WORD_HTML) }, new int[1]); Variant f = new Variant(false); Dispatch.call(doc, "Close", f); } catch (Exception e) { e.printStackTrace(); } finally { app.invoke("Quit", new Variant[] {}); } } /** * EXCEL转HTML * @param xlsfile EXCEL文件全路径 * @param htmlfile 转换后HTML存放路径 */ public static void excelToHtml(String xlsfile, String htmlfile) { ActiveXComponent app = new ActiveXComponent("Excel.Application"); // 启动word try { app.setProperty("Visible", new Variant(false)); Dispatch excels = app.getProperty("Workbooks").toDispatch(); Dispatch excel = Dispatch.invoke( excels, "Open", Dispatch.Method, new Object[] { xlsfile, new Variant(false), new Variant(true) }, new int[1]).toDispatch(); Dispatch.invoke(excel, "SaveAs", Dispatch.Method, new Object[] { htmlfile, new Variant(EXCEL_HTML) }, new int[1]); Variant f = new Variant(false); Dispatch.call(excel, "Close", f); } catch (Exception e) { e.printStackTrace(); } finally { app.invoke("Quit", new Variant[] {}); } } } 当时我在找转换控件时,发现网易也转载了一偏关于Jacob使用帮助,但其中出现了比较严重的错误:String htmlfile = "C:\\AA";只指定到了文件夹一级,正确写法是String htmlfile = "C:\\AA\\xxx.html"; 到此WORD/EXCEL转换HTML就已经差不多了,相信大家应该很清楚了:) 二、使用XPDF将PDF转换为HTML 1、下载xpdf最新版本,地址: http://www.foolabs.com/xpdf/download.html我下载的是xpdf-3.02pl2-win32.zip 2、下载中文支持包我下载的是xpdf-chinese-simplified.tar.gz 3、下载pdftohtml支持包地址: http://sourceforge.net/projects/pdftohtml/我下载的是:pdftohtml-0.39-win32.tar.gz 4、解压调试1) 先将xpdf-3.02pl2-win32.zip解压,解压后的内容可根据需要进行删减,如果只需要转换为txt格式,其他的exe文件可以删除,只保留pdftotext.exe,以此类推;2) 然后将xpdf-chinese-simplified.tar.gz解压到刚才xpdf-3.02pl2-win32.zip的解压目录;3) 将pdftohtml-0.39-win32.tar.gz解压,pdftohtml.exe解压到xpdf-3.02pl2-win32.zip的解压目录;4) 目录结构: +---[X:\xpdf] |-------各种转换用到的exe文件 | |-------xpdfrc | +------[X:\xpdf\xpdf-chinese-simplified] | | +-------很多转换时需要用到的字符文件 xpdfrc:此文件是用来声明转换字符集对应路径的文件 5) 修改xpdfrc文件(文件原名为sample-xpdfrc)修改文件内容为: Txt代码 #----- begin Chinese Simplified support package cidToUnicode Adobe-GB1 xpdf-chinese-simplified\Adobe-GB1.cidToUnicode unicodeMap ISO-2022-CN xpdf-chinese-simplified\ISO-2022-CN.unicodeMap unicodeMap EUC-CN xpdf-chinese-simplified\EUC-CN.unicodeMap unicodeMap GBK xpdf-chinese-simplified\GBK.unicodeMap cMapDir Adobe-GB1 xpdf-chinese-simplified\CMap toUnicodeDir xpdf-chinese-simplified\CMap fontDir C:\WINDOWS\Fonts displayCIDFontTT Adobe-GB1 C:\WINDOWS\Fonts\simhei.ttf #----- end Chinese Simplified support package 6) 创建bat文件pdftohtml.bat(放置的路径不能包含空格)内容为: Txt代码 @echo off set folderPath=%1 set filePath=%2 cd /d %folderPath% pdftohtml -enc GBK %filePath% exit 7) 创建类 Java代码 public class ConvertPdf { private static String INPUT_PATH; private static String PROJECT_PATH; public static void convertToHtml(String file, String project) { INPUT_PATH = file; PROJECT_PATH = project; if(checkContentType()==0) { toHtml(); } } private static int checkContentType() { String type = INPUT_PATH.substring(INPUT_PATH.lastIndexOf(".") + 1, INPUT_PATH.length()) .toLowerCase(); if (type.equals("pdf")) return 0; else return 9; } private static void toHtml() { if(new File(INPUT_PATH).isFile()) { try { String cmd = "cmd /c start X:\\pdftohtml.bat \"" + PROJECT_PATH + "\" \"" + INPUT_PATH + "\""; Runtime.getRuntime().exec(cmd); } catch (IOException e) { e.printStackTrace(); } } } } String cmd = "....";此处代码是调用创建的bat文件进行转换 8) 测试转换 Java代码 public static void main(String[] args) { ConvertPdf.convertToHtml("C:\\test.pdf", "X:\\xpdf"); }
在word文件中选择另存为 在弹出的对话框中的格式选择xml格式的 然后保存即可
望采纳
1、把word文件转换成XML格式,可以通过另存为的方式获得。打开word,在文件中选择“另存为”在保存类型中选取word XML即可。
2、具体操作如下。
另存为
计算机
保存类型“word XML"
确定
在word中无法打开的文件是
有时候在打开word2010时会出现问题,显示“无法打开文件,因为内容有错误”,进一步打开详细信息,显示“元素结束标记中的名称必须与开始标记中的元素类型相匹配”。自带的修复不起作用、网上流传的Rebulider插件也不起作用(因为该插件是针对由于公式导致的错误,如果不是公式导致的就没法修复)。最终冥思苦想,采取了根据错误信息提示,在XML编辑器找到错误的数据范围,然后在用文本打开的XML文件中把错误除去的方法实现修复。
(请放心,无需编程)
开启分步阅读模式
工具材料:
问题word文档
XML编辑工具(例如Firstobject XML editor)
记事本
操作方法
01
最开始出现问题时出现的界面如下:
02
首先用压缩软件打开word文档(直接打开,而不是先压缩后打开),找到文件夹word下的document.xml文件,用Firstobject XML editor软件将其打开。
03
打开后,在界面下方会提示软件鉴别出的编码错误,需要记住位置(例子中是40591956),右小角会随着光标显示位置信息。右侧是一堆代码,左边是对代码进行分段的结果。我们要做的就是结合文件显示的错误信息和word中错误信息,找到错误代码位置,这通过点击左侧的不同的段判定。(一般都在最后的w:body,点击加号可以打开扩展菜单)
04
当点击到某一段,在右小角显示的位置数字(该数字为该段起始位置的信息)仅比目标数字大一点,可确定目标错误代码就在
上一段中。点击段号,把内容复制下来。然后直接在通过压缩文件打开的word中,打开document.xml,查找(ctrl+F)查找复制的错误代码,然后删除。
05
一般到这步已经基本掌握了方法,剩下的就是把错误挑出去。最后将文本保存并关闭,系统自动提醒是否保存在压缩文件中,选是,一切大功告成。
特别提示
文本文件修改后一定要保存进压缩文件里,否则无法生效。
freemaker通过word转换成XML模板,再通过XML模板导出Word
Aspose.PDF不能将word文件转换成PDF文件,因此就会出现aspose把word文档转换为pdf文档时出现乱码情况。
aspose的官网上查了下文档,Aspose.PDF无法直接转换word文档,需要先有个中间步骤。就是先把word转换成XML格式的文件,再使用Aspose.PDF绑定这个XML,再保存为PDF格式。如果word文档中有图片,则生成XML的时候会在临时文件夹中生成图片。
C# 如何开发类似Word操作方式的XML编辑器?
这个喊人帮你写是要收钱的帅哥!如果完全模仿word,那不是一个人能搞定的事情,要一个小组。
如下:
private void button1_Click_1(object sender, EventArgs e)
{
textBox1.Text = "22";
Application.DoEvents();//告诉系统立刻处理当前所有的windows消息
delay_2S();
}
如果对您有帮助,请记得采纳为满意答案,谢谢!祝您生活愉快!
vaela
如何在word中使用xml schema
、开MyEclipse,从菜单栏找到“Window”--->“Preferences(首选项)”;
2、在左侧导航菜单栏找到“MyEclipse”--->“Files and Editors”---->“XML”--->“XML
Catalog”;
3、在右边的界面中,选择“User Specified Entries”,点击右边的“Add...”;
4、在弹出的“Add XML Catalog Element”对话框中点击“File System...”,为Location输入框添加XSD文件所在路径;
5、.xsd文件添加后,在下面的“Key:”右边的文本框会自动添加一个URI,如Spring的为:
http://www.springframework.org/schema/beans,如果没有自动添加,使用别的文本编辑器打开此.xsd文件,找到相应的
名称空间声明;
6、“Key Type:”右边的下拉框中有“Namespace Name”与“Schema Location”两个选项,
将Key Type置为Schema Location;如果是DTD,那里将会有三个类型:Public ID,System ID,URI;
7、在Key:右边的文本框中的URI后面加上/,再加上此xsd的名字,
如spring-beans-2.5.xsd的key为:
http://www.springframework.org/schema/beans/spring-beans-2.5.xsd;
8、点击“OK”保存后,即可看到“User Specified Entries”已有了所增加的xsd;
9、重启MyEclipse即可,注意如果提示不出来,并在状态栏的左下出现“Content Assist not available at the current location”,请在光标位置键入一个空格再使用Alt+/试试;
保存完好的word文档变成XML文档了,如何恢复?
可能是安装了一些xml编辑器有关。卸载xml编辑器
怎么将XML文档转成WORD文档
将XML文件转换为Word的方法如下(以Windows10系统的Word2016版为例):
1、在电脑桌面或文件夹内找到xml文件,并右键点击,选择“打开方式”按钮。
2、在随后自动进入的菜单中点击“记事本”。
3、使用记事本打开后,使用键盘快捷键“Ctrl+A”全选,随后使用键盘快捷键“Ctrl+C”复制所有内容。
4、使用桌面搜索或双击桌面上的快捷方式打开Word应用程序。
5、在接着打开界面的右侧点击“空白文档”,新建一个空白文档。
6、在随后进入的界面中使用键盘快捷键“Ctrl+V”粘贴xml内容即可。
xml如何在word里面修改
用支持折叠的编辑器编辑,比如
notepad++
notepad2
ultraedit
等等
一般支持程序高亮的编辑器都可以。
但是word显然不是这样的东西。word是为排版和字处理设计的,不是为程序设计的。不具备此方面功能。用记事本(notepad)都比word好
实在要用从从word里选“打开”然后选择“所有格式”然后选择那个xml
WORD文档提示“无法打开文件 ,因为内容有错误”
WORD文档提示“无法打开文件 ,因为内容有错误” WORD文档提示“无法打开文件 ,因为内容有错误”的话,可以先采取自带的修复工具就行修复,不起作用的话可以在XML编辑器找到错误的数据范围,然后在用文本打开的XML文件中把错误除去的方法实现修复。
具体操作步骤如下:
首先用压缩软件打开word文档,找到文件夹word下的document.xml文件,用Firstobject XML editor软件将其打开。
打开后,在界面下方会提示软件鉴别出的编码错误,需要记住位置,右小角会随着光标显示位置信息。右侧是一堆代码,左边是对代码进行分段的结果。我们要做的就是结合文件显示的错误信息和word中错误信息,找到错误代码位置,这通过点击左侧的不同的段判定。
当点击到某一段,在右小角显示的位置数字仅比目标数字大一点,可确定目标错误代码就在上一段中。点击段号,把内容复制下来。然后直接在通过压缩文件打开的word中,打开document.xml,查找查找复制的错误代码,然后删除。最后将文本保存并关闭,系统自动提醒是否保存在压缩文件中,选是,一切大功告成。
打开Microsoft Office Word 97-2003 文档时显示“无法打开文件normal,因为内容有错误” 感觉是模板错误,你可以试着保存(新建)一份模板。或者找到对应的文件删除。看能不能解决问题。或者看看OFFICE文件夹里面有没有加载项(选项里面有),全部删除加载项。要不就重装OFFICE2007.祝好运
Win7打开word提示“无法打开文件Normal因为内容有错误”怎么办, 遇到word显示“无法打开文件normal,因为内容有错误”怎么办,希望有空回 打开我的电脑,工具-文件夹选项-查看,先设置成显示所有文件和文件夹,然后打开C:\Documents and Settings\用户名\Application Data\Microsoft\Templates将Normal.dot删除,或者包含隐藏文件搜索Normal.dot,搜索到之后将其删除;如果还是解决不了,建议重装吧,还快的多的解决问题。
word 2007无法打开文件因为内容有错误,怎么办 1.右键点击桌面空白区域,选择新建,先创建一个Word文件。 2.进入Word主界面,点击上方菜单栏处的【开发工具】选项。 3.进入开发工具界面,点击下方子菜单里面的【文档模板】。 4.进入模板加载项属性对话框,点击文档模板右方的【选用】。 5.然后在弹出的文档模板路径文件夹下,找到【Normal.dotm】模板,将其删除,问题解决。
求高手指点,打开word出错,“无法打开文件Normal,因为内容有错误” 删除C:\Documents and Settings\Administrator\Application Data\Microsoft\Templates里面的Norma.dot
word无法打开文件,因为内容有错误 位置:部份:/word/document.xml,行:2,列:0 可以尝试: 1、在安全模式下打开(能打开说明软件模板问题,到C盘DocumentsandSettings\\Administrator\\Application Data\\Microsoft\\Templates”目录,删除其中的“Normal.dot”公用模板文件即可。) 2、重新安装word,仍然不行,就是文件问题。 3、文件问题,网上下载文件修复软件,修复文件就好。
word2003文档打不开了,错误提示“无法打开office Open XML文件XXX.docx,因为内容有错误” docx是07以上的版本的,你要下载个office 2007的兼容包,大小要37M左右的,下载后,安装下就可以用了,安装包,百度上搜下就有了。
求高手恢复文档,是word 2007的。显示错误是 无法打开office open xml 文件,因为内容有错误 打开方式选为,记事本或写字板,新建word复制粘贴就好了,上次就这样帮同学把毕业论文弄好的
尽力的恢复了.呵呵.希望帮到你了.