6691683525948_.pic.png (28.8 KB)
这是我的word文档,使用aspose转换成html后格式发生变化,请问有解决方式吗
6701683525955_.pic.png (52.9 KB)
wordTohtml.zip (67.1 KB)
Document doc1 = new Document("/Users/zhanglinchao/IdeaProjects/mrframe/src/main/resources/static/doc/SetDrByUserWord2/bf3a6fa74ba94f3496087417b7d09982-page3.docx");
doc1.save("/Users/zhanglinchao/IdeaProjects/mrframe/src/main/resources/static/doc/SetDrByUserWord2/test.html",SaveFormat.HTML);
基本就是这两段代码,html宽度设置为1123px,高度794px
@z2631632737, 从您之前的帖子看不清楚问题出在哪里。您能否解释一下转换后输出的 HTML 应该是什么样子,以及为什么您认为附加的 HTML 文件不正确?
Aspose.Words 可以将 Word 文档转换为 HTML(flow-layout)或 HTMLFixed(fixed-layout)。 您可以在此处阅读有关差异的更多信息:https://docs.aspose.com/words/java/rendering/。 也许 HTMLFixed 是您要找的东西? 下面是将文档转换为 HTMLFixed 的示例代码:
Document doc1 = new Document("bf3a6fa74ba94f3496087417b7d09982-page3.docx");
doc1.save("test.html",SaveFormat.HTML_FIXED);
我们需要用HTML方式的转换,因为我们要在Html文件上做二次改造,但是这种方式转换出来后格式跟Word上有出入,导致后续无法进行
主要问题就是出在我上面那份文件的转换的地方
@z2631632737, 将 Word 文档转换为 HTML 时,Microsoft Word 和 Aspose.Words 都不能生成与原始 Word 文档完全相同的 HTML。
以下是您的 Word 文档在 Microsoft Word 中的外观:
通过 Microsoft Word 将此 Word 文档转换为 HTML 后,输出的 HTML 在浏览器中看起来有所不同:
通过 Aspose.Words 转换为 HTML 的 Word 文档在浏览器中看起来更接近原始文档: