将 Word 文档转换为 HTML 的问题

6691683525948_.pic.png (28.8 KB)
这是我的word文档,使用aspose转换成html后格式发生变化,请问有解决方式吗
6701683525955_.pic.png (52.9 KB)

@z2631632737, 在我们分析您的问题之前,能否请您附上您的Word文档、输出的HTML和您用于转换的示例代码?

wordTohtml.zip (67.1 KB)
Document doc1 = new Document("/Users/zhanglinchao/IdeaProjects/mrframe/src/main/resources/static/doc/SetDrByUserWord2/bf3a6fa74ba94f3496087417b7d09982-page3.docx");
doc1.save("/Users/zhanglinchao/IdeaProjects/mrframe/src/main/resources/static/doc/SetDrByUserWord2/test.html",SaveFormat.HTML);

基本就是这两段代码,html宽度设置为1123px,高度794px

@z2631632737, 从您之前的帖子看不清楚问题出在哪里。您能否解释一下转换后输出的 HTML 应该是什么样子,以及为什么您认为附加的 HTML 文件不正确?

Aspose.Words 可以将 Word 文档转换为 HTML(flow-layout)或 HTMLFixed(fixed-layout)。 您可以在此处阅读有关差异的更多信息:https://docs.aspose.com/words/java/rendering/。 也许 HTMLFixed 是您要找的东西? 下面是将文档转换为 HTMLFixed 的示例代码:

Document doc1 = new Document("bf3a6fa74ba94f3496087417b7d09982-page3.docx");
doc1.save("test.html",SaveFormat.HTML_FIXED);

我们需要用HTML方式的转换,因为我们要在Html文件上做二次改造,但是这种方式转换出来后格式跟Word上有出入,导致后续无法进行

主要问题就是出在我上面那份文件的转换的地方

@z2631632737, 将 Word 文档转换为 HTML 时,Microsoft Word 和 Aspose.Words 都不能生成与原始 Word 文档完全相同的 HTML。

以下是您的 Word 文档在 Microsoft Word 中的外观:

通过 Microsoft Word 将此 Word 文档转换为 HTML 后,输出的 HTML 在浏览器中看起来有所不同:

通过 Aspose.Words 转换为 HTML 的 Word 文档在浏览器中看起来更接近原始文档: