Docx转html,内容重叠

版本23.12
window机器
java

文件和截图
zip.zip (205.6 KB)

@humanhuman, 使用以下代码可以使生成的 HTML 看起来更好:

Document doc = new Document("0.doc");

HtmlSaveOptions opts = new HtmlSaveOptions();
opts.setExportPageMargins(true);
opts.setExportPageSetup(true);

doc.save("out.html", opts);

输出的 HTML 看起来仍然与 Word 文档不同,但这是预期的,因为 在 HTML 中没有页面和页面大小的概念

要生成与 Word 文档完全相同的 HTML,您可以将文档转换为 具有绝对定位元素的 HTML

Document doc = new Document("0.doc");
doc.save("out.fixedhtml.html", SaveFormat.HTML_FIXED);

或者:

Document doc = new Document("0.doc");

HtmlFixedSaveOptions opts = new HtmlFixedSaveOptions();

doc.save("out.fixedhtml.html", opts);
1 Like

好的,我使用HtmlFixedSaveOptions 生成的html确实格式和原doc保持一致,我还有个问题,我想在使用生成的这个html在转换为docx,发现生成的docx页数变了很多,格式也和最开始的doc差了很多,这种有办法吗

zip.zip (218.9 KB)

@humanhuman, 不幸的是,您无法采取任何措施来改善转换结果。 不支持从 HtmlFixed 导入到 DOCX,并且没有计划支持它。