Aspose.Word For Java 将html转化为html不能保持样式,且生成多余段落。

这是我的测试代码:

Document document = new Document("D:\\test\\original.html");
document.save("D:\\test\\generated.html");

这是原HTML文件以及生成的HTML文件:test.zip (49.5 KB)

可以看到
1、图片样式被替换为

style="-aw-left-pos:0pt; -aw-rel-hpos:column; -aw-rel-vpos:paragraph; -aw-top-pos:0pt; -aw-wrap-type:inline"

当我删除原HTML图片的样式后,仍然会自动添加以上样式。
如何保持原来图片的样式?或者能不能取消自动生成?

2、生成的HTML文件末尾自动生成了以下段落:

<p style="margin-top:0pt; margin-bottom:0pt"><span style="-aw-import:ignore">&#xa0;</span></p>
<div style="-aw-headerfooter-type:footer-primary; clear:both">
    <p style="margin-top:0pt; margin-bottom:0pt">
        <span style="font-weight:bold; color:#ff0000">
            Created with an
            evaluation copy of Aspose.Words. To discover the full versions of our APIs please visit:
            https://products.aspose.com/words/
        </span>
    </p>
</div>

当我导入license之后,仍然会有以下两个空白段落:

<p style="margin-top:0pt; margin-bottom:0pt"><span style="-aw-import:ignore">&#xa0;</span></p>
<p style="margin-top:0pt; margin-bottom:0pt; font-size:12pt"><span style="-aw-import:ignore">&#xa0;</span></p>

如何去除这两个多余的空白段落?

@suhjt

  1. 不幸的是,在使用 Aspose.Words 处理后,无法保留原始 HTML 文档结构。
    请注意,Aspose.Words 设计用于处理 MS Word 文档。 在加载 HTML 文档时,它被转换为 Aspose.Words DOM,并且由于 HTML 文档和 MS Word 文档对象模型的差异,在处理 HTML 文档后并不总是能够提供 100% 的保真度。

  2. 这些段落是评估信息。 在评估模式下使用 Aspose.Words 时添加。
    此外,您的输入文档仅包含一个表格。 在 MS Word 文档中,表格不能作为文档的最后一个节点,所以如果表格是文档的最后一个节点,Aspose.Words 会自动添加一个空段落。

那么可以设置其他模式吗?

@suhjt 不,不幸的是,没有办法避免在文档的最后一个表格之后添加一个空段落。 这是预期的行为。

你好,请问在此处上传的文件有相关隐私保护吗?

@suhjt 是的,在论坛中附加文档是安全的。 附件只能由您作为主题启动者和 Aspose 工作人员访问。

那么有相关隐私声明吗?比如Aspose 工作人员仅将附件文档用于调试定位问题这样的声明。

@suhjt 请参阅此处的“文件保留政策”部分:
https://about.aspose.com/security/customer-data-and-security/

@alexey.noskov 好的,谢谢!

1 Like