Word 内容怎么转换成html内容

word 内容怎么转换成html内容

@Tiaohh 您可以使用以下简单代码将 MS Word 文档转换为 HTML:

import aspose.words as aw

doc = aw.Document("C:\\Temp\\in.docx")
doc.save("C:\\Temp\\out.html")

请参阅我们的文档以获取更多信息:
https://docs.aspose.com/words/python-net/convert-a-document-to-html-mhtml-or-epub/

但您应该注意,Aspose.Words 设计用于处理 MS Word 文档。 HTML 文档和 MS Word 文档对象模型有很大不同,将一种格式转换为另一种格式后并不总是能够提供 100% 的保真度。 在大多数情况下,Aspose.Words 在处理 HTML 文档时会模仿 MS Word 的行为。

如果输出 HTML 是用于查看目的,即不应对其进行编辑或处理,则可以考虑使用 HtmlFixed 格式。 在这种情况下,输出应该与 MS Word 中的输出完全相同:

doc = aw.Document("C:\\Temp\\in.docx")

opt = aw.saving.HtmlFixedSaveOptions()
opt.export_embedded_css = True
opt.export_embedded_fonts = True
opt.export_embedded_images = True
opt.export_embedded_svg = True

doc.save("C:\Temp\out_html_fixed.html", opt)

HtmlFixed 格式旨在保留原始文档布局以供查看。 因此,如果您的目标是在页面上显示 HTML,那么可以考虑使用此格式作为替代方案。