Aspose word转pdf再转html之后格式乱码

使用aspose word将文档转换成PDF再转HTML后,内容格式错乱,请查找下原因以及解决方案
换错乱问题.
pdf转换错乱问题.docx (213.8 KB)

转换前原文档:文叔叔 - 传文件,找文叔叔(永不限速) 复制链接到浏览器打开
备注:需要把Word转PPT测试

@SalesDhorde 下面是一个将文档转换为 ppt 的示例:

doc → pdf → html 的问题与包含 pdf 文件中位置信息的 TOC 字段有关。我会在这里寻找任何解决方案。

@SalesDhorde 感谢您报告此问题。 我们已经在我们的内部问题跟踪系统中打开了以下新工单,并将根据 免费支持政策 中提到的条款提供它们的修复:

Issue ID(s): WORDSNET-26979

如果您需要优先支持以及直接联系我们的付费支持管理团队,您可以获得 付费支持服务

@SalesDhorde 遗憾的是,没有任何变通办法可以获得正确的结果。Aspose.Words 设计用于 MS Word 文档。MS Word 文档是流程文档,其结构与 Aspose.Words 文档对象模型非常相似。另一方面,PDF 文档是固定页面格式的文档。在加载 PDF 文档时,Aspose.Words 会将固定页面文档结构转换为流程文档对象模型。遗憾的是,这种转换并不能保证 100% 的保真度。

由于 PDF 文档中没有标题信息,因此无法添加新的 TOC。因此,Aspose.Words 只能保留文本格式。