Docx转换pdf为什么会出现乱码

出现乱码
image.jpg (38.3 KB)

@hhh1111 您的问题很可能是因为文档中使用的字体在文档转换为 PDF 的环境中不可用。请注意,Aspose.Words 需要文档中使用的字体,以便在转换为 PDF 时构建文档布局。如果 Aspose.Words 无法找到文档中使用的字体,则会使用替代字体。由于字体度量标准不同,这可能会导致字体不匹配和文档布局差异。

通常,我们需要使用 IWarningCallback 来获取漏掉的字体。但 Aspose.Words for Python 现在不支持任何回调。因此,我认为获得正确结果的一种方法是检查文档使用了哪些字体,并尝试找出漏掉的字体。

doc = aw.Document("input.docx")

all_fonts = doc.font_infos

# 打印文档中所有已使用和未使用的字体。
for i in range(all_fonts.count):
    print(f"Font index #{i}")
    print(f"\tName: {all_fonts[i].name}")
    print(f'\tIs {"" if all_fonts[i].is_true_type else "not "}a TrueType font')