Pdf文件转word,再将word文件转pdf文件后,转换后的pdf文件中文显示乱码

我是将代码在linux操作系统下运行(centos7),转换后的pdf文件中文乱码,如下:

文件在下面这个压缩包中,其中1.pdf是源文件,java.docx是转换的docx文件,java_1.pdf是docx文件转换后的pdf文件;
文件.zip (3.9 MB)

代码如下:
代码.zip (650 字节)

@aspose1111 我无法在我这边重现该问题。
出现此问题的原因可能是原始文档中使用的字体在执行文档转换的环境中不可用。 要构建文档布局,Aspose.Words 需要文档中使用的字体。 如果 Aspose.Words 找不到文档中使用的字体,字体被替换 。 这可能会导致字体不匹配和文档布局差异,并因此返回不正确的页码。 您可以实施 IWarningCallback 以在执行字体替换时获取通知。

请问你是在centos7环境上面试的吗?我在本地windows环境上面是正常的,但是在linux上面就有这种问题。

具体原因应该是pdf文件在转为docx文件后,docx文件的字体发生了变化。

@aspose1111 Aspose.PDF 生成的 DOCX 文档已将字体嵌入到文档中。 但看起来字体不包含所需的字形。 如果字体没有所需的字形,则会呈现未知字符。 因此,请尝试提供所需的字体。 这必须解决问题。 请参阅我们的文档以了解 Aspose.Words 在何处查找字体:
https://docs.aspose.com/words/java/specify-truetype-fonts-location/
https://docs.aspose.com/words/java/install-truetype-fonts-on-linux/

We have opened the following new ticket(s) in our internal issue tracking system and will deliver their fixes according to the terms mentioned in Free Support Policies.

Issue ID(s): WORDSNET-26335

You can obtain Paid Support Services if you need support on a priority basis, along with the direct access to our Paid Support management team.

The issues you have found earlier (filed as WORDSNET-26335) have been fixed in this Aspose.Words for Java 24.1 update.