Aspose word转pdf 中英文换行问题

使用doc文件转pdf,中英文在一块,会换行


我的文件是doc格式的
使用的aspose.word 25.5

LoadOptions optionss = new LoadOptions();
optionss.getLanguagePreferences().setDefaultEditingLanguage(EditingLanguage.CHINESE_PRC);
Document doc = new Document(wordPath,optionss);
FileOutputStream fileOS = new FileOutputStream(pdfPath);
doc.getCompatibilityOptions().optimizeFor(MsWordVersion.WORD_2019);
doc.save(pdfPath);
fileOS.close();

@kin58 请提供输入和输出文件。

可是我的文件是doc格式,不支持该格式上传

我的文件是doc格式,怎么样可以上传

@kin58 您可以将其压缩并在此处附加.zip文件。

注意 第一页、第二页、第九页、第十三页 ,感觉是中英文在一行转换pdf后就有问题

20250329043_AP.zip (400.4 KB)

@kin58 如果您不使用doc.getCompatibilityOptions().optimizeFor(MsWordVersion.WORD_2019);,则可以解决一些问题,因为在这种情况下布局可能不同,MS Word会产生相同的结果。其他问题与标点符号后的不同空格有关。

感谢您报告此问题。 我们已经在我们的内部问题跟踪系统中打开了以下新工单,并将根据 免费支持政策 中提到的条款提供它们的修复:

Issue ID(s): WORDSNET-28370

如果您需要优先支持以及直接联系我们的付费支持管理团队,您可以获得 付费支持服务

其他问题与标点符号后的不同空格有关。
是aspose自己还没适配这种情况吗?还是说通过什么设置来避免这种情况

与标点符号后的不同空格有关,这样设置后 确实能解决一部分问题,但是还是有一些细微区别,还有哪些问题呢

@kin58 在文本中,逗号和冒号后有不同的空格,这与 Aspose.Words 的问题有关,除了在 .doc 文件中更改字体外,没有其他解决方法来避免这个问题。

我发现 这个文件 docx转pdf 是没有问题的

@kin58 在您的情况下,.docx 的显示结果比较稳定,这是件好事,但它在显示中文字符和标点符号时也会出现一些问题。

@kin58 分析表明,MS Word 可以根据系统地域为所附文档生成不同的布局。 我附上了 MS Word 生成的 2 个 PDF 文件,一个是英文系统版本,另一个是中文系统版本。 如果比较一下,您会发现 MS Word 可以对同一文档的行进行不同的换行。

input.word2019.cn.locale.pdf (714.4 KB)
input.word2019.en.locale.pdf (753.4 KB)

能否提供一份您认为正确的由 MS Word 制作的 PDF 文档?

这俩个都有问题,en的从第17页开始才有问题,cn的从第一页开始就有问题。

20250329043_AP.pdf (774.3 KB)

这个我认为是对的

@kin58 感谢您提供的信息。

那么 这个问题还有什么办法可以优化掉吗

@kin58 我们将继续进行分析,以提供更多信息。