Word to pdf 格式问题

word to pdf后格式出现问题

source:image.png (76.5 KB)
resout:image.png (193.7 KB)

source: 调解笔录 (3).docx (10.5 KB)
resout:调解笔录 (3).pdf (57.4 KB)

com.aspose.words.Document doc = new com.aspose.words.Document(sourceInputStream);
ByteArrayOutputStream out = new ByteArrayOutputStream();
doc.save(out, WordConvertType .PDF.getCode());

version:20.11

@felix0, 在您的文档中,Normal 样式具有东亚语言的 en-US 语言环境:

  <w:style w:type="paragraph" w:default="1" w:styleId="1">
    <w:name w:val="Normal"/>
    <w:qFormat/>
    <w:uiPriority w:val="0"/>
    <w:rPr>
      <w:rFonts w:ascii="Times New Roman" w:hAnsi="Times New Roman" w:eastAsia="Times New Roman" w:cs="Times New Roman"/>
      <w:sz w:val="24"/>
      <w:szCs w:val="24"/>
      <w:lang w:val="en-US" w:eastAsia="en-US" w:bidi="ar-SA"/>
    </w:rPr>
  </w:style>

因此,Aspose.Words 不对中文文本应用换行规则。 这可以使用以下代码修复:

Document doc = new Document("调解笔录 (3).docx");
doc.getStyles().get("Normal").getFont().setLocaleIdFarEast(EditingLanguage.CHINESE_PRC);
doc.save("out.fixedlocale.pdf");

out.fixedlocale.pdf (58.4 KB)

Microsoft Word 以不同方式显示第一行错误:

您是否在 Microsoft Word 中创建了 image.png? 您能否在 Microsoft Word 中打开您的文档,将其另存为 PDF 并附上此 PDF 以供分析?

通过对比我发现:使用Microsoft Word的 “export to pdf”时可以达到我想要的效果(不间断空格是紧凑的),但是使用另存为pdf时和word时是一样的
docx:
调解笔录 (3).docx (15.0 KB)
Microsoft Word截图:
image.png (71.1 KB)
另存为的pdf:调解笔录 (3)—.pdf (123.6 KB)
另存为的pdf截图:
image.png (76.5 KB)
通过Microsoft Word 的 “export to pdf” 功能导出的pdf截图:
image.png (75.5 KB)
通过Microsoft Word 的 ”export to pdf“ 功能导出的pdf:
调解笔录 (3)(2).pdf (91.9 KB)

请问用什么方式可以达到 Microsoft Word 的 “export to pdf” 功能导出的效果

@felix0, 您用什么程序制作 解解笔记(3)(2).pdf? 此文件看起来不像是由 Microsoft Word 创建的。 如果它是在 Microsoft Word 中创建的,您能否提供具体步骤和屏幕截图?

Aspose.Words 试图产生类似于 Microsoft Word 的结果。 其他程序,例如 WPS Writer 可能会以不同方式呈现文档,但 Aspose.Words 不会复制其他程序的行为。

调解笔录 (3)(2).pdf 是用Microsoft Word 创建的,步骤如下:
1.点击左上角文件
2.点击export to pdf
image.png (55.9 KB)
image.png (39.2 KB)
使用的是 Microsoft Word 2016

@felix0, 调解笔记 (3)—.pdf 是由 Microsoft Word 创建的,因为它具有以下元数据:

当您通过此菜单项转换文档时,Microsoft Word 会添加此信息:

调解笔记 (3)(2).pdf 的元数据看起来不同:

看起来 export to pdf 菜单项是由某些加载项添加的。您可以制作“加载项”对话框的屏幕截图吗?

我好像明白了,“word to pdf” 选项是Microsoft Word通过wps来实现的,并不是Microsoft Word拥有的功能
加载项截图:

@felix0, 我猜测“导出为 pdf”菜单项是由加载项提供的是正确的。 具体来说,这个菜单项是由 WPS Office 插件添加的。 因此,当您单击“导出为 pdf”菜单项时,文档将发送到 WPS Writer 并由 WPS Writer 转换为 PDF。

WPS Writer 和 Microsoft Word 可以不同方式呈现文档。 Aspose.Words 试图仅复制 Microsoft Word 的行为。