docx转PDF,转换后的PDF中,部分文字搜索不到

源文件关键字存在为:$[officialseal] 字体楷体,大小小四,颜色透明

源文件:浙金信托-安熠1号-信托合同-0126-初始登记(源).docx (175.4 KB)

转换后打开PDF文件,文件中搜索不到$[officialseal]

@ZhonghaoSun

你尝试将一个包含特定格式文字(楷体、小四、透明颜色)的 DOCX 文件转换为 PDF,但在转换后的 PDF 中无法搜索到该文字 。这可能与字体处理或透明度支持有关。

建议解决方案:

  1. 尝试使用不透明颜色
  • 将文字颜色改为不透明颜色(如黑色),以确保其在 PDF 中可被正常识别和搜索。
  1. 检查字体嵌入情况
  • 确认 SimSun 字体是否已正确嵌入到 PDF 中。若字体未嵌入,可能会导致搜索功能异常 。
  1. 测试其他字体
  • 更换为其他常用字体(如宋体、黑体)查看是否仍存在搜索问题。
  1. 联系 Aspose 支持
  • 若问题依旧存在,建议提供一个最小可复现示例并提交给 Aspose 支持团队进一步排查 。

你可以继续在此线程中提供更多细节,我们将尽力协助你解决问题。

@ZhonghaoSun 这是预期行为。如果您使用 MS Word 将文档转换为 PDF,将会得到完全相同的结果。我已经简化了您的文档,以下是 Aspose.Words 和 MS Word 生成的输出文档。
in.docx (43.2 KB)
MS Word: ms.pdf (20.3 KB)
Aspose.Words: out.pdf (15.9 KB)