Aspose.pdf 提取pdf 文件,中文乱码,初步判断是字符编码问题,但找不到指定 encode的方法,如何解决

Document file = new Document(stream);
TextAbsorber ta = new TextAbsorber();
ta.Visit(file);

请问如何指定encode解决提取中文字符乱码问题

@jasonzhang001

请确保您的系统中已正确安装支持中文字符的字体。如果问题仍然存在,请分享您在系统中注意到的示例 PDF 文档和垃圾文本的屏幕截图。我们将在我们的环境中测试该场景并相应地解决它。

KSC12312401014_CON.pdf (278.2 KB)

8a213effcc10f27917b93f95e487e27.png (43.3 KB)

@jasonzhang001

我们已在内部问题跟踪系统中打开以下新票证,并将根据 Free Support Policies 中提到的条款提供修复。

问题 ID:PDFNET-56187

如果您需要优先支持,以及直接联系我们的付费支持管理团队,您可以获取 Paid Support Services