Free Support Forum - aspose.com

Aspose.Pdf For NET转换为EPUB到PDF时部分字符乱码

将epub文件转换为pdf时,部分文字识别不出来
请见压缩包,
image.png (59.8 KB)

而且加载时非常缓慢
epub.zip (9.1 MB)
所用代码如下
string file = openFileDialog1.FileName;
EpubLoadOptions epubload = new EpubLoadOptions();
Console.WriteLine(“start”);
using (Document pdf = new Document(file, epubload))
{
pdf.Save($"{file}.pdf");
Console.WriteLine(“success”);
}

@icejd

使用.NET 20.6的Aspose.PDF,我们能够注意到环境中的问题,并记录如下:

*字体问题-PDFNET-48388
*加载缓慢-PDFNET-48389

我们将进一步调查问题的详细信息,并在解决问题后立即通知您。请给我们一点时间。

对此造成的不便,我们表示歉意

我尝试用 Aspose.Html20.5.0.0转换,字符不再丢失,但是大部分为乱码,可能和字符集有关,但是我没有找到如何设置字符集

所用代码如下
string file = openFileDialog1.FileName;
Console.WriteLine(“start”);
PdfSaveOptions options = new PdfSaveOptions()
{
JpegQuality = 100
};

            Converter.ConvertEPUB(file, options, $"{file}.pdf");
            Console.WriteLine("success");

@icejd

我们能够注意到文件(¦-= + ¦ +í+ ¦ +±.epub)的问题,并在我们的问题跟踪系统中将其记录为HTMLNET-2693。我们将进一步调查该问题的详细信息,并向您发布其解决状态。

此外,我们找不到您的其他文件和输出PDF的任何问题。您能否分享一些屏幕截图,以显示输出PDF中的抓取文本。我们将再次在我们的环境中测试该场景并相应地解决它。

下面这个是epub的标签部分(img1)
image.jpg (168.3 KB)
下面这个是转换后的PDF标签部分(img2)
image.jpg (272.2 KB)

这里是另一个epub的原图
image.png (35.9 KB)
转换后的图
image.png (167.0 KB)

因为我们用的是中文,gb2312编码或utf-8编码,应该还是编码的问题导致的

@icejd

我们能够注意到该问题,并将其记录为HTMLNET-2694在我们的问题跟踪系统中。解决后,我们一定会尽快通知您。请给我们一点时间。

对此造成的不便,我们表示歉意

The issues you have found earlier (filed as HTMLNET-2694) have been fixed in Aspose.HTML for .NET 20.7.

@aspose.notifierq 我没有看到任何的改变,同样的代码,同样的文件,输出的依然是乱码
image.png (19.7 KB)
同样的效果

@icejd

您是否可以检查在末尾使用Aspose.HTML for .NET 20.7生成的附件输出PDF。如果发现其中的任何问题,请在您的环境中打开它来共享屏幕截图。
output.pdf (8.2 MB)

您提供的PDF是正常的,可是我转换后得到的标签部分依然是乱码image.jpg (249.8 KB)
能提供您转换用的代码吗
我用的代码如下
Console.WriteLine(“start”);
PdfSaveOptions options = new PdfSaveOptions()
{
JpegQuality = 100
};

            Converter.ConvertEPUB(file, options, $"{file}.pdf");
            Console.WriteLine("success");

下面这个文档,转换完全是乱码
程序员健康指南.zip (4.1 MB)

@icejd

我们在您共享的环境中使用了相同的代码片段。此外,请确保在系统中安装以下字体:

  • Arial Unicode MS
  • Times New Roman
  • SimSun

另外,请检查所附的PDF文件,该文件是通过转换您最近共享的EPUB文件获得的,如果您发现任何问题,请告知我们。
output.pdf (8.2 MB)