icejd
June 9, 2020, 10:26am
1
将epub文件转换为pdf时,部分文字识别不出来
请见压缩包,
image.png (59.8 KB)
而且加载时非常缓慢
epub.zip (9.1 MB)
所用代码如下
string file = openFileDialog1.FileName;
EpubLoadOptions epubload = new EpubLoadOptions();
Console.WriteLine(“start”);
using (Document pdf = new Document(file, epubload))
{
pdf.Save($"{file}.pdf");
Console.WriteLine(“success”);
}
@icejd
使用.NET 20.6的Aspose.PDF,我们能够注意到环境中的问题,并记录如下:
*字体问题-PDFNET-48388
*加载缓慢-PDFNET-48389
我们将进一步调查问题的详细信息,并在解决问题后立即通知您。请给我们一点时间。
对此造成的不便,我们表示歉意
icejd
June 10, 2020, 3:10am
3
我尝试用 Aspose.Html20.5.0.0转换,字符不再丢失,但是大部分为乱码,可能和字符集有关,但是我没有找到如何设置字符集
所用代码如下
string file = openFileDialog1.FileName;
Console.WriteLine(“start”);
PdfSaveOptions options = new PdfSaveOptions()
{
JpegQuality = 100
};
Converter.ConvertEPUB(file, options, $"{file}.pdf");
Console.WriteLine("success");
@icejd
我们能够注意到文件(¦-= + ¦ +í+ ¦ +±.epub )的问题,并在我们的问题跟踪系统中将其记录为HTMLNET-2693 。我们将进一步调查该问题的详细信息,并向您发布其解决状态。
此外,我们找不到您的其他文件和输出PDF的任何问题。您能否分享一些屏幕截图,以显示输出PDF中的抓取文本。我们将再次在我们的环境中测试该场景并相应地解决它。
icejd
June 11, 2020, 1:33am
5
下面这个是epub的标签部分(img1)
image.jpg (168.3 KB)
下面这个是转换后的PDF标签部分(img2)
image.jpg (272.2 KB)
这里是另一个epub的原图
image.png (35.9 KB)
转换后的图
image.png (167.0 KB)
因为我们用的是中文,gb2312编码或utf-8编码,应该还是编码的问题导致的
@icejd
我们能够注意到该问题,并将其记录为HTMLNET-2694 在我们的问题跟踪系统中。解决后,我们一定会尽快通知您。请给我们一点时间。
对此造成的不便,我们表示歉意
The issues you have found earlier (filed as HTMLNET-2694) have been fixed in Aspose.HTML for .NET 20.7 .
icejd
August 22, 2020, 2:34am
8
@aspose.notifierq 我没有看到任何的改变,同样的代码,同样的文件,输出的依然是乱码
image.png (19.7 KB)
同样的效果
@icejd
您是否可以检查在末尾使用Aspose.HTML for .NET 20.7生成的附件输出PDF。如果发现其中的任何问题,请在您的环境中打开它来共享屏幕截图。
output.pdf (8.2 MB)
icejd
August 30, 2020, 7:59am
10
您提供的PDF是正常的,可是我转换后得到的标签部分依然是乱码image.jpg (249.8 KB)
能提供您转换用的代码吗
我用的代码如下
Console.WriteLine(“start”);
PdfSaveOptions options = new PdfSaveOptions()
{
JpegQuality = 100
};
Converter.ConvertEPUB(file, options, $"{file}.pdf");
Console.WriteLine("success");
下面这个文档,转换完全是乱码
程序员健康指南.zip (4.1 MB)
@icejd
我们在您共享的环境中使用了相同的代码片段。此外,请确保在系统中安装以下字体:
Arial Unicode MS
Times New Roman
SimSun
另外,请检查所附的PDF文件,该文件是通过转换您最近共享的EPUB文件获得的,如果您发现任何问题,请告知我们。
output.pdf (8.2 MB)
The issues you have found earlier (filed as PDFNET-48389) have been fixed in Aspose.PDF for .NET 24.7 . This message was posted using Bugs notification tool by asad.ali