Free Support Forum - aspose.com

Pdf文件转换为html


#1

用Aspose.PDF For.NET测试的;

问题1:

我的需求是pdf文件转换为html文件,然后解析html得到stringhtml(html格式)字符串,保存到xml文件相应节点中。但是通过Aspose.PDF For.NET将PDF转换成HTML得到的是有关联文件的html,会产生一个文件夹,但是我这边想得到没有关联文件的单个html文件,单个HTML文件就能包含PDF中的图片信息。如图:图片.png (36.3 KB)
问题2
为何产生的html文件,用ie浏览器打开都只是在页面的左边。
图片.png (44.4 KB)
代码示例:
图片.png (13.6 KB)


#2

@zg0x1231

感谢您与我们联系。

您能否与我们分享您的样本PDF文档?我们将在我们的环境中测试场景并相应地解决它。


#3

TEST.zip (207.7 KB)


#4

@zg0x1231

感谢您分享示例PDF文件。

要生成包含所有资源的单个HTML文件,请使用以下代码段。我们已经使用Aspose.PDF for .NET 18.7测试了该场景,并且能够生成单个HTML文件。为了您的类型参考,还附加了输出HTML文件。

Document doc = new Document(dataDir + "pdf测试文件.pdf");
HtmlSaveOptions newOptions = new HtmlSaveOptions();
newOptions.PartsEmbeddingMode = HtmlSaveOptions.PartsEmbeddingModes.EmbedAllIntoHtml;
// 这只是IE的优化,可以省略
newOptions.LettersPositioningMethod = HtmlSaveOptions.LettersPositioningMethods.UseEmUnitsAndCompensationOfRoundingErrorsInCss;
newOptions.RasterImagesSavingMode = HtmlSaveOptions.RasterImagesSavingModes.AsEmbeddedPartsOfPngPageBackground;
newOptions.FontSavingMode = HtmlSaveOptions.FontSavingModes.SaveInAllFormats;
string outHtmlFile = dataDir + @"output.html";
doc.Save(outHtmlFile, newOptions);

output.zip (129.5 KB)

此外,您还可以在输出HTML中检查内容未与右侧对齐,如前面共享的图所示。我们要求您使用最新版本的API,如果您遇到任何问题,请随时告诉我们。


#5

感谢您的回复,我收到了您输出的HTML文件,我用浏览器打开它,页面内容依然在最左侧,这个对我们的项目展示效果有一定的影响,我们希望它能居中展示,请问有没有办法实现呢?
QQ截图20180720160510.jpg (251.8 KB)


#6

@zg0x1231

感谢您分享您的疑虑。

我们已观察到您分享的评论和截图。我们已在问题跟踪系统中以机票ID PDFNET-45106记录此要求。我们将详细调查已记录的故障单,并在发布进一步更新时随时发布。请多花点时间。

对此造成的不便,我们表示歉意。


#7

你好,

请问一下关于ID PDFNET-45106 是否解决了呢?

Aspose.PDF For.NET将PDF转换成HTML,为何产生的html文件,用IE浏览器打开都只是在页面的左边,我们希望它能居中展示


#8

@ asad.ali
这个问题对我们的体验很重要,还请帮忙解决一下,非常感谢!


#9

@zg0x1231

谢谢你的询问。

我担心之前记录的问题尚未解决,因为在此之前记录的队列中存在大量待处理问题。请注意,您的问题记录在[免费支持模式]下,其中问题的优先级较低,并以先到先得的方式解决。我担心由于待处理问题排起了长队,您在这种支持模式下的问题可能需要数月才能得到解决。

我们还提供[付费支持选项],其中问题得到紧急调解并具有高优先级。如果问题对您非常重要,您可以使用付费支持模式升级其优先级。如果有关于机票解决方案的确切更新,我们一定会通知您。

对此造成的不便,我们表示歉意


#10

你好,
请问 ID PDFNET-45106 这个问题还没有解决吗?

Aspose.PDF For.NET将PDF转换成HTML,为何产生的html文件,用IE浏览器打开都只是在页面的左边,我们希望它能居中展示


#11

@zg0x1231

感谢您的查询。

由于队列中存在大量待处理问题,我担心之前记录的问题尚未解决。一旦我们对决议过程有一些明确的更新,我们一定会通知您。请多花点时间。

我们对造成的不便很抱歉。