转换格式的问题

文档中间出现空白页,这是什么原因?

@jiangwei,

请压缩并上传您的输入文档和Aspose生成的输出文件,在此处显示不需要的行为以进行测试。 然后,我们将在最后调查此问题,并为您提供更多信息。

测试的文档,使用的是java版本,如何删除空白页testpdf.zip (184.6 KB)

@jiangwei,

还请告诉您,Aspose API是您遇到此问题的? 你在使用Aspose.Words for Java吗? 如果是,您是否尝试过最新版本,即19.7

请分享一段源代码,以便在我们的最终重现同样的问题。 谢谢你的合作。

我用的是Aspose.pdf java,那个格式问题是转换后原来的粗体变成非粗体,我试了很多版本都有这个问题,这个我在想办法吧。
我现在问的问题是,如何用 Aspose.words java 删除docx空白页面?

@jiangwei

如果您要将PDF转换为DOCX,那么您可以使用以下代码从PDF文档中删除空白页:

com.aspose.pdf.Document document = new com.aspose.pdf.Document(dataDir + "testpdf.pdf");
for(com.aspose.pdf.Page page : document.getPages())
{
    if (page.isBlank(0.01))
    {
        document.getPages().delete(page.getNumber());
    }
}
document.save(dataDir + "Good.pdf"); 

我们还附上了生成的PDF文档。 如果您需要任何进一步的帮助,请随时与我们联系。Good.pdf

如何删除docx里的空白页呢? Aspose.words java
doc.getPageCount(); 无法统计真实的页数

@jiangwei,

您可以使用Aspose.Words将Word文档转换为PDF。

Document doc = new Document("E:\\temp\\in.docx");
doc.save("E:\\temp\\awjava-19.7.pdf");

然后使用上一篇文章中的Aspose.PDF代码从此PDF中删除空白页。 最后使用以下文章将PDF文件转换回DOCX或DOC格式:

将PDF转换为DOC或DOCX格式

希望这可以帮助。

这个很麻烦吧,我想直接从word删除空白页, 貌似只有段落空白删除

@jiangwei,

请在此处压缩并上传您输入的Word文档(您要删除空白页面)以进行测试。 然后,我们将在最后调查该方案,并为您提供更多信息。

这是我的word文档testpdf.zip (68.9 KB)

@jiangwei,

但是,MS Word 2019不会在您的文档中显示任何空白页面。 它说有4页,都有一些内容。 请看下面的screesnshot。

用低版本office 会出现这情况,不过获取页数确实是4页,就是不知道这是什么原因

如果确实有空白页, Aspose.Words for JAVA 代码 删除空白页,如何写??

@jiangwei,

您可以在以下代码上构建逻辑,从代码文档末尾删除空Paragraph。 在这种情况下,这也将删除空白页。

Document doc = new Document("E:\\Data\\source.docx");

Section lastSec = doc.getLastSection();
Paragraph para = (Paragraph) lastSec.getBody().getLastParagraph();
while (para != null && para.toString(SaveFormat.TEXT).trim().equals("")) {
    para.remove();
    para = (Paragraph) lastSec.getBody().getLastParagraph();
}

doc.save("E:\\Data\\awjava-19.7.docx");