您好,使用了Aspose软件一段时间了,对于word文件按照段落读取都没问题。但是对于使用Aspose.PDF读取PDF段落,查了相关文档使用下边的代码依然无法获得类似于word中那样正常的段落内容。请问关于这块在Aspose.PDF java有其他的方法吗?
public List<String> readPdf(InputStream in) throws Exception {
List<String> texts = Lists.newArrayList();
com.aspose.pdf.Document pdfDoc = new com.aspose.pdf.Document(in);
ParagraphAbsorber absorber = new ParagraphAbsorber();
absorber.visit(pdfDoc);
for (PageMarkup markup : absorber.getPageMarkups()) {
for (MarkupSection section : markup.getSections()) {
for (MarkupParagraph paragraph : section.getParagraphs()) {
String paragraphText = paragraph.getText();
texts.add(paragraphText);
}
}
}
return texts;
}
测试文件.zip (77.7 KB)