We're sorry Aspose doesn't work properply without JavaScript enabled.

Free Support Forum - aspose.com

[Aspose.pdf for java] 表格解析格式异常

您好,
我们在使用aspose.pdf 21.8 解析一些特殊的表格时候碰到问题。

我们的样例表格共三张如下图:
image.png (10.5 KB)
文档原件:
test.pdf (56.7 KB)
测试代码:

for(int i =1; i<=doc.getPages().size();i++){
TableAbsorber absorber = new TableAbsorber();
absorber.visit(doc.getPages().get_Item(i));
for (AbsorbedTable table : absorber.getTableList())
{
System.out.println("###table###");
for (AbsorbedRow row : table.getRowList())
{
for (AbsorbedCell cell : row.getCellList())
{
TextFragment textfragment = new TextFragment();
TextFragmentCollection textFragmentCollection = cell.getTextFragments();
for (TextFragment fragment : textFragmentCollection)
{
System.out.print(fragment.getText());Preformatted text
}
System.out.print("===");
}
System.out.println("");
}
}
}

解析结果:
image.png (1.4 KB)

如图所示,存在问题如下:
1.程序错将三张表格解析成了五张表格
2.样例一为错位表格,程序似乎只按照表格首列解析,后续列数据都有丢失情况
3.样例二中数据因为无左右边框的原因丢失了第一列
4.样例三中的数据因为无外边框的原因丢失了第一行和第一列的数据

麻烦帮忙检查是否我们的测试代码有问题,或是由issue需要修复,谢谢!

@changeo

在使用 Aspose.PDF for Java 21.10 时,我们能够在我们的环境中复制类似的问题。因此,在我们的问题跟踪系统中将其记录为 PDFJAVA-41047。我们将进一步调查其详细信息,并及时通知您其更正状态。请耐心等待,给我们一些时间。

对此造成的不便,我们表示歉意。

十分感谢!
请问可以大概评估修复时间吗?
另外补充一种情况:
跨页表格(见附件中的最后一个表格)
test (2).pdf (61.7 KB)
解析时候是会将跨页表格切分成两个表格的,是否可以将其合并呢?
或者退而求其次,是否能让其解析结果顺序正确?目前我们程序解析的结果跨页表格并不是挨着的:
image.png (4.9 KB)

@changeo

新案例已记录在我们的问题跟踪系统中的工单 ID PDFJAVA-41049 下。关于工单的解决时间,我们将按照先到先得的原则进行调查解决,解决后第一时间通知您。解决时间取决于在它们之前记录的问题数量以及故障单的性质和复杂性。

请耐心等待,给我们一些时间。