您好,
我们在使用aspose.pdf 21.8 解析一些特殊的表格时候碰到问题。
我们的样例表格共三张如下图:
image.png (10.5 KB)
文档原件:
test.pdf (56.7 KB)
测试代码:
for(int i =1; i<=doc.getPages().size();i++){
TableAbsorber absorber = new TableAbsorber();
absorber.visit(doc.getPages().get_Item(i));
for (AbsorbedTable table : absorber.getTableList())
{
System.out.println("###table###");
for (AbsorbedRow row : table.getRowList())
{
for (AbsorbedCell cell : row.getCellList())
{
TextFragment textfragment = new TextFragment();
TextFragmentCollection textFragmentCollection = cell.getTextFragments();
for (TextFragment fragment : textFragmentCollection)
{
System.out.print(fragment.getText());Preformatted text
}
System.out.print("===");
}
System.out.println("");
}
}
}
解析结果:
image.png (1.4 KB)
如图所示,存在问题如下:
1.程序错将三张表格解析成了五张表格
2.样例一为错位表格,程序似乎只按照表格首列解析,后续列数据都有丢失情况
3.样例二中数据因为无左右边框的原因丢失了第一列
4.样例三中的数据因为无外边框的原因丢失了第一行和第一列的数据
麻烦帮忙检查是否我们的测试代码有问题,或是由issue需要修复,谢谢!