读取word的表格时,表格只跨了一页,但读取出来多了3页左右,用wps打开是6页读取出来是10页。

主要代码

问题表格:读取出来是多个表格
表格数和.docx (27.5 KB)

处理过的表格:我把表格的格式去了 读取出来是2个表格
表格数和1.docx (27.0 KB)

读取word表格有跨页时可以识别成一个表格吗?

@fsd1017800890 从代码中不太清楚您对表做了什么,因为在代码中,您使用的是拆分页面,前两个文档按预期拆分了表。你能提供更多关于这方面的信息吗?如果可能的话,你能提供一个简单的控制台应用程序来重现这个问题吗?

您好,你解决吗?


@fsd1017800890 从最初的问题 “读取word表格有跨页时可以识别成一个表格吗?”:
当您打开文档并读取“表格”节点时,即使表格跨越多个页面,您也只能读取一个表格。所以,从这个角度来看,我看不出任何问题。

在您的代码中,您尝试获取表节点和段落节点,可能由于重复而遇到任何问题。当您使用解析表时,在构建表内容时,请尝试使用与表相关的段落,并避免使用该过程中的任何其他段落,如下所示:if (paragraph.getAncestor(NodeType.TABLE) != null)

遗憾的是,我无法根据我掌握的数据为您提供更多信息。