PDF转换为Word后内容在图文框中，取元素为图片，且程序无法从框中获取文字信息

crzhu · April 1, 2025, 9:23am

问题：

使用 AsPose 将 PDF 转换为 Word 后，Word 中文本内容被文本框包裹（使用 flow 转换则会损失部分布局），
获取元素时获取到的是图片，且无法从框中获取文字。（从 Paragraph 中可以获取文字，但 Paragraph 为按行获取，这样会损失原本框的具体边界等信息）

Professionalize.Discourse · April 1, 2025, 9:23am

请您提供更多信息，例如您使用的代码示例以及您希望如何处理文本框中的文本内容？

crzhu · April 3, 2025, 2:49am

转换效果问题
例如，这是一个pdf 转换后的 docx文件：

其文本框是按照非自然阅读顺序分割的段落，这个图片大概展示了每个文本框的实际内容：

我想实现的功能：
能够获取这个文本段落的所有信息，对其完整段落文本内容进行翻译，然后按照原来的样式格式，重新填充回docx。

遇到的过程问题

我希望获取的支持

vyacheslav.deryushev · April 3, 2025, 7:58am

@crzhu 您使用的是 Aspose.Pdf 库吗？另外，能否提供出现问题的文档？

crzhu · April 7, 2025, 5:53am

是Aspose.PDF库，文档如下：
aspose.docx (2.7 MB)

vyacheslav.deryushev · April 9, 2025, 7:32am

@asad.ali Please check this request.

asad.ali · April 9, 2025, 7:56pm

您能否也与我们分享示例源 PDF 文件以及用于转换的代码片段？在分享所需信息之前，请确保您使用的是 25.3 版本的 API。