Pdf文件转word

pdf转word文件 转换出来之后的word文档内容并不是真正意义上的word的一段话,而是按照pdf文件换行来转换的,有没有真正意思上的转换

@mzjmc

您能否尝试使用以下代码片段,如果您仍然遇到任何问题,请告诉我们?另外,请与我们分享您的示例输入输出文件。请确保使用 22.12 版本的 API。

Document convertPDFDocumentToWord = new Document(MyDir + "input.pdf");
DocSaveOptions docSaveOptions = new DocSaveOptions();
docSaveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.EnhancedFlow);

// docSaveOptions.setRelativeHorizontalProximity(2.5f); - not used in EnhancedFlow mode
// docSaveOptions.setRecognizeBullets(true);            - always true in EnhancedFlow mode  

convertPDFDocumentToWord.save(MyDir + "output.docx", docSaveOptions);

你好,我的需求是这样的,在将文件转换为docx的时候我会选择去用apache.poi去解析文件的段落读取文件的元素,然后用到了aspose的转换API

以下是源文件和代码归档.zip (156.4 KB)

我尝试的使用了最新版本的api 22.12 效果还是和以前一样的

@mzjmc

我们已在内部问题跟踪系统中打开以下新工单,并将根据 免费支持政策 中提到的条款提供修复。

  问题 ID:PDFJAVA-42413

如果您需要优先支持以及直接联系我们的付费支持管理团队,您可以获得付费支持服务