pdf转word文件 转换出来之后的word文档内容并不是真正意义上的word的一段话,而是按照pdf文件换行来转换的,有没有真正意思上的转换
您能否尝试使用以下代码片段,如果您仍然遇到任何问题,请告诉我们?另外,请与我们分享您的示例输入输出文件。请确保使用 22.12 版本的 API。
Document convertPDFDocumentToWord = new Document(MyDir + "input.pdf");
DocSaveOptions docSaveOptions = new DocSaveOptions();
docSaveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
docSaveOptions.setMode(DocSaveOptions.RecognitionMode.EnhancedFlow);
// docSaveOptions.setRelativeHorizontalProximity(2.5f); - not used in EnhancedFlow mode
// docSaveOptions.setRecognizeBullets(true); - always true in EnhancedFlow mode
convertPDFDocumentToWord.save(MyDir + "output.docx", docSaveOptions);
你好,我的需求是这样的,在将文件转换为docx的时候我会选择去用apache.poi去解析文件的段落读取文件的元素,然后用到了aspose的转换API
我尝试的使用了最新版本的api 22.12 效果还是和以前一样的