Aspose pdf for java PDF转换WORD 样式失效

我使用的是aspose pdf for java 组件

我想要的效果是在保留原有的样式情况下,转换的word的表格可以编辑

我实际用Aspose把PDF转换为word后,表格也不能编辑,表格变成了图片,启用表格识别,样式又全部乱了,请帮我看下,谢谢!

test0730.pdf (49.5 KB)

test0730.docx (12.6 KB)

@Gavin_Zhang

要在保留原有样式的情况下将PDF转换为可编辑的Word文档,您可以使用Aspose.PDF for Java中的DocSaveOptions类来优化转换过程。以下是详细的解决方案和步骤:

  1. 原因:PDF文件通常是为了展示而设计,直接转换为Word文档可能导致格式和可编辑性问题。使用适当的工具和设置可以显著改善转换效果。

  2. 解决方案:使用DocSaveOptions类,特别是设置识别模式为Flow,可以帮助生成更易于编辑的文档。

  3. 示例代码

    import com.aspose.pdf.Document;
    import com.aspose.pdf.DocSaveOptions;
    
    public class PDFToWordConverter {
        public static void main(String[] args) {
            // 加载PDF文档
            Document document = new Document("input.pdf");
            DocSaveOptions saveOptions = new DocSaveOptions();
    
            // 设置输出格式为DOCX
            saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
            // 设置识别模式为Flow
            saveOptions.setMode(DocSaveOptions.RecognitionMode.Flow);
    
            // 保存为Word文档
            document.save("output.docx", saveOptions);
        }
    }
    
  4. 下一步:您可以根据需要调整其他选项,例如RelativeHorizontalProximityRecognizeBullets,以进一步优化转换效果。请尝试上述方法,并检查转换后的Word文档的可编辑性和样式保留情况。

如果您在实施过程中遇到任何问题或有其他疑问,请随时与我联系,我将乐意提供进一步的帮助!

谢谢您的回复!

通过您提供的代码测试,样式上得到了保留,但是表格中的这个位置 依然无法编辑,我点的时候,实际是点的图片,这个表格的图片我还可以拖动,所以不能编辑,请问有办法实现样式不改变的同时,还可以编辑表格吗?

微信图片_20250730114131.png (24.3 KB)
微信图片_20250730114513.png (24.0 KB)

@Gavin_Zhang

您是否尝试过在转换时使用RecognitionMode.EnhancedFlow?能否请您尝试一下并将反馈分享给我们?另外,请确保使用的是最新版本的API。

import com.aspose.pdf.Document;
import com.aspose.pdf.DocSaveOptions;

public class PDFToWordConverter {
    public static void main(String[] args) {
        // 加载PDF文档
        Document document = new Document("input.pdf");
        DocSaveOptions saveOptions = new DocSaveOptions();

        // 设置输出格式为DOCX
        saveOptions.setFormat(DocSaveOptions.DocFormat.DocX);
        // 设置识别模式为Flow
        saveOptions.setMode(DocSaveOptions.RecognitionMode.EnhancedFlow);

        // 保存为Word文档
        document.save("output.docx", saveOptions);
    }
}

@asad.ali
您好!

以下PDF文档是源文件。要求转为word,样式保持一致,并且表格可编辑
test0730002.pdf (50.4 KB)

使用RecognitionMode.EnhancedFlow增强流,样式发生了改变,我转换出的Word文档如下:
test0730002_YYYYYYYYYYYYYY.docx (13.3 KB)

@Gavin_Zhang

我们已在内部问题跟踪系统中创建了以下新工单,并将根据Free Support Policies中提到的条款交付其修复。

问题编号:PDFJAVA-45240

如果您需要优先支持服务,以及直接与我们的付费支持管理团队联系,可以访问Paid Support Services获取相关支持。