你好,我使用的是Aspose.PDF For NET 20.9版本
在将PDF文件转为doc文件时,自动在每一行的末尾都会增加一个换行符,请问怎么解决?
原始PDF文件见附件test.pdf,将PDF转为doc后,看起来似乎没有任何问题,但将其中的一句(图片中选中的部分)复制到新的doc文件后才发现,程序将每一行的末尾都添加了一个换行符,导致无法直接使用这段文字,需要手动删除换行符,请问这个问题如何解决?谢谢!
test.pdf (168.8 KB)
test.png (66.0 KB)
你好,我使用的是Aspose.PDF For NET 20.9版本
在将PDF文件转为doc文件时,自动在每一行的末尾都会增加一个换行符,请问怎么解决?
原始PDF文件见附件test.pdf,将PDF转为doc后,看起来似乎没有任何问题,但将其中的一句(图片中选中的部分)复制到新的doc文件后才发现,程序将每一行的末尾都添加了一个换行符,导致无法直接使用这段文字,需要手动删除换行符,请问这个问题如何解决?谢谢!
test.pdf (168.8 KB)
test.png (66.0 KB)
@asad.ali
代码很简单,我使用如下代码进行测试:
Document doc = new Document(@“C:\Users\howze\Desktop\test.pdf”);
doc.Save(@“C:\Users\howze\Desktop\PDFToDOC_out.doc”, SaveFormat.Doc);
发现上述问题后,我还尝试过如下代码:
Document doc = new Document(@“C:\Users\howze\Desktop\test.pdf”);
// Create DocSaveOptions object
DocSaveOptions saveOptions = new DocSaveOptions();
// Set the recognition mode as Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;
// Enable the value to recognize bullets during conversion process
saveOptions.RecognizeBullets = true;
doc.Save(@“C:\Users\howze\Desktop\PDFToDOC_out.doc”, saveOptions);
但依然出现这一问题。