Aspose.PDF for Java 18.6 PDF to Office 好慢

我们在使用最新版Aspose.PDF for Java 18.6,把 PDF 转换成 Office 格式(doc,docx,xls,xlsx.pptx) 的时候,转换耗时非常长。我们也使用过 http://cloudconvert.com/https://convertio.co/zh/ 同样一个文件,他们所使用的时间是Aspose.PDF for Java 18.6 近1/10。希望你们能尽快改善文件转换效率问题。

@holeen

感谢您与支持人员联系。

我们已在您创建的另一个主题中回复了您。 请检查这个链接

Ubuntu 64位系统,OpenJDK 1.8.0,内存分配了9G,CPU同时处理并发数为 4,Aspose 使用PDF18.6jar包,程序是单进程4线程(最大同时处理4个Aspose转换任务)启动后常住内存,
目前源文件是10M以下的PDF文件,PDF转其它格式,过半的异常情况是超时,即Aspose程序超过20分钟没有处理完,也没有报异常

  1. 最严重的问题是,Aspose进程连续处理了一天或者两天之后,任务就一直超时,需要重启Aspose进程
  2. Aspose进程正常时,超时的情况在 PDF转 DOC、DOCX出现的概率最高
  3. 不是个别文件PDF转换慢,是大部分情况,平均准换每1M的文件需要90秒左右

转换慢的文件示例
PDF转DOCX,源文件 http://file.17pdf.com/private/10d4518d-7338-4641-a601-e07fb9db3195/17pdf/916ca1cb-a7d7-452e-9b04-95f1fad5060e?Expires=4687998300&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=pXNTcMojIeXTR72sTnq3X8PUzFk%3D

PDF转PPTX,源文件 http://file.17pdf.com/private/c37c99da-abac-4b4b-b241-fa1e6df5f373/17pdf/d849aee1-473a-4904-adc3-7a38b1ba4a88?Expires=4687995243&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=dMClbw%2BdOK9xM%2Fezxfz%2BCJK%2Fyhg%3D

PDF转XLS,源文件 http://file.17pdf.com/private/f0e60599-7847-40e5-a309-b78a4c139810/17pdf/76a2164a-748d-48c6-81eb-4ccd80212a5b?Expires=4687901009&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=Aopy7SB%2ForGs4pd1dpX6eteJQHU%3D

http://file.17pdf.com/private/10d4518d-7338-4641-a601-e07fb9db3195/17pdf/916ca1cb-a7d7-452e-9b04-95f1fad5060e?Expires=4687998300&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=pXNTcMojIeXTR72sTnq3X8PUzFk%3D

http://file.17pdf.com/private/c37c99da-abac-4b4b-b241-fa1e6df5f373/17pdf/d849aee1-473a-4904-adc3-7a38b1ba4a88?Expires=4687995243&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=dMClbw%2BdOK9xM%2Fezxfz%2BCJK%2Fyhg%3D

http://file.17pdf.com/private/f0e60599-7847-40e5-a309-b78a4c139810/17pdf/76a2164a-748d-48c6-81eb-4ccd80212a5b?Expires=4687901009&OSSAccessKeyId=LTAIBSxSrO3XuszA&Signature=Aopy7SB%2ForGs4pd1dpX6eteJQHU%3D

@holeen

感谢您分享请求的数据。

我们已经注意到PDF转换为DOCX和PDF到PPTX格式的缓慢转换。 但是,与其他转换期间消耗的数百秒相比,XLS转换所需的秒数更少。 您是否可以创建一个缩小的示例应用程序,复制环境中出现的问题,以便我们进一步调查以帮助您。

我们每天都要做很多转换,当然有一些转换是很快,总体来说,大部分转换很慢。所以,你们检查代码看看转换的处理过程,是不是有做了很多没有必要做的事情。

@holeen

转换PDF文档时,我们已经注意到性能下降。 您是否可以创建一个缩小的示例应用程序来复制您的多线程主应用程序,以便我们可以在我们的问题管理系统中记录与性能相关的票证,以便进一步调查和解决。

我通过17PDF Reader将"AsposeStarter.zip"上传到加云,点击以下链接即可查看:
http://cloud.17pdf.com/s/4IPe7a

如果你们要把这个程序跑起来,请看压缩包里 start_aspose.sh 文件的说明。

@holeen

感谢您分享请求的数据。

我们使用了您共享的数据,并且能够注意到PPTX和DOCX文件格式转换缓慢。 因此,我们的问题管理系统已记录两张ID为PDFJAVA-37886PDFJAVA-37887的故障单,以解决各自的问题。 故障单ID已与此线程链接,以便您在解决故障单后立即收到通知。

对此造成的不便,我们表示歉意。

感谢,希望能把这个转换慢 bug 优先级别提到最高,先重点解决这个,效率不行,其他功能再多再完善,都没有太多作用。

@holeen

请注意,该问题已记录在免费支持模式下,将按先到先得的原则进行调查。 一旦我们对机票解决方案有一些明确的更新,我们会通知您。 请多花点时间。

对此造成的不便,我们表示歉意。

The issues you have found earlier (filed as PDFJAVA-37886) have been fixed in Aspose.PDF for Java 18.11.

感谢,你们修复了 pdf to pptx 转换很慢的问题,现在还有一个 pdf to word 转换非常慢,这个问题,我看一直还没有去处理?请问这个可以优先解决吗?这个很影响我们使用。

@holeen

谢谢你的反馈。

请注意PDFJAVA-37887目前正在等待调查,并将在适当的时候安排。 一旦取得重大进展,我们会立即通知您。 感谢您在这方面的耐心和理解。