代码如下:
result = get_filename_without_ext(source_file)
document = aw.Document(source_file)
document.save(f"{result}.md")
我已经把pdf按页数拆分为若干小pdf,循环对这些pdf转换,在使用这个文件时,当进行到第19页,流程卡住,等待一个小时也未继续,没有报错
VDA 6.2-2004_en.pdf (1.7 MB)
代码如下:
result = get_filename_without_ext(source_file)
document = aw.Document(source_file)
document.save(f"{result}.md")
我已经把pdf按页数拆分为若干小pdf,循环对这些pdf转换,在使用这个文件时,当进行到第19页,流程卡住,等待一个小时也未继续,没有报错
VDA 6.2-2004_en.pdf (1.7 MB)
@David_Matin
We have opened the following new ticket(s) in our internal issue tracking system and will deliver their fixes according to the terms mentioned in Free Support Policies.
Issue ID(s): WORDSNET-27028
You can obtain Paid Support Services if you need support on a priority basis, along with the direct access to our Paid Support management team.
please
import aspose.pdf as ap
import aspose.words as aw
from timeout_decorator import timeout
lic_dir = './Aspose.lic'
license = ap.License()
license.set_license(lic_dir)
aw.License().set_license(lic_dir)
@timeout(5)
def test():
document = aw.Document("test_page19.pdf")
document.save("test", aw.SaveFormat.MARKDOWN)
if __name__ == '__main__':
test()
现在还有一个文件,我使用一个300页的pdf,根据页数拆分为300份pdf,然后使用document.save(f"{result}.md") ,但内存使用超过了12G,出现了oom
这个是内存占用过大的文件,使用转换方法卡住的文件在上面有列出
@David_Matin 感谢您报告此问题。 我们已经在我们的内部问题跟踪系统中打开了以下新工单,并将根据 免费支持政策 中提到的条款提供它们的修复:
Issue ID(s): WORDSNET-27039
如果您需要优先支持以及直接联系我们的付费支持管理团队,您可以获得 付费支持服务。