当我使用24.6版本读取某个pdf文件时,无法提取当中的文字内容;转为word文档时,是以图片的形式插入word文档中的,请问一下这种pdf文档如何处理,才能读取到文本内容
如果我们这里有错,请纠正。您尝试使用 Aspose.PDF 读取文本的文件是上面的文件,即 test1.pdf 吗?请注意,该文件中只有图像,没有文本内容。这就是 API 不从中读取任何内容的原因。
是因为该PDF文件为扫描件的原因?因为该文件是从扫描件转换来的
当我使用24.6版本读取某个pdf文件时,无法提取当中的文字内容;转为word文档时,是以图片的形式插入word文档中的,请问一下这种pdf文档如何处理,才能读取到文本内容
如果我们这里有错,请纠正。您尝试使用 Aspose.PDF 读取文本的文件是上面的文件,即 test1.pdf 吗?请注意,该文件中只有图像,没有文本内容。这就是 API 不从中读取任何内容的原因。
是因为该PDF文件为扫描件的原因?因为该文件是从扫描件转换来的