双层PDF删除全部文本

您好,我使用下面的代码确实可以删除PDF文本,但是删除后有 \r\0\n\0
错误图片:360截图1847012683123109.png (153.8 KB)

       Aspose.Pdf.Document pdfDocument = new Aspose.Pdf.Document(filename);
        //循环遍历所有 pdf 文档页
        for (int i = 1; i <= pdfDocument.Pages.Count; i++)
        {
            Aspose.Pdf.Page page = pdfDocument.Pages[i];

            Aspose.Pdf.OperatorSelector operatorSelector = new Aspose.Pdf.OperatorSelector(new Aspose.Pdf.Operator.TextShowOperator());

            //选择页面上的所有文本
            page.Contents.Accept(operatorSelector);

            //删除所有文本
            page.Contents.Delete(operatorSelector.Selected);

        }

@fhn123456

您能否在此处附上您的输入 PDF 文件以进行测试? 我们将调查该问题并为您提供更多信息。

您好,这是PDF文件。

000.pdf (175.9 KB)

@fhn123456

在您的第一篇文章和图像中共享的代码示例是不同的。 你能否分享一些关于你的问题的更多细节? 还请分享您有问题的和预期的输出。 我们将进一步调查此问题并为您提供更多信息。

发您的这个PDF也有相同的问题,上一篇不小心删掉了。

@fhn123456

请注意,您的 PDF 文件包含图像。 它不包含文本。 所以,你得到了正确的输出。

我们在这里的另一个线程中回复了您。

那为什么使用这张错误图片里面的代码会发现有文本,有\r\0信息,您可一参照这个图片里的代码,试试。

360截图1847012683123109.png (153.8 KB)

@fhn123456

从 PDF 中删除文本后,PdfExtractor 返回 ‘\r\0\n\0’。 它应该是空值。 我们在问题跟踪系统中将这个问题记录为 PDFNET-51882。 解决此问题后,您将通过此论坛主题收到通知。

对于给您带来的不便,我们深表歉意。