Aspose.ocr Api是否支持中文简体字识别

感谢您的查看和帮助!

1,Aspose.ocr Api是否支持中文简体字识别?如果支持,我该如何使用它,如:图片直接生成双层PDF(可搜索的PDF)

2,如何根据文字坐标,将文字定位在PDF文件上形成(可搜索的PDF),Aspose.ocr或者Aspose.PDF等API是否可以实现?

@fhn123456

首先,您需要使用 Aspose.PDF 将图像转换为 PDF,扫描 PDF 文档后,您可以使用以下代码片段使用 Aspose.OCR 创建可搜索的扫描 PDF 文档:

try
{
 var api = new OCR.AsposeOcr();

 var settings = new OCR.DocumentRecognitionSettings();
 settings.StartPage = 0;
 settings.PagesNumber = 6;
 settings.Language = Language.Chi;
 //settings.LinesFiltration = true;
 settings.DetectAreas = true;
 settings.DetectAreasMode = OCR.DetectAreasMode.COMBINE;
 settings.ThreadsCount = 1;

 var res = api.RecognizePdf(dataDir + "_Searchable.pdf", settings);
 OCR.AsposeOcr.SaveMultipageDocument(dataDir + "File1_OCRd.pdf", OCR.SaveFormat.Pdf, res);
}
catch (Exception ex)
{
 throw ex;
}

您还可以在上面的代码片段中注意到,在 OCR 操作期间也指定了语言。