感谢您的查看和帮助!
1,Aspose.ocr Api是否支持中文简体字识别?如果支持,我该如何使用它,如:图片直接生成双层PDF(可搜索的PDF)
2,如何根据文字坐标,将文字定位在PDF文件上形成(可搜索的PDF),Aspose.ocr或者Aspose.PDF等API是否可以实现?
感谢您的查看和帮助!
1,Aspose.ocr Api是否支持中文简体字识别?如果支持,我该如何使用它,如:图片直接生成双层PDF(可搜索的PDF)
2,如何根据文字坐标,将文字定位在PDF文件上形成(可搜索的PDF),Aspose.ocr或者Aspose.PDF等API是否可以实现?
首先,您需要使用 Aspose.PDF 将图像转换为 PDF,扫描 PDF 文档后,您可以使用以下代码片段使用 Aspose.OCR 创建可搜索的扫描 PDF 文档:
try
{
var api = new OCR.AsposeOcr();
var settings = new OCR.DocumentRecognitionSettings();
settings.StartPage = 0;
settings.PagesNumber = 6;
settings.Language = Language.Chi;
//settings.LinesFiltration = true;
settings.DetectAreas = true;
settings.DetectAreasMode = OCR.DetectAreasMode.COMBINE;
settings.ThreadsCount = 1;
var res = api.RecognizePdf(dataDir + "_Searchable.pdf", settings);
OCR.AsposeOcr.SaveMultipageDocument(dataDir + "File1_OCRd.pdf", OCR.SaveFormat.Pdf, res);
}
catch (Exception ex)
{
throw ex;
}
您还可以在上面的代码片段中注意到,在 OCR 操作期间也指定了语言。