提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
原创|使用教程|编辑:郝浩|2013-09-24 09:18:11.000|阅读 673 次
概述:本文主要介绍如何利用LEADTOOLS WinRT SDK中的OCR功能将图像转换为文本,并提供源代码。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
LEADTOOLS WinRT SDK提供了开发人员创建Windows Store应用程序所需的所有最先进的成像技术,比如触屏查看器,格式,压缩,图像处理,注释和标记,OCR,条形码,PACS等等。借助于LEADTOOLS先进的文档和医疗成像技术,开发人员可以轻松创建Windows Store应用程序。
LEADTOOLS OCR SDK提供了原生WinRT库,可在桌面,平板电脑或移动设备上运行。不管是扫描并将文档转换为可搜索的PDF文档,还是拍摄名片并将其添加到联系人中,LEADTOOLS 都可帮你实现。
下面的示例展示了OCR应用程序的基本功能:转换成可搜索的文本格式(如PDF,PDF / A,DOCX,TXT等),整页文字识别,纬向文本识别。
首先,我们初始化LEADTOOLS OCR引擎,并准备一份文档:
// Create an instance of the engine string strEngineDirectory = Path.Combine(Windows.ApplicationModel.Package.Current.InstalledLocation.Path, @"OCR"); _ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.Advantage, false); _ocrEngine.Startup(null, null, string.Empty, strEngineDirectory); // Create the OCR document _ocrDocument = _ocrEngine.DocumentManager.CreateDocument();
接下来,加载图像,并把图像添加到文档中。
// Show the file picker var picker = new FileOpenPicker(); picker.SuggestedStartLocation = PickerLocationId.PicturesLibrary; picker.ViewMode = PickerViewMode.List; foreach (var imageFormat in _imageFormats) picker.FileTypeFilter.Add(imageFormat.Extension); var file = await picker.PickSingleFileAsync(); if (file == null) return; // Create a LEADTOOLS stream from the file ILeadStream leadStream = LeadStreamFactory.Create(file); // Get the RasterCodecs object to load the image from the OCR engine RasterCodecs codecs = _ocrEngine.RasterCodecsInstance; // Load the image (first page only) RasterImage rasterImage = await codecs.LoadAsync(leadStream, 0, CodecsLoadByteOrder.BgrOrGray, 1, 1); // Add it to the OCR engine // Check if we have previous pages, remove them _ocrDocument.Pages.Clear(); _ocrPage = _ocrDocument.Pages.AddPage(rasterImage, null);
将扫描图像转换成可搜索文本(PDF,PDF / A,Word,XML和TXT)非常容易。识别功能处理文档并将识别数据存储为EMF。
// Auto-zone the page _ocrPage.AutoZone(null); // Recognize the page _ocrPage.Recognize(null);
识别完成后,OCR引擎利用DocumentWriter类将OCR结果转换为任意格式。
// Create a LEADTOOLS stream from the file ILeadStream leadStream = LeadStreamFactory.Create(file); // Set PDF output options, use PDF/A PdfDocumentOptions options = _ocrEngine.DocumentWriterInstance.GetOptions(DocumentFormat.Pdf) as PdfDocumentOptions; options.DocumentType = PdfDocumentType.PdfA; _ocrEngine.DocumentWriterInstance.SetOptions(DocumentFormat.Pdf, options); // Save the OCR'd document as searchable PDF await _ocrDocument.SaveAsync(leadStream, DocumentFormat.Pdf, null);
利用RecognizeText功能将图像转换为原始文本也非常的容易。
// Auto-zone the page _ocrPage.AutoZone(null); // Recognize the page and get the results as text TextResults.Text = _ocrPage.RecognizeText(null);
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Asian OCR Module在应用程序中增加了一些光学字符识别(OCR)技术的方法,并包含了开发健壮的,高性能的和可扩展的图像识别方案所需要的技术。
本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…
LEADTOOLS Document Suite Developer ToolkitLEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
LEADTOOLS Document Imaging Developer Toolkit多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。
LEADTOOLS Professional Asian OCR ModuleLEADTOOLS Asian OCR Module在应用程序中增加了一些光学字符识别(OCR)技术的方法,并包含了开发健壮的,高性能的和可扩展的图像识别方案所需要的技术。
LEADTOOLS OCR Module - LEAD Engine开发健壮的,高性能的和可扩展的图像识别方案所需要的OCR 识别技术。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@capbkgr.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢