提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:何跃|2022-01-24 14:36:15.267|阅读 181 次
概述:PDF文件可以被用来存储文件、图像和其他数据。在过去,人们问是否有一个简单的方法从PDF文件中提取图形,如图表或照片。如果你想从一个PDF文件中获取所有的图像,或者有数百个或更多的PDF文件需要处理,那么答案就是使用LEADTOOLS。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
使用LEADTOOLS提取嵌入在PDF文件中的图像很容易。下面是使用LEADTOOLS从PDF文件中提取图像的C#、Java和PowerShell代码样本。
/// <summary> /// 提取PDF文档为TIFF /// </summary> /// <param name="pdfPath"></param> private static void ExtractImagesFromPdf(string pdfPath) { var destinationPath = Path.Combine(Path.GetDirectoryName(pdfPath), @"images\"); var documentName = Path.GetFileNameWithoutExtension(pdfPath); using var pdfDocument = new PDFDocument(pdfPath); pdfDocument.ParsePages(PDFParsePagesOptions.Objects, 1, -1); foreach (var page in pdfDocument.Pages) { var embeddedImages = page.Objects.Where(o => o.ObjectType == PDFObjectType.Image).ToArray(); using var codecs = new RasterCodecs(); foreach (var imgObj in embeddedImages) { var destinationFilePath = destinationPath + documentName + "~page-" + page.PageNumber + "~" + imgObj.ImageObjectNumber + ".tif"; using var image = pdfDocument.DecodeImage(imgObj.ImageObjectNumber); codecs.Save(image, destinationFilePath, RasterImageFormat.TifLzw, image.BitsPerPixel, 1, 1, -1, CodecsSavePageMode.Append); } } }
/** * 提取PDF文件并另存为到子目录 * e.g. getFileName("c:\\temp\\") will return "c:\\temp\\images\\" * * * @param pdfPath */ private static void extractImagesFromPdf(String pdfPath) { final String destinationFolder = getOutputFolder(pdfPath); final String documentName = getBaseName(getFileName(pdfPath)); final PDFDocument pdfDocument = new PDFDocument(pdfPath); pdfDocument.parsePages(PDFParsePagesOptions.OBJECTS.getValue(), 1, -1); final RasterCodecs codecs = new RasterCodecs(); try { final List<PDFDocumentPage> pages = pdfDocument.getPages(); for (PDFDocumentPage page : pages) { final int pageNumber = page.getPageNumber(); for (final PDFObject object : page.getObjects()) { if (object.getObjectType() == PDFObjectType.IMAGE) { final String imageObjectNumber = object.getImageObjectNumber(); final String destinationFilePath = destinationFolder + documentName + "~page-" + pageNumber + "~" + imageObjectNumber + ".tif"; final RasterImage image = pdfDocument.decodeImage(imageObjectNumber); try { codecs.save(image, destinationFilePath, RasterImageFormat.TIFLZW, image.getBitsPerPixel(), 1, 1, -1, CodecsSavePageMode.OVERWRITE); } finally { image.dispose(); } } } } } finally { codecs.dispose(); } }
function Export-LtImagesFromPdf { <# .SYNOPSIS Exports images embedded in a PDF file .DESCRIPTION Exports images embedded in a PDF file .PARAMETER PdfPath File path to the PDF file that has embedded images to be exported .PARAMETER Path Folder path to export the embedded images .EXAMPLE Export-LtImagesFromPdf -PdfPath "c:\temp\a.pdf" -Path "c:\temp\images\" .INPUTS String .OUTPUTS void .NOTES Author: LEAD Technologies, Inc. Website: //www.leadtools.com Twitter: @leadtools #> [CmdletBinding()] param( [Parameter(Mandatory)] [string]$PdfPath, [Parameter(Mandatory)] [string]$Path ) if( -not(Test-Path -Path $PdfPath -PathType Leaf) ) { Write-Error "File does not exist." return $false } if( -not(Test-Path -Path $Path -PathType Container) ) { New-Item -Path $Path -ItemType Directory } $baseFileName = (Get-Item $PdfPath).Basename $pdfDocument = New-Object -TypeName Leadtools.Pdf.PDFDocument -ArgumentList $PdfPath $pdfDocument.ParsePages(1, 1, -1) ForEach ($page in $pdfDocument.Pages){ ForEach($object in $page.Objects){ if( $object.ObjectType -eq [Leadtools.Pdf.PDFObjectType]::Image ){ $imageObjectNumber = $object.ImageObjectNumber $pageNumber = $page.PageNumber $image = $pdfDocument.DecodeImage($imageObjectNumber) $outputFilePath = (Join-Path -Path $Path -ChildPath ($baseFileName + "~page#-" + $pageNumber + "~" + $imageObjectNumber + ".tif")) Export-LTImage -RasterImage $image -Path $outputFilePath -Format ([Leadtools.RasterImageFormat]::Tif) } } } }
有了LEADTOOLS的工具包,就没有什么是你不能做的PDF文件了。点击这里可以下载Leadtools全套SDK。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn
本文探讨 SQL Server 中 NULL 和空值之间的区别,并讨论如何有效地处理它们。
Unity 是一款功能极其丰富的游戏引擎,允许开发人员将各种媒体集成到他们的项目中。但是,它缺少最令人兴奋的功能之一 - 将 Web 内容(例如 HTML、CSS 和 JavaScript)直接渲染到 3D 场景中的纹理上的能力。在本文中,我们将介绍如何使用 DotNetBrowser 在 Unity3D 中将 Web 内容渲染为纹理。
DevExpress v24.2帮助文档正式发布上线了,请按版本按需下载~
本教程将向您展示如何用MyEclipse构建一个Web项目,欢迎下载最新版IDE体验!
LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@capbkgr.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢