彩票走势图

LEADTOOLS教程:使用C#,VB和Java将PDF转换为DOC / DOCX

翻译|使用教程|编辑:杨鹏连|2021-03-10 09:24:02.800|阅读 205 次

概述:该 LEADTOOLS文档转换器SDK 是一个简单的工具能够处理所有的文档和图像转换的需求结合起来。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

LEADTOOLS Recognition Imaging SDK是精选的LEADTOOLS SDK功能集,旨在在企业级文档自动化解决方案中构建端到端文档成像应用程序,这些解决方案需要OCR,MICR,OMR,条形码,表单识别和处理,PDF,打印捕获 ,档案,注释和图像查看功能。 这套功能强大的工具利用LEAD屡获殊荣的图像处理技术,智能识别可用于识别和提取任何类型的扫描或传真形式图像数据的文档功能。

点击下载LEADTOOLS Recognition Imaging SDK试用版

有许多原因可能导致您想要与PDF文档进行转换。也许您需要使PDF可编辑或文本可搜索。或者,也许您更希望PDF是DOC或DOCX文件,但是您不想复制/粘贴文本或丢失原始格式。您甚至可能需要以相同的方式批量转换大量PDF。好消息!该 LEADTOOLS文档转换器SDK 是一个简单的工具能够处理所有的文档和图像转换的需求结合起来。

在后台,Document Converter使用人工智能来选择LEADTOOLS Raster, SVG, OCR和 Document Writer 技术的正确组合, 以快速而精确地转换图像和文档。

在接下来的几周中,我们将通过向您展示如何在特定格式之间进行转换,来证明我们的文档转换技术的多功能性。今天的博客重点介绍如何将PDF转换为Word格式(DOC / DOCX)。

在C#中将PDF转换为DOC或DOCX

使用LEADTOOLS轻松将PDF转换为Word(DOC / DOCX)文档。下面的示例使用C#,但是LEADTOOLS支持其他几种语言,包括Java和VB。首先,导入LEADTOOLS SDK。

using Leadtools;
using Leadtools.Codecs;
using Leadtools.Document.Converter;
using Leadtools.Document.Writer;
using Leadtools.Ocr;
然后,初始化文档转换器。

namespace Convert_Files_with_Document_Converter
{
 class Program
 {
  static void Main(string[] args)
  {
   string directory = @"C:\InputFileDirectory";
   SetLicense();
   using (IOcrEngine ocrEngine = OcrEngineManager.CreateEngine(OcrEngineType.LEAD))
   using (DocumentConverter docConverter = new DocumentConverter())
   {
    ocrEngine.Startup(null, null, null, @"C:\LEADTOOLS21\Bin\Common\OcrLEADRuntime");
    docConverter.SetOcrEngineInstance(ocrEngine, false);
    // Change the DocumentFormat enumeration to whichever format is needed
    ConvertToDocument(directory, docConverter, DocumentFormat.Doc);
   }
  }
 }
}
最后,转换文档。
static void ConvertToDocument(string directory, DocumentConverter docConverter, DocumentFormat docFormat)
{
 string[] files = Directory.GetFiles(directory, "*.pdf");
 string outputDir = Path.Combine(directory, "Converted");
 if (!Directory.Exists(outputDir))
  Directory.CreateDirectory(outputDir);
 foreach (string file in files)
 {
  Console.WriteLine($"Converting {file}...");
  string fileName = Path.GetFileNameWithoutExtension(file);
  string ext = DocumentWriter.GetFormatFileExtension(docFormat);
  string outFile = Path.Combine(outputDir, $"{fileName}.{ext}");
  DocumentConverterJobData jobData = DocumentConverterJobs.CreateJobData(file, outFile, docFormat);
  jobData.JobName = "Convert to Image Job";
  DocumentConverterJob job = docConverter.Jobs.CreateJob(jobData);
  docConverter.Jobs.RunJob(job);
  if (job.Errors.Count > 0)
   foreach (var error in job.Errors)
    Console.WriteLine($"Error during conversion: {error.Error.Message}\n");
  else
   Console.WriteLine($"Successfully Convereted {file} to {outFile}\n");
 }
}

在Visual Basic中将PDF转换为DOC或DOCX

LEADTOOLS还支持Visual Basic .NET应用程序。只需使用下面的功能,即可将LEADTOOLS Document Converter集成到您的应用程序中。

Public Sub DocumentConverterExample()
 Using documentConverter As New DocumentConverter()
  Dim inFile As String = Path.Combine(ImagesPath.Path, "Leadtools.pdf")
  Dim outFile As String = Path.Combine(ImagesPath.Path, "output.doc")
  Dim format As DocumentFormat = DocumentFormat.Doc
  Dim jobData As DocumentConverterJobData = DocumentConverterJobs.CreateJobData(inFile, outFile, format)
  jobData.JobName = "conversion job"
  Dim job As DocumentConverterJob = documentConverter.Jobs.CreateJob(jobData)
  documentConverter.Jobs.RunJob(job)
  If job.Status = DocumentConverterJobStatus.Success Then
   Console.WriteLine("Success")
  Else
   Console.WriteLine("{0} Errors", job.Status)
   For Each errorItem As DocumentConverterJobError In job.Errors
    Console.WriteLine("  {0} at {1}: {2}", errorItem.Operation, errorItem.InputDocumentPageNumber, errorItem.Error.Message)
   Next
  End If
 End Using
End Sub
用Java将PDF转换为DOC或DOCX

使用LEADTOOLS Java Document Converter时发现了类似的方法。在Java中,应用程序将使用以下功能创建转换作业。

static void ConvertToDocument(String inputFile, DocumentConverter docConverter, OcrEngine ocrEngine)
{
 DocumentWriter docWriter = new DocumentWriter();
 ocrEngine.startup(new RasterCodecs(), docWriter, null, null);

 String outputFile = "C:\\LEADTOOLS21\\Resources\\Images\\documentConverter.pdf";

 docConverter.setDocumentWriterInstance(docWriter);
 docConverter.setOcrEngineInstance(ocrEngine, true);
 DocumentConverterJobData jobData = DocumentConverterJobs.createJobData(inputFile, outputFile, DocumentFormat.Doc);
 jobData.setJobName("DocumentConversion");

 DocumentConverterJob job = docConverter.getJobs().createJob(jobData);
 docConverter.getJobs().runJob(job);

 if (job.getErrors().size() > 0)
  for (DocumentConverterJobError error : job.getErrors())
   System.out.println("\nError during conversion: " + error.getError().getMessage());
 else
  System.out.println("Successfully converted file to " + outputFile);
}
有关Java文档转换器的更多信息,请查看我们有关LEADTOOLS Java文档转换器的完整教程 。

这就是将文件从PDF转换为Word格式的全部,但是为什么到此为止呢?查看所有 LEADTOOLS支持的格式。

试用版下载>>>

LEADTOOLS 使用教程>>>


想要购买LEADTOOLS正版授权,或了解更多产品信息请点击


标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn

文章转载自:

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关产品
LEADTOOLS Imaging Pro Developer Toolkit

20多年的老牌图像处理控件,支持TWAIN扫描、200多种图像效果、150多种图像格式…

LEADTOOLS Document Suite Developer Toolkit

LEADTOOLS Document Imaging Suite SDK是LEADTOOLS SDK中各种特点的精选组合,这套强大的工具利用了LEAD行业领先的图像处理技术来智能地识别文档的特征,而根据文档的特征可以识别扫描的或传真的任何类型的表格图像。

LEADTOOLS Document Imaging Developer Toolkit

多语言的文档图像处理控件,支持光符识别处理、条形码扫描识别等。

LEADTOOLS Medical Developer Toolkit

LEADTOOLS Medical Imaging是一款医疗成像控件,包含了一些精心挑选的、经过优化的特性,可以满足医疗成像应用程序开发的特殊需要。

LEADTOOLS Medical Imaging Suite Developer Toolkit

LEADTOOLS Medical Imaging Suite帮您开发功能强大的PACS和医学成像应用程序

扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP