彩票走势图

PDF管理控件Aspose.PDF for .Net使用教程(二十五):将PDF转换为DOC和DOCX

翻译|使用教程|编辑:李显亮|2020-01-08 09:39:57.890|阅读 699 次

概述:本系列教程中,将为开发者带来Aspose.PDF for .NET的一系列使用教程,例如进行文档间的转换,如何标记PDF文件,如何使用表单和图表等等。本文将介绍如何将PDF转换为DOC和DOCX。

# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>

相关链接:

Aspose.PDF for .NET是一种高PDF处理和解析API,用于在跨平台应用程序中执行文档管理和操作任务。API可以轻松用于生成、修改、转换、渲染、保护和打印PDF文档,而无需使用Adobe Acrobat。此外,API还提供PDF压缩选项,表格创建和操作,图形和图像功能,广泛的超链接功能,印章和水印任务,扩展的安全控制和自定义字体处理。

在接下来的系列教程中,将为开发者带来Aspose.PDF for .NET的一系列使用教程,例如进行文档间的转换,如何标记PDF文件,如何使用表单和图表等等。本文将介绍如何将PDF转换为DOC和DOCX。

>>Aspose.PDF for .NET更新至最新版v20.1,欢迎下载体验。


▲将PDF转换为DOC

许多用户都要求将PDF转换为DOC:将PDF文件转换为Microsoft Word文档。之所以需要这样做,是因为PDF文件不容易编辑,而Word文档却可以。一些公司希望其用户能够处理以PDF开头的文件中的文本,表格和图像。

Aspose.PDF for .NET允许使用两行代码将源PDF文件转换为DOC文件。为了实现此功能,引入了一个名为的枚举SaveFormat ,从而可以将源文件保存为Microsoft Word格式。以下代码段显示了将PDF文件转换为DOC的过程。

// For complete examples and data files, please go to //github.com/aspose-pdf/Aspose.PDF-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();          
            
// Open the source PDF document
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Save the file into MS document format
pdfDocument.Save(dataDir + "PDFToDOC_out.doc", SaveFormat.Doc);

DocSaveOptions类提供了完善的PDF文件转换成DOC格式的过程中众多特性。在这些属性中,Mode可以指定PDF内容的识别模式。从而可以从RecognitionMode枚举中为此属性指定任何值。这些值均具有特定的优点和局限性:

  • Textbox 模式可以快速且很好地保留PDF文件的原始外观,但是结果文档的编辑能力可能会受到限制。原始PDF中每个按视觉分组的文本块都将转换为输出文档中的文本框。这样可以达到与原始文件的最大相似度,因此输出文档看起来不错,但是它完全由文本框组成,并且可能使在Microsoft Word中进行编辑非常困难。
  • Flow 是完全识别模式,其中引擎执行分组和多级分析以根据作者的意图还原原始文档,同时生成易于编辑的文档。限制是输出文档可能看起来与原始文档不同。
  • RelativeHorizontalProximity 属性可用于控制文本元素之间的相对接近度,并且意味着距离由字体大小确定。较大的字体在音节之间的距离可能更大,但仍视为一个整体。它指定为字体大小的百分比,例如1 = 100%。这意味着相距12点的两个12pt字符在近端。
  • RecognitionBullets 用于在转换期间打开项目符号的识别。
// For complete examples and data files, please go to //github.com/aspose-pdf/Aspose.PDF-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();           
          
// Open the source PDF document
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");            

// Save using save options
// Create DocSaveOptions object
DocSaveOptions saveOptions = new DocSaveOptions();

// Set the recognition mode as Flow
saveOptions.Mode = DocSaveOptions.RecognitionMode.Flow;

// Set the Horizontal proximity as 2.5
saveOptions.RelativeHorizontalProximity = 2.5f;

// Enable the value to recognize bullets during conversion process
saveOptions.RecognizeBullets = true;

// Save the resultant DOC file
pdfDocument.Save(dataDir + "saveOptionsOutput_out.doc", saveOptions);


▲将PDF转换为Word DOCX

Docx是Microsoft Word文档的一种众所周知的格式,其结构从纯二进制更改为XML和二进制文件的组合。 可以使用Word 2007和横向版本打开Docx文件,但不能使用支持DOC文件扩展名的早期版本的MS Word打开。

DocSaveOptions类具有一个名为Format的属性,该属性提供了指定结果文档格式(即DOC或DOCX)的功能。 为了将PDF文件转换为DOCX格式,请传递DocSaveOptions.DocFormat枚举中的Docx值。以下代码片段提供了将PDF文件转换为DOCX格式的功能。

// For complete examples and data files, please go to //github.com/aspose-pdf/Aspose.PDF-for-.NET
// The path to the documents directory.
string dataDir = RunExamples.GetDataDir_AsposePdf_DocumentConversion();

// Open the source PDF document
Document pdfDocument = new Document(dataDir + "PDFToDOC.pdf");

// Instantiate DocSaveOptions object
DocSaveOptions saveOptions = new DocSaveOptions();
// Specify the output format as DOCX
saveOptions.Format = DocSaveOptions.DocFormat.DocX;
// Save document in docx format
pdfDocument.Save("ConvertToDOCX_out.docx", saveOptions);

还想要更多吗?您可以点击阅读【2019 · Aspose最新资源整合】查找需要的教程资源。如果您有任何疑问或需求,请随时,我们很高兴为您提供查询和咨询




标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn


为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
扫码咨询


添加微信 立即咨询

电话咨询

客服热线
023-68661681

TOP