提供3000多款全球软件/控件产品
针对软件研发的各个阶段提供专业培训与技术咨询
根据客户需求提供定制化的软件开发服务
全球知名设计软件,显著提升设计质量
打造以经营为中心,实现生产过程透明化管理
帮助企业合理产能分配,提高资源利用率
快速打造数字化生产线,实现全流程追溯
生产过程精准追溯,满足企业合规要求
以六西格玛为理论基础,实现产品质量全数字化管理
通过大屏电子看板,实现车间透明化管理
对设备进行全生命周期管理,提高设备综合利用率
实现设备数据的实时采集与监控
利用数字化技术提升油气勘探的效率和成功率
钻井计划优化、实时监控和风险评估
提供业务洞察与决策支持实现数据驱动决策
翻译|使用教程|编辑:李显亮|2021-08-03 10:04:42.233|阅读 285 次
概述:有时需要从 PowerPoint 幻灯片中提取文本以执行文本分析。另一方面,可能希望提取文本并将其保存在文件或数据库中以供进一步处理。据此,本文介绍了如何使用 Java 从 PowerPoint 演示文稿中提取文本。
# 慧都年终大促·界面/图表报表/文档/IDE等千款热门软控件火热促销中 >>
有时需要从 PowerPoint 幻灯片中提取文本以执行文本分析。另一方面,可能希望提取文本并将其保存在文件或数据库中以供进一步处理。据此,本文介绍了如何使用 Java 从 PowerPoint 演示文稿中提取文本。特别是,您将学习如何从特定幻灯片或整个演示文稿中提取文本。
为了操作 PowerPoint 演示文稿,我们将使用Aspose.Slides for Java,旨在在 Java 应用程序中实现 PowerPoint 自动化功能。它还提供了一些从 PPT/PPTX 演示文稿中提取文本的简单方法。
>>你可以点击这里下载Aspose.Slides 最新版测试体验。
以下是使用 Java 从 PowerPoint 演示文稿中的幻灯片中提取文本的步骤。
以下代码示例展示了如何从 PowerPoint 幻灯片中提取文本。
//Instatiate PresentationEx class that represents a PPTX file Presentation pptxPresentation = new Presentation("presentation.pptx"); //Get an Array of ITextFrame objects from the first slide ITextFrame[] textFramesSlideOne = SlideUtil.getAllTextBoxes(pptxPresentation.getSlides().get_Item(1)); //Loop through the Array of TextFrames for (int i = 0; i < textFramesSlideOne.length; i++) { //Loop through paragraphs in current TextFrame for (IParagraph para : textFramesSlideOne[i].getParagraphs()) { //Loop through portions in the current Paragraph for (IPortion port : para.getPortions()) { //Display text in the current portion System.out.println(port.getText()); //Display font height of the text System.out.println(port.getPortionFormat().getFontHeight()); //Display font name of the text System.out.println(port.getPortionFormat().getLatinFont().getFontName()); } } }
还可以从整个 PowerPoint 演示文稿中提取文本。以下是执行此操作的步骤。
以下代码示例展示了如何从 PowerPoint 演示文稿中提取文本。
//Instatiate PresentationEx class that represents a PPTX file Presentation pptxPresentation = new Presentation("presentation.pptx"); //Get an Array of ITextFrame objects from the first slide ITextFrame[] textFrames = SlideUtil.getAllTextFrames(pptxPresentation, true); //Loop through the Array of TextFrames for (int i = 0; i < textFrames.length; i++) { //Loop through paragraphs in current TextFrame for (IParagraph para : textFrames[i].getParagraphs()) { //Loop through portions in the current Paragraph for (IPortion port : para.getPortions()) { //Display text in the current portion System.out.println(port.getText()); } } }
如果你想试用Aspose的全部完整功能,可联系在线客服获取30天临时授权体验。
本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处、不得修改原文相关链接,如果存在内容上的异议请邮件反馈至chenjj@capbkgr.cn
对于银行金融、政府、医疗等需要处理大量信息的组织来说,高效的数据管理至关重要。对于大型数据扫描项目,Dynamic Web TWAIN SDK 提供强大的功能,只需极少的设置即可支持大量文档处理,让我们看看 Dynamsoft 如何简化此过程中的每个步骤。
在 Microsoft Excel 中,复制行、列和单元格是日常数据处理中的常见操作。本文将介绍如何使用 Spire.XLS for Java 和 Java 在 Excel 中复制行、列和单元格数据并保留格式。
雷达图又称蜘蛛图,是一种显示二维多元数据的图形方法。图表上的每个辐条代表一个不同的变量,数据点沿着这些辐条绘制。雷达图尤其适用于比较不同实体在多个标准中的表现。本文将演示如何使用 Spire.XLS for Python 通过 Python 在 Excel 中创建雷达图。
本文将为大家介绍如何使用图表控件SciChart WPF实现WPF应用程序的DPI感知,欢迎下载最新版组件体验!
服务电话
重庆/ 023-68661681
华东/ 13452821722
华南/ 18100878085
华北/ 17347785263
客户支持
技术支持咨询服务
服务热线:400-700-1020
邮箱:sales@capbkgr.cn
关注我们
地址 : 重庆市九龙坡区火炬大道69号6幢