文档章节

PDF开发工具Spire.PDF 教程:使用C#从PDF中的特定矩形区域中提取文本

可乐瓶的小辣椒
 可乐瓶的小辣椒
发布于 2018/01/11 14:49
字数 286
阅读 33
收藏 0

使用Spire.PDF,程序员可以从PDF文档中的特定矩形区域提取文本,本文演示如何使用Spire.PDF和C#实现此功能。

示例文件:

图片1

详细步骤:

Step 1: 初始化PdfDocument类的对象并加载PDF文件。

PdfDocument pdf = new PdfDocument();
pdf.LoadFromFile("Stories.pdf");

Step 2: 获取第一页。

PdfPageBase page = pdf.Pages[0];

Step 3: 从页面中的特定矩形区域中提取文本,之后将文本保存为.txt文件。

string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());

输出:

图片2

完整代码:

//Initialize an object of PdfDocument class
PdfDocument pdf = new PdfDocument();
//Load the PDF file
pdf.LoadFromFile("Stories.pdf");

//Get the first page
PdfPageBase page = pdf.Pages[0];

// Extract text from a specific rectangular area within the page
string text = page.ExtractText(new RectangleF(50, 50, 500, 100) );

//Save the text to a .txt file
StringBuilder sb = new StringBuilder();
sb.AppendLine(text);
File.WriteAllText("Extract.txt", sb.ToString());

© 著作权归作者所有

可乐瓶的小辣椒
粉丝 5
博文 318
码字总数 126125
作品 0
私信 提问
Spire.Pdf 的各种操作总结

Spire.Pdf 的各种操作总结 简介 试验新产品总是给我带来许多挑战,当然这也是一个引进创新技术的好方法。在这里我要跟大家分享的是使用Spire.Pdf的过程,它是来自E-iceblue公司的轻便PDF程序...

eiceblue
2015/02/13
0
0
Spire.PDF 教程:在C#中显示或隐藏PDF图层

创建PDF图层时,Spire.PDF允许开发人员为图层设置初始的可见性状态。 同时它还支持更改PDF文档中现有图层的可见性。 本文介绍如何使用Spire.PDF显示或隐藏现有图层。 PdfLayer.Visibility属性...

可乐瓶的小辣椒
2017/11/01
0
0
C# 操作PDF 图层(Layer)——添加、删除图层、设置图层可见性

前言 通过添加图层,我们可以将文本、图片、表格、图形等元素精确定位于页面指定位置,将这些元素进行叠放、组合形成页面的最终效果。此外,对于页面中已有的图层我们也可以进行设置图层可见...

E_iceblue
2018/05/08
0
0
怎么用Transformer+从PDF文档编辑数据

ABBYY PDF Transformer+是一款可创建、编辑、添加注释及将PDF文件转换为其他可编辑格式的通用工具,可使用该软件从PDF文档编辑机密信息,然后再发布它们,文本和图像均可编辑,本文将为大家具...

ABBYY
2016/12/22
13
0
C# Parsing 类实现的 PDF 文件分析器

下载示例 下载源代码 1. 介绍 这个项目让你可以去读取并解析一个PDF文件,并将其内部结构展示出来. PDF文件的格式标准文档可以从Adobe那儿获取到. 这个项目基于“PDF指南,第六版,Adobe便携...

oschina
2014/03/11
10.8K
5

没有更多内容

加载失败,请刷新页面

加载更多

访问LNMP虚拟主机出现报错:No input file specified.

之前一直是使用lnmp一键包,但是访问创建的虚拟主机,并没有出现过的错误:No input file specified. 网上的文章很多,但是都是转载,而且原因也很多,根本不适用 后面在lnmp一键包官网找到解...

wenzhizhong
38分钟前
3
0
OSChina 周三乱弹 —— 你还能管得住观众愿意看谁吗

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @宇辰OSC :分享李宗盛的单曲《凡人歌 (电视剧《碧海情天》主题曲)》:你我皆凡人,生在人世间#今日歌曲推荐# 《凡人歌 (电视剧《碧海情天》主...

小小编辑
今天
437
12
Inf2Cat, signability test failed vc2019 wdk驱动sys build签名

解决问题的方法非常简单,只要让Inf2Cat验证的时候使用local时间就可以了。打开package工程的属性,在inf2cat工具的属性中进行设置。

simpower
今天
3
0
LinkedHashMap 是如何保证有序的?

//map的遍历方法如下 for (Map.Entry<String,Integer> entry : map.entrySet()) { System.out.println(entry.getKey()+":"+entry.getValue()); } HashMap#entry......

暗中观察
今天
3
0
Linux的基本命令

目录的操作命令(增删改查) 增: mkdir 目录名称; 查: ls 可以看到该目录下的所有的目录和文件 ls -a,可以看到该目录下的所有文件和目录,包括隐藏的 ls -l,可以看到该目录下的所有目录和...

凹凸凸
今天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部