文档章节

pdfbox 读取文件报错 java.io.IOException: Page tree root must be a dictionary

lemos
 lemos
发布于 07/13 18:51
字数 194
阅读 83
收藏 0

「深度学习福利」大神带你进阶工程师,立即查看>>>

pdfbox java.io.IOException: Page tree root must be a dictionary

示例代码

public static void main(String[] args) {
    try (InputStream sampleInputs = new ClassPathResource("sample/untitle2.pdf").getInputStream();
         PDDocument doc = PDDocument.load(sampleInputs, MemoryUsageSetting.setupTempFileOnly())) {
        // get the document catalog
        PDAcroForm acroForm = doc.getDocumentCatalog().getAcroForm();
        // as there might not be an AcroForm entry a null check is necessary
        if (acroForm != null) {
            // Retrieve an individual field and set its value.
            PDTextField field = (PDTextField) acroForm.getField("sampleField");
            field.setValue("Text Entry");
            // If a field is nested within the form tree a fully qualified name
            // might be provided to access the field.
            field = (PDTextField) acroForm.getField("fieldsContainer.nestedSampleField");
            field.setValue("Text Entry");
        }
        // Save and close the filled out form.
//            doc.save("target/FillFormField.pdf");
    } catch (IOException e) {
        e.printStackTrace();
    }
}

maven 中添加配置

    <build>
        <plugins>
            <plugin>
                <groupId>org.springframework.boot</groupId>
                <artifactId>spring-boot-maven-plugin</artifactId>
            </plugin>
            <plugin>
                <artifactId>maven-resources-plugin</artifactId>
                <configuration>
                    <nonFilteredFileExtensions>
                        <nonFilteredFileExtension>pdf</nonFilteredFileExtension>
                    </nonFilteredFileExtensions>
                </configuration>
            </plugin>
        </plugins>
    </build>

参考:http://maven.apache.org/plugins/maven-resources-plugin/examples/filter.html

lemos
粉丝 10
博文 238
码字总数 109375
作品 0
芜湖
后端工程师
私信 提问
加载中
请先登录后再评论。
Nutch学习笔记4-Nutch 1.7 的 索引篇 ElasticSearch

上一篇讲解了爬取和分析的流程,很重要的收获就是: 解析过程中,会根据页面的ContentType获得一系列的注册解析器, 依次调用每个解析器,当其中一个解析成功后就返回,否则继续执行下一个解...

强子哥哥
2014/06/26
712
0
Go-node

Go-node 是一个用 Go 语言实现的 Erlang/OTP node 已支持的功能: Publish listen port via EPMD Handle incoming connection from other node using Erlang Distribution Protocol Spawn E......

匿名
2013/01/25
1.5K
1
C++模板库--C++ B-tree

这是一个google开源的C++模板库,实现了基于B-tree数据结构的有序内存容器。类似于STL的map、set、multimap和multiset模板,C++ B-tree也提供了btreemap、btreeset、btreemultimap和btreemu...

匿名
2013/02/05
3.4K
1
PHP web 服务器--YACS

YACS 是一个强大的 PHP 脚本,可以让你维护一个动态的 Web 服务器。 特性: - Runs on your own server, or on a shared web site - Post articles with web forms, by e-mail, or remotely ......

匿名
2013/03/18
858
0
硬实时操作系统--Raw OS

Raw-OS 起飞于2012年,Raw-OS志在制作中国人自己的最优秀硬实时操作系统。 Raw-OS 操作系统特性 内核最大关中断时间无限接近0us, s3c2440系统最大关中断时间实测0.8us。 支持idle任务级别的事...

jorya_txj
2013/03/19
6.3K
1

没有更多内容

加载失败,请刷新页面

加载更多

人工神经网络分类器及BP算法相关数学推导和思考

人工神经网络相关数学推导和思考 今天凌晨今天凌晨的欧冠的八分之一决赛中,巴萨依靠朗格莱,梅西,苏亚雷斯三人的进球顺利挺进八强!梅老板的1V4更是让人直呼:爷青回!那么问题来了,如何根...

osc_873fteab
27分钟前
0
0
Spring Boot实战解决高并发数据入库: Redis 缓存+MySQL 批量入库

前言 最近在做阅读类的业务,需要记录用户的PV,UV; 项目状况:前期尝试业务阶段; 特点: 快速实现(不需要做太重,满足初期推广运营即可) 快速投入市场去运营 收集用户的原始数据,三要素...

osc_g96tdr1z
28分钟前
0
0
HFDS的数据写入流程

1.HFDS的数据写入流程的基本参数 首先了解数据写入过程中,什么是block, packet, chunk 1.block:数据块,当上传的文件太大时, 就需要分块,一个块默认设置时128M, 在客户端完成切割操作。...

osc_52r4y6wv
29分钟前
22
0
CVE-2020-14644 weblogic iiop反序列化漏洞分析

报告编号:B6-2020-081101 报告来源:360CERT 报告作者:ph4nt0mer 更新日期:2020-08-11 0x01 文章简述 2020年7月15日,Oracle发布2020年7月关键补丁更新,其中针对 WebLogic Server Core组件...

360CERT
今天
0
0
程序员到底要不要懂业务?

一、前言 给非互联网行业从业者科普一下,互联网公司一个项目团队的标准成员组成和职责分工:项目经理、架构师、产品经理、核心开发人员(TL)、开发、测试、运营(或业务方)。 项目经理:一...

osc_r0irdqn7
30分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部