文档章节

Java使用wkhtmltox实现HTML代码生成PDF文档或者图片

蓝狐乐队
 蓝狐乐队
发布于 2017/02/13 19:36
字数 1435
阅读 102
收藏 0

由于项目需要,把HTML代码转为PDF或者图片进行保存。最开始使用Flying Saucer来把HTML代码生成为PDF文档,功能已经开发出来了,也能够完成转换功能,期间也遇到了中文支持以及图片路径的问题,也解决了,本来以为这样就可以了,但是在测试期间发现有些PDF文档生成的样式有问题,搜索了一下发现,Flying Saucer是比较老的技术,现在也没人搞了,所以对于CSS3.0的支持很不友好。

    功能要实现啊,让别人改HTML代码也不现实,那就尝试着别的技术呗。后来想着能生成图片也行,就找了一下,发现使用CSSBOX可以把HTML代码生成为图片,然后就试了一下,果然可以,然后就开心的把这个功能集成到系统里面了。一直没出什么问题,结果悲剧又发生了,有一个页面使用CSS3渲染了一条斜着的直线,结果CSSBOX无法转换。

    其实开始的时候就知道有wkhtmltopdf可以把HTML代码生成为PDF文档,但是这个实际上是要安装一个软件,在Java代码中调用这个软件执行转换,当时觉得没有别的技术直接引入jar包方便,就没有尝试,现在实在是没有办法了,就尝试一下吧。因为我现在是要把HTML代码生成为图片,所以我使用的是wkhtmltoimage,其实没什么差别,在安装wkhtmltox软件时,会同时安装wkhtmltopdf和wkhtmltoimage。

    使用wkhtmltoimage的时候也没少走弯路,主要是对Linux不熟悉吧,在安装的时候遇到了不少问题。现在把我自己摸索的知识分享给大家,大家可以参考一下,只是个人观点,不正确的地方望大家见谅。下面就来介绍在Java调用这个软甲的详细用法。具体分为Windows环境和Linux环境。

 

1、软件下载地址:

官网下载地址首页:http://wkhtmltopdf.org/downloads.html

可以在这个页面下载到最新版本的wkhtmltox。

我没有使用最新版的,我使用的是0.12.2版本,下载地址为:http://download.gna.org/wkhtmltopdf/0.12/0.12.2/

 

2、Windows环境安装

Windows环境安装软件我就不多说了,我是在http://download.gna.org/wkhtmltopdf/0.12/0.12.2/这个网址,下载的wkhtmltox-0.12.2_msvc2013-win64.exe这个版本,32位的可以选择32位的版本下载,下载完成后就是双击安装了。安装完成后在安装目录能找到wkhtmltopdf.exe和wkhtmltoimage.exe,这两个执行程序就是我们用来转换PDF和转换图片的,后面会说到如何进行调用。

 

3、Linux环境安装

 我是在http://download.gna.org/wkhtmltopdf/0.12/0.12.2/地址下载的wkhtmltox-0.12.2_linux-centos6-i386.rpm这个版本的RPM包,由于我虚拟机安装的是CentOS6.5的32位,所以下载的是这个版本,你们可以根据实际情况,这个网址上有Linux的版本和32位64位对应的版本下载,根据实际情况选择即可。

 下载方式,可以在Linux上直接使用wget http://download.gna.org/wkhtmltopdf/0.12/0.12.2/wkhtmltox-0.12.2_linux-centos6-i386.rpm 进行下载,如果像我一样使用的是虚拟机,也可以先下载到本机上,然后在Linux上使用rz -be进行上传,注意使用rz命令上传大文件时,一定要加这个-be命令,否则上传不成功。若你的Linux中没有rz命令,那么可以使用yum -y install lrzsz命令来安装rz和sz命令。

 

下面开始安装:

 1)进入到RPM包下载的目录下,执行rpm -ivh wkhtmltox-0.12.2_linux-centos6-i386.rpm命令,结果出现如下所示:

 

失败原因是缺少xorg-x11-fonts-Type1和xorg-x11-fonts-75dpi依赖,那么我们要先装依赖。

 2)安装xorg-x11-fonts-Type1依赖:yum -y install xorg-x11-fonts-Type1。

 3)安装xorg-x11-fonts-75dpi依赖:yum -y install xorg-x11-fonts-75dpi。

 4)再次安装wkhtmltox:rpm -ivh wkhtmltox-0.12.2_linux-centos6-i386.rpm,OK,安装成功。如果大家在安装时还缺少其他依赖,那么需要先把缺少的依赖安装之后再安装wkhtmltox。查询缺少的依赖方法是 yum search xxxx,xxxx是缺少的依赖关键字,然后从查询结果中找到正确的yum源进行安装。

 5)安装完成后,我们可以使用wkhtmltoimage http://www.baidu.com 1.jpg或者wkhtmltopdf http://www.baidu.com 1.pdf来测试是否安装成功。

 

4、Java程序调用

 Java调用时,不需要添加额外的Jar包。

 Java调用代码:

public class CustomWKHtmlToPdfUtil {

    public String getCommand(String sourceFilePath, String targetFilePath) {
        String system = System.getProperty("os.name");
        if(system.contains("Windows")) {
            return "D:\\Program Files\\wkhtmltopdf\\wkhtmltoimage.exe " + sourceFilePath + " " + targetFilePath;
        }else if(system.contains("Linux")) {
            return "wkhtmltoimage " + sourceFilePath + " " + targetFilePath;
        }
        return "";
    }

    public static void main(String[] args) throws Exception{
        CustomWKHtmlToPdfUtil util = new CustomWKHtmlToPdfUtil();
        String command = util.getCommand("e:/html/result.html", "e:/html/result.jpg");
        Process process = Runtime.getRuntime().exec(command);
        process.waitFor();  //这个调用比较关键,就是等当前命令执行完成后再往下执行
        System.out.println("执行完成");
    }
}

其实就是使用Java调用cmd的执行命令,但是调用要区分Windows和Linux系统,如果是Windows系统,则必须要指定wkhtmltoimage或者wkhtmltopdf的位置,我在Windows的安装位置是D:\Program Files\wkhtmltopdf,因此我在上面调用wkhtmltoimage时使用的路径是D:\Program Files\wkhtmltopdf\wkhtmltoimage.exe。在Linux环境下,由于软件在安装时,会把wkhtmltopdf和wkhtmlimage安装到系统命令中,因此不需要指定安装路径,直接调用就可以了。

    我比较推荐使用wkhtmltoimage生成JPG图片,我调用wkhtmltopdf生成PDF时会有点问题。以上是我的一些经历,希望对大家有用!

本文转载自:http://www.cnblogs.com/cksvsaaa/p/6125546.html

共有 人打赏支持
蓝狐乐队
粉丝 104
博文 321
码字总数 89120
作品 0
昌平
程序员
私信 提问
wkhtmltoimage开源工具的基本应用

读大学时,微博兴起,由于140个字有限,于是有人开发了长微博,当时但想着开发一个长微博的应用。试用了几款长微博工具,大部分都是只能输入文字和插件一两张图片,这种长微博工具实现不难。...

一剑风徽
2012/11/18
0
7
将oschina收藏的博客在线转换为PDF文档

前一段时间无意获得了一个Kindle,有时候无聊的时候会简单的看下,简单的看了下里面与技术相关的书籍大多都是收费的,结合自己之前的又比较喜欢浏览osc自己收藏的文章的习惯。于是就简单的想...

hibegin
2016/08/01
178
0
Aspose.Pdf for .NET 7.8.0 发布

Aspose.Pdf for .NET 7.8.0 发布了,支持渲染 PDF 文档到 PostScript 格式,可独立访问 PDF 文档中的每个元素并进行操作,通过这个特性就可方便访问文档中所有图片,实现了移除 PDF 文件顶部...

oschina
2013/04/07
598
1
PDF生成进入基于Web服务的模板时代

PDF在版式文档中的王者地位不可撼动。我们有多种生成PDF的程序库:FPDF(PHP)、IText(Java)、PDFsharp(.NET)等。在不同语言环境下需要选择不同的程序库,通过API方式调用生成PDF,效率低...

XDOC_OSC
2015/08/26
0
0
Aspose.Pdf for Java 4.3.0 发布

Aspose.Pdf for Java 4.3.0 发布,该版本只需两行代码就可以将 PDF 转成 HTML 文档;大大提升了 PdfExtractor 的 extractTextAsHTML 方法;为 JDK 1.4 和 1.5 提供两个独立的 jar 文件;改进...

oschina
2013/10/23
596
0

没有更多内容

加载失败,请刷新页面

加载更多

微服务分布式事务实现

https://www.processon.com/view/link/5b2144d7e4b001a14d3d2d30

WALK_MAN
22分钟前
0
0
《大漠烟尘》读书笔记及读后感文章3700字

《大漠烟尘》读书笔记及读后感文章3700字: 在这个浮躁的社会里,你有多久没有好好读完一本书了? 我们总觉得自己和别人不一样,所以当看到别人身上的问题时,很少有“反求诸己”,反思自己。...

原创小博客
57分钟前
1
0
大数据教程(9.5)用MR实现sql中的jion逻辑

上一篇博客讲解了使用jar -jar的方式来运行提交MR程序,以及通过修改YarnRunner的源码来实现MR的windows开发环境提交到集群的方式。本篇博主将分享sql中常见的join操作。 一、需求 订单数据表...

em_aaron
今天
1
0
十万个为什么之什么是resultful规范

起源 越来越多的人开始意识到,网站即软件,而且是一种新型的软件。这种"互联网软件"采用客户端/服务器模式,建立在分布式体系上,通过互联网通信,具有高延时(high latency)、高并发等特点...

尾生
今天
1
0
Terraform配置文件(Terraform configuration)

Terraform配置文件 翻译自Terraform Configuration Terraform用文本文件来描述设备、设置变量。这些文件被称为Terraform配置文件,以.tf结尾。这一部分将讲述Terraform配置文件的加载与格式。...

buddie
今天
3
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部