文档章节

aspose pdf 转 html

C
 Canaan_
发布于 2016/04/13 19:57
字数 335
阅读 64
收藏 2

包下载 : http://download.csdn.net/download/ahgaoyong/9374140

package com.demo;

import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;

import org.apache.commons.io.FileUtils;
import org.apache.commons.io.IOUtils;

import com.aspose.pdf.Document;
import com.aspose.pdf.HtmlSaveOptions;
import com.aspose.pdf.HtmlSaveOptions.CssSavingInfo;
import com.aspose.pdf.HtmlSaveOptions.CssSavingStrategy;
import com.aspose.pdf.HtmlSaveOptions.CssUrlMakingStrategy;
import com.aspose.pdf.HtmlSaveOptions.CssUrlRequestInfo;
import com.aspose.pdf.HtmlSaveOptions.ResourceSavingStrategy;
import com.aspose.pdf.License;
import com.aspose.pdf.SaveOptions.ResourceSavingInfo;

/**
 * 
 * 由于ASPOSE比较吃内存,操作大一点的文件就会堆溢出,所以请先设置好java虚拟机参数:-Xms1024m -Xmx1024m(参kao值)<br>
 * 
 * @author Spark
 *
 */
public class TestPdf {

    private static InputStream license;
    private static InputStream pdf;

    /**
     * 获取license
     * 
     * @return
     */
    public static boolean getLicense() {
        boolean result = false;
        try {
            license = TestPdf.class.getClassLoader().getResourceAsStream("\\license.xml");// license路径
            pdf = TestPdf.class.getClassLoader().getResourceAsStream("\\人人都是产品经理.pdf");// 原始pdf路径
            License aposeLic = new License();
            aposeLic.setLicense(license);
            result = true;
        } catch (Exception e) {
            e.printStackTrace();
        }
        return result;
    }

    /**
     * 
     * @param args
     */
    public static void main(String[] args) {
        // 验证License
        if (!getLicense()) {
            return;
        }

        try {
            long old = System.currentTimeMillis();
            Document pdfDocument = new Document(pdf);
            File file = new File("D:\\d\\test.html");// 输出路径
            FileOutputStream fileOS = new FileOutputStream(file);
            
            HtmlSaveOptions options = new HtmlSaveOptions();
            options.CustomResourceSavingStrategy = new ResourceSavingStrategy() {
				@Override
				public String invoke(ResourceSavingInfo arg0) {
					try {
						File file = new File("D:\\d\\"+arg0.SupposedFileName);// 输出路径
						byte[] b =IOUtils.toByteArray(arg0.ContentStream.toInputStream());
						FileOutputStream fileOS = new FileOutputStream(file);
						fileOS.write(b);
					} catch (FileNotFoundException e) {
						// TODO Auto-generated catch block
						e.printStackTrace();
					} catch (IOException e) {
						// TODO Auto-generated catch block
						e.printStackTrace();
					}
					return arg0.SupposedFileName;
				}
			};
			options.CustomCssSavingStrategy = new CssSavingStrategy() {
				@Override
				public void invoke(CssSavingInfo arg0) {
					try {
						File file = new File(arg0.SupposedURL);// 输出路径
						byte[] b =IOUtils.toByteArray(arg0.ContentStream.toInputStream());
						FileOutputStream fileOS = new FileOutputStream(file);
						fileOS.write(b);
					} catch (FileNotFoundException e) {
						// TODO Auto-generated catch block
						e.printStackTrace();
					} catch (IOException e) {
						// TODO Auto-generated catch block
						e.printStackTrace();
					}
				}
			};
			options.CustomStrategyOfCssUrlCreation = new CssUrlMakingStrategy() {
				@Override
				public String invoke(CssUrlRequestInfo arg0) {
					return "D:\\d\\test.css";
				}
			};
            
            pdfDocument.save(fileOS, options);

            long now = System.currentTimeMillis();
            System.out.println("共耗时:" + ((now - old) / 1000.0) + "秒\n\n" + "文件保存在:" + file.getPath());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}



© 著作权归作者所有

共有 人打赏支持
C
粉丝 17
博文 296
码字总数 128442
作品 0
福州
Aspose.Pdf for Java 4.3.0 发布

Aspose.Pdf for Java 4.3.0 发布,该版本只需两行代码就可以将 PDF 转成 HTML 文档;大大提升了 PdfExtractor 的 extractTextAsHTML 方法;为 JDK 1.4 和 1.5 提供两个独立的 jar 文件;改进...

oschina
2013/10/23
547
0
Aspose.Slides for Java 3.0 发布

Aspose.Slides for Java 3.0 发布,主要改进包括: 幻灯片打印 图表渲染 SmartArt 渲染 PPT/ODT 转 PPTX 导出幻灯片到 HTML 支持 OOXML 另外从该版本开始不再依赖于 JAI 或者其他库来渲染幻灯...

oschina
2012/11/14
410
0
Aspose.Pdf for .NET 8.4.0 发布

Aspose.Pdf for .NET 8.4.0 提供了等待已久的转 EPUB 文件到 PDF 格式的功能,优化了 PDF 转图片功能,输出的图片体积更小。 Aspose.Pdf 是一个 PDF 组件,用来生成 PDF 文档而无需 Adobe Ac...

oschina
2013/09/22
459
0
Aspose.Pdf for Java 11.0.0 发布

Aspose.Pdf for Java 11.0.0 发布,更新如下: 新特性和改进: It includes PDFto PPTX conversion and subscript/superscript text support along withmany other features and enhancement......

oschina
2016/01/06
1K
7
Aspose.Pdf for Java 11.8.0,PDF到PDFA的转换

Aspose.Pdf for Java 11.8.0发布了,实现了pdf到pdfa的转换功能。修复了以前版本中的一些问题,PDF格式为PDF/ A,PDF格式为HTML,PDF格式为DOC,打印问题iSeries及其他。详情可查看Aspose.Pd...

凝小紫
2016/08/28
987
2

没有更多内容

加载失败,请刷新页面

加载更多

学习设计模式——中介者模式

1. 认识中介者模式 1. 定义:用一个中介对象来封装一系列的对象交互行为,中介者使得各对象不需要显式的互相引用,从而使其松散耦合,独立的改变他们之间的交互。 2. 结构: Mediator:中介者...

江左煤郎
26分钟前
0
0
深入理解Plasma(1):Plasma 框架

这一系列文章将围绕以太坊的二层扩容框架,介绍其基本运行原理,具体操作细节,安全性讨论以及未来研究方向等。本篇文章作为开篇,主要目的是理解 Plasma 框架。 Plasma 作为以太坊的二层扩容...

HiBlock
33分钟前
0
0
Java 8 日期 示例

Java 8 推出了全新的日期时间API。Java处理日期、日历和时间的方式一直为社区所诟病,将 java.util.Date设定为可变类型,以及SimpleDateFormat的非线程安全使其应用非常受限。Java也意识到需...

阿刚ABC
59分钟前
1
0
RxJava操作符lift 笔记

在内部,每个Rx operator都做3件事: 它订阅源并观察值。 它根据操作员的目的转换观察到的序列。 它通过调用onNext,onError和onCompleted将修改后的序列推送到自己的订阅者。 compose运算符...

woshixin
今天
1
0
lnmp+coreseek实现站内全文检索(安装篇)

软件安装包 安装环境 系统环境 centos7.2 1核2G 软件环境 coreseek-3.2.14 lnmp1.5 安装mmseg 更新依赖包和安装编译环境 yum -y install m4 autoconf automake libtoolyum -y install gcc g...

毛毛雨rain
今天
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部