文档章节

Aspose.Words组件介绍及使用—基本介绍与DOM概述

李朝强
 李朝强
发布于 2015/04/29 18:27
字数 2324
阅读 133
收藏 1

1.1丰富的功能集

其丰富的功能特性主要有以下4个方面:

1)格式转换。Aspose.Words具有高质量的文件格式转换功能,可以和Doc,OOXL,RTF,TXT等格式互相转换。

2)文档对象模型。通过丰富的API以编程方式访问所有的文档元素和格式,允许创建,修改,提取,复制,分割,加入,和替换文件内容。

3)文件渲染。可以在服务器端转换整个文档或者页面为PDF,XPS,SWF格式,同样可以转换文档页面为图像格式,或者.NET Graphics对象,这些功能和Microsoft.Word是一样的。

4)报表。可以从对象或者数据源填充模版生成文件。

1.2不需要Microsoft.Word

Aspose.Words可以在没有安装Microsoft Office的机器上工作。所有的Aspose组件都是独立,不需要微软公司的授权。总之, Aspose.Words在安全性、稳定性、可扩展性、速度、价格和自动化功能方面,是一个很不错的选择。

1.3独立的平台

Aspose.Words可以运行在Windows,Linux和Mac OS操作系统上面。可以使用 Aspose.Words去创建32位或者64位的.NET应用程序,包括Asp.NET、WCF、WinForm等等,还可以使用Com组件在Asp、 Perl、PHP和Python语言中使用,同样可以在Mono平台上使用Aspose.Words建立.NET应用程序。

1.4性能和可伸缩性

Aspose.Words可以运行在服务器和客户端,它是一个独立的.NET程序集,可以被任何.NET应用程序复制和部 署。使用Aspose.Words可以在短时间内产生成千上万的文档,可以打开文档,并修改格式和内容,填充数据并保存。Aspose.Words是多线 程安全的,不同的线程在同一时间处理不同的文档。

1.5最小的学习曲线

虽然Aspose.Words拥有150多个公共类和枚举类型,但是Aspose.Words的学习曲线很小因为Aspose.Words的API是围绕下列目标精心设计的:

1) 借鉴一些著名的API设计经验,如Microsoft Word。

2) 借鉴.NET框架设计指南的经验。

3) 提供易于使用的详细的文档元素操作文档。

以前在项目中使用Microsoft Word的开发者,可以在Aspose.Words中找到很多熟悉的类、方法和属性。

2.文档对象模型概述

2.1 DOM介绍

Aspose.Words的文档对象模型(以下简称DOM)是一个Word文档在内存中的映射,Aspose.Words的 DOM可以编程读取、操作和修改Word文档的内容和格式。理解DOM的结构和相应的类型,是使用Aspose.Words灵活编程的基础,这一点非常重 要。下面的一个Word文档例子和其结构如下图所示:

当上述文档被Aspose.Words的DOM读取时,会创建如下结构的树形对象:

从上图的结构和对应的Word文档,我们可以看到大概的DOM中相关对象的结构,有了这些基本概念,就可以很流程的操作 Word文档了。Document, Section, Paragraph, Table, Shape, Run 以及图中的其他椭圆形的都是 Aspose.Words对象,这些对象具有树形的层级结构,图中的注释同样说明这些文档对象树中的对象具有多个属性。

Aspose.Words中的DOM有以下特点:

1.所有的节点(node)类最终都继承于Node类,它是Aspose.Words DOM的基本类型。

2.节点可以包含(嵌套)其他节点,例如Section和Paragraph都继承自CompositeNode类,而CompositeNode类来源与Node类。

2.2 Node类型

当Aspose.Words读取Word文档到内存中时,不同类型的文档元素被不同的类型对象来替代,每一个文本框的 text, paragraph, table, section都是Node对象,甚至文档本身都是一个Node。Aspose.Words为每一种文 档节点类型都定义了一个类。

下面是一个UML类图,表示DOM中不同node类型之间的关系。抽象类的名字用斜体表示。注意,Aspose.Words DOM中同样包括了一些非节点类型的类,例如Style, PageSetup, Font等等,它们没有在这幅图里面显示。

 看看这些主要的类及作用

Aspose.Words类

类别

描述

Document

Document

Document对象是文档树的根节点,提供访问整个文档的入口

Section

Document

Section对象对应一个文档中的一节

Body

Document

是一节中的主要文本容器

HeaderFooter

Document

一节中的特殊页眉或者页脚容器

GlossaryDocument

Document

代表一个Word文档中词汇表的根条目

BuildingBlock

Document

代表一个词汇表文档,如构件,自动图文集或一个自动更正条目

Paragraph

Text

一个文本段落,保护内联的节点

Run

Text

一个格式一致的文本块

BookmarkStart

Text

一个书签的起点标记

BookmarkEnd

Text

一个书签的结束标记

FieldStart

Text

一个特殊的字符指定一个单词字段的开始

FieldSeparator

Text

单词字段的分隔符

FieldEnd

Text

一个特殊的字符指定一个单词字段的结束

FormField

Text

一个表单字段

SpecialChar

Text

特殊字符类型,没有具体的

Table

Tables

 Word文档中的表格

Row

Tables

一个表格对象的行

Cell

Tables

表格行的单元格

Shape

Shapes

Word文档中的图像,形状,文本框或者OLE对象

GroupShape

Shapes

一组Shapes对象

DrawingML

Shapes

一个文档中的Sharp或者图像,图表

Footnote

Annotations

文档中包括文本的脚注或者尾注

Comment

Annotations

文档中包含文本的注释

CommentRangeStart

Annotations

一个相关的注释区域的开始

CommentRangeEnd

Annotations

一个相关的注释区域的结束

SmartTag

Markup

在一个段落内围绕一个或多个内嵌结构的智能标记

CustomXmlMarkup

Markup

文档中的某些结构的自定义XML标记

StructuredDocumentTag

Markup

文档中的一种结构化的文档标签(内容控制)

OfficeMath

Math

代表Office的数学对象,如函数,方程或者矩阵

 

2.3组成模式

Aspose.Words文档的结构树非常重要,下面的设计吐可以更清晰的理解各个节点之间的包含关系。

2.3.1 Document and Section

文档和节:

从上图可以看出:

1.一个Document有1个或者多个Section(节)节点;

2.Section有1个Body(正文),没有或者有多个HeaderFooter节点;

3.Body和HeaderFooter可以包含多个块级节点;

4.1个Document能够有一个GlossaryDocument.

1个Word文档包含1个或多个节,一个节可以定义自己的页码,边距,方向,以及页眉页脚的文字;一个节保护主要的问题,如页眉,页脚(首页,奇数页,偶数页)。

2.3.2 Block-level节点

Block-level节点的关系图如下所示:

从上图中可以看到:

1.Block-level元素可以出现在文档中的很多地方,如Body的子节点,脚注,评论,单元格其他元素。

2.最重要的Block-level节点是表格和段落;

3.1个表格有0行或者多行;

CustomXmlMarkup 和StructuredDocumentTag可以包含其他Block-level节点;

2.3.3 Inline-level节点

从上面的图表可以看到下列关系:

1.Paragraph是最经常出现的Inline-level节点;

2.Paragraph可以包含不同的Run格式节点;也可以包含书签(bookmarks)和注释(annotations)

3.Paragraph还可以包含形状,图像,绘图对象等,以及智能标签;

2.3.4 表格行单元格

Table可以包含很多行,行可以包含单元格,单元格可以包括block-level节点。

 2.4 设计模式与导航

Aspose.Words将文档表示为一个有节点组成的树,因此就可以在节点之间互相切换。Aspose.Words提供了一个“文档浏览器”(DocumentExplorer),这是一个项目例子Demo。如下图所示:

可以通过Node类的ParentNode属性来访问上级节点,因此很方便获取父节点。文档对象模型是有大量的对象组合而成,他们的关系如下:

1.Node类是所有节点类的基类;

2.CompositeNode类是组合节点的基类;

3.Node类的中,没有子节点管理的接口,子节点管理的方法只出现在CompositeNode;

4.从Node类中移除子节点管理的方法,更干净,可以减少很多额外的转换;

 

第一篇基本介绍就介绍到这里,我们可以看到这个组件的功能是非常强大的,特别是文档的转换保存,操作也很灵活,相比DocX 当然要强大。只不过唯一不足它是商业的,自己业余玩玩倒是没问题,源代码等下一篇写例子了,再发上来吧,至于官方的资料,是商业的,大家都懂的。至于途径 吗,官方网站在这里:http://www.aspose.com/,国内的途径吧,CSDN比较多,呵呵。

本文转载自:http://www.cnblogs.com/asxinyu/p/3242754.html

李朝强
粉丝 90
博文 297
码字总数 149962
作品 0
郑州
产品经理
私信 提问
Aspose.Words组件介绍及使用—基本介绍与DOM概述 (转载)

阅读目录 1.基本介绍 2.文档对象模型概述 本博客所有文章分类的总目录:http://www.cnblogs.com/asxinyu/p/4288836.html 本博客其他.NET开源项目文章目录:http://www.cnblogs.com/asxinyu/...

~少司命~
2015/12/02
91
0
Aspose.Words 系列组件介绍 | 附免费下载

Aspose.Words产品系列 Aspose.Words for.NET 目标Windows窗体、ASP.NET、WPF、WCF或基于.NET Framework 2.0或更高版本的任何应用程序 Aspose.Words forJava 可用于基于Java SE或EE的桌面,W...

可乐瓶的小辣椒
2017/11/06
51
0
精益 React 学习指南 (Lean React)

本书内容 这本书我会由简单到复杂的带领大家进入 React 的世界, 其中 1 - 3 章节都是 React 的基础知识,需要提醒读者的是大多数的基础知识都可以通过 React 的官方文档学习,如果对英语敏感...

陈学家
2016/05/25
0
0
React-Native入门指南(六)——JSX在React-Native中的应用

React-Native入门指南 github:https://github.com/vczero/react-native-lession React-Native:用JavaScript开发你的原生应用,释放Native的UI体验,体验 Hybird开发效率。 最近一个星期写的文...

vczero
2015/06/29
218
0
React 16.x 路线图公布,包括服务器渲染的 Suspense 组件及Hooks等

原文作者:Dan Abramov 译者:UC 国际研发 Jothy 写在最前:欢迎你来到“UC国际技术”公众号,我们将为大家提供与客户端、服务端、算法、测试、数据、前端等相关的高质量技术文章,不限于原创...

2018/11/28
0
0

没有更多内容

加载失败,请刷新页面

加载更多

OSChina 周四乱弹 —— 当你简历注水但还是找到了工作

Osc乱弹歌单(2019)请戳(这里) 【今日歌曲】 @花间小酌 :#今日歌曲推荐# 分享成龙的单曲《男儿当自强》。 《男儿当自强》- 成龙 手机党少年们想听歌,请使劲儿戳(这里) @hxg2016 :刚在...

小小编辑
今天
3K
22
靠写代码赚钱的一些门路

作者 @mezod 译者 @josephchang10 如今,通过自己的代码去赚钱变得越来越简单,不过对很多人来说依然还是很难,因为他们不知道有哪些门路。 今天给大家分享一个精彩的 GitHub 库,这个库整理...

高级农民工
昨天
5
0
用好项目管理工具,人人都可以成为项目经理

现在市面上的项目管理工具越来越多了,但是大多数都是一些协同工具或轻量项目管理工具。如果是多团队、跨部门使用或者企业级的项目管理,从管理思想到工具运用,需要适应企业的业务流程体系,...

cs平台
昨天
12
0
只需一步,在Spring Boot中统一Restful API返回值格式与统一处理异常

统一返回值 在前后端分离大行其道的今天,有一个统一的返回值格式不仅能使我们的接口看起来更漂亮,而且还可以使前端可以统一处理很多东西,避免很多问题的产生。 比较通用的返回值格式如下:...

晓月寒丶
昨天
70
0
区块链应用到供应链上的好处和实际案例

区块链可以解决供应链中的很多问题,例如记录以及追踪产品。那么使用区块链应用到各产品供应链上到底有什么好处?猎头悬赏平台解优人才网小编给大家做个简单的分享: 使用区块链的最突出的优...

猎头悬赏平台
昨天
32
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部