文档章节

可扩展标记语言XML之二:XML语言格式规范、文档组成

o
 osc_g8254g7s
发布于 2019/08/19 20:06
字数 834
阅读 12
收藏 0

钉钉、微博极速扩容黑科技,点击观看阿里云弹性计算年度发布会!>>>

大家好,小乐又来了,好久不见!这次接着上次可扩展标记语言XML之一:XML概念,作用,示例,继续讲述XML。

 

一、格式良好的 xml

1、语法规范:

1)、必须有 XML 文档声明:

<?xml version="1.0"?> <?xml version="1.0" encoding="UTF-8"?> <?xml version="1.0" standalone="yes"?> <?xml version="1.0" encoding="UTF-8" standalone="yes" ?> 

说明:

XML standalone 定义了外部定义的 DTD 文件的存在性. standalone element 有效值

是 yes 和 no. 如下是一个例子:

<?xml version="1.0" encoding="UTF-8" standalone="no"?> <!DOCTYPE s1 PUBLIC "http://www.ibm.com/example.dtd" "example.dtd"> <s1>.........</s1> 

值 no 表示这个 XML 文档不是独立的而是依赖于外部所定义的一个 DTD. 值 yes 表

示这个 XML 文档是自包含的(self-contained).

注意文本文件保存时候默认的编码格式是ANSI,需用记事本把它手动改为UTF-8保存。

2)、必须有且仅有一个根元素

3)、严格区分大小写

4)、属性值用引号(双引号或单引号) :等号分开的名称-值对;在一个元素上,相同的属

性只能出现一次

5)、标记成对;

6)、空标记关闭;

7)、元素正确嵌套。

 

2、元素命名规则

1)、名称中可以包含字母、数字或者其他可见字符;

2)、名称不能以数字开头;

3)、不能以 XML/xml/Xml…开头;

4)、名称中不能含空格;

5)、名称中不能含冒号(注:冒号留给命名空间使用)

 

3、实体

实体叫 ENTITY,实体的作用是避免重复输入。作用相当于宏或者变量。

1)内置的 5 种实体

实体 符号

< <

> >

& &

" "

' '

2)自定义实体

<!DOCTYPE 根元素[ 
<!--实体声明--> <!ENTITY 实体名 "实体内容"> ]> 使用已定义的实体&实体名; <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE sxt[ <!--实体声明--> <!ENTITY xm "明明"> <!ENTITY gen "保密"> ]> <sxt> <teacher> <name>明明</name> <gender>保密</gender> </teacher> <!--引用实体的方法--> <teacher> <name>&xm;</name> <gender>&gen;</gender> </teacher> </sxt> 

 

4、文档类型声明

文档类型定义——DOCTYPE,文档类型声明,紧跟 XML 声明之后,包含所有实体声明

<?xml version="1.0" encoding="utf-8"?> <!DOCTYPE 根元素标记名[ <!--实体声明--> ]> 

 

二、XML 文档组成

1、构成

所有的 XML 文档(以及 HTML 文档)均由以下简单的构建模块构成:

元素

属性

实体

PCDATA

CDATA

CDATA 节(character data)

 

2、CDATA

用于把整段文本解释为纯字符数据而不是标记的情况。如包含大量的<、>、&、或者"

字符。CDATA 节中的所有字符都会被当做元素字符数据的常量部分,而不是 XML 标记,

可以输入除]]>外任意字符,不能嵌套。

<![CDATA[ ...... ]]>

 

3、PCDATA

PCDATA 的意思是被解析的字符数据(parsed character data)。 可把字符数据想象为 XML 元素的开始标签与结束标签之间的文本。

PCDATA 是会被解析器解析的文本。这些文本将被解析器检查实体以及标记。

文本中的标签会被当作标记来处理,而实体会被展开。

不过,被解析的字符数据不应当包含任何 &、< 或者 > 字符;需要使用 &、< 以及 >的内置实体来分别替换它们。

 

关注乐字节,更多技术文章随时奉上

o
粉丝 0
博文 500
码字总数 0
作品 0
私信 提问
加载中
请先登录后再评论。
xml文件

什么是XML? 可扩展标记语言,标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处...

SVD
2016/01/20
106
0
学习 XML

关于XML的详细教学内容:学习XML (XML(可扩展标记语言)是W3C的推荐标准,是一种很像超文本标记语言的标记语言,它的设计宗旨是传输数据,而不是显示数据;它的标签没有被预定义,需要自行...

阿里小百科
2018/11/29
1
0
XML的基本了解

关于XML的详细教学内容:学习XML (XML(可扩展标记语言)是W3C的推荐标准,是一种很像超文本标记语言的标记语言,它的设计宗旨是传输数据,而不是显示数据;它的标签没有被预定义,需要自行...

阿里云大学云百科
2019/04/28
1
0
学习 XML

XML 不是 HTML 的替代,XML 和 HTML 为不同的目的而设计:XML 被设计用来传输和存储数据,其焦点是数据的内容;HTML 被设计用来显示数据,其焦点是数据的外观;HTML 旨在显示信息,而 XML 旨...

阿里小百科
2019/01/21
0
0
JAVAEE 第二周

关于xml语言: XML(也做文件扩展名),在电子计算机中,标记指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种的信息比如文章等。它可以用来标记数据、定义数据类型,...

osc_o9hwrm96
2018/07/29
2
0

没有更多内容

加载失败,请刷新页面

加载更多

Python骚操作 | 川普的嘴,骗人的鬼!

↑ 关注 + 星标 ,后台回复【 大礼包 】送你Python自学大礼包 阅读文本大概需要 3 分钟 前几天,川普又在推特因为宣扬暴力翻车了,不过,对于这位翻车王来说,已经是常规操作了。在推特上指点...

Python绿色通道
06/19
0
0
(五)改掉这些坏习惯,还怕写不出精简的代码?

鲁迅说:嬉笑怒骂里充满了无奈和妥协。 小猿说:先生说的不对,在程序员的世界里,编写代码处处充满了无奈和妥协。 Code Review 是一场苦涩但有意思的修行。 (一)改掉这些坏习惯,还怕写不...

一猿小讲
06/15
0
0
Linus:我们都老了,但Linux维护后继无人

点击上方“五分钟学算法”,选择“星标”公众号 重磅干货,第一时间送达 来自:大数据文摘(ID:BigDataDigest)出品 来源:theregister 编译:笪洁 本周在线举行的开源峰会和嵌入式Linux会议...

五分钟学算法
07/08
0
0
腾讯应用宝:首次上传演示视频需要去腾讯视频进行实名认证的操作

前段时间打算把刚开发好的Android应用上架到腾讯的应用宝商店,但是由于业务的需要,需要上传App的操作演示视频,由于是首次在应用宝上面上架App,需要处理的东西太多,这里就不再一一介绍,...

sanzhanggui
2019/12/14
0
0
祝大家端午节快乐!

端午节快乐 本文分享自微信公众号 - 嘉为科技(canway_service)。 如有侵权,请联系 support@oschina.cn 删除。 本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。...

嘉为科技
06/24
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部