文档章节

资源描述框架RDF

永和
 永和
发布于 2017/03/02 16:35
字数 1222
阅读 71
收藏 0

在图书馆里,每一本书都要被编目,这样才能方便查找和利用。于是,很早就有人想到,网上所有的资源也需要"编目"。

如果要对网络资源编目,首先就必须有一套"编目规则"。资源描述框架(Resource Description Framework ,简称RDF),就是一套W3C提出的描述网络资源的方法。

RDF的基本思想很简单,就是说任何网络资源都可以唯一地用URI(统一资源标识符,Uniform Resource Identifier)来表示。在这里,可以简化地将URI理解成网址URL。

比如,世界第一大网站Yahoo!首页的网址是http://www.yahoo.com/,那么它的首页就可以用这个网址来唯一代表。

有了这个识别符以后,网络资源的其他特性都用"属性(Property)"="属性值(Property value)"这样的形式来表示。

bg2008022501.png

请看上图,最顶部的方框表示网络资源http://www.yahoo.com/,下面的两个方框表示两个属性关系,一个是"资源作者=Yahoo!公司",另一个是"资源名称=Yahoo!首页"。

根据RDF的定义,资源本身是主语subject,属性名称是谓语predicate,属性指是宾语object。对网络资源的描述就采用主-谓-宾的形式。

RDF本身用xml文件的形式表示,比如上图写成xml文件就是:

<?xml version="1.0"?>

<RDF>
<Description about="http://www.yahoo.com/">
<资源作者>Yahoo!公司</资源作者>
<资源名称>Yahoo!首页</资源名称>
</Description>
</RDF>

这个xml文件不是很规范,主要是为了说明问题。

RDF强大的地方在于,它只规定了主-谓-宾这种描述形式,至于谓语和宾语到底是什么,完全可以根据不同需要自由选用。因此,RDF才能定义为"资源描述框架",而不是"资源描述方法"。

用于RDF的最常见谓语和宾语,是都柏林核心(Dublin Core),简称DC。它是一套用于描述信息的元数据,一共有15个标签,也就是15个谓语和宾语的组合,其中常见的标签包括Title,Creator,Subject等等。

采用了都柏林核心以后,基本上所有的网络资源都可以用RDF描述出来,因此初步实现了对网络资源进行编目的目的,为下一步机器化处理和最终语义网的实现打下了基础。

以下我举一个实例。

2年前的今天,2006年2月25日,我写了一篇网志《学科和采矿》,用RDF对这篇网志进行编目,就是下面的结果:

<?xml version="1.0" encoding="utf-8"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:trackback="http://madskills.com/public/xml/rss/module/trackback/"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description
rdf:about="http://www.ruanyifeng.com/blog/2006/02/post_179.html"
trackback:ping="http://www.ruanyifeng.com/cgi-bin/mtype/mt-tb.cgi/251"
dc:title="学科和采矿"
dc:identifier="http://www.ruanyifeng.com/blog/2006/02/post_179.html"
dc:subject="History"
dc:description="今天突然想到一个比喻:选择不同的学科就好像采矿一样。 有的矿是新发现的矿物品种,埋藏浅,品味高,容易开采。选择这样的矿,很容易出成果。某些新兴学科大概就是这样的矿,计算机科学可以算一个例子。..."
dc:creator="ruanyf"
dc:date="2006-02-25T20:52:32+08:00" />

</rdf:RDF>

这是一个规范的xml文件,可以实际使用。请注意标成黑体的那几行。首行"rdf:Description",这是RDF规定使用的标签,表示主语subject,后来的"rdf:about"属性用来表示资源的标识符,也就是url,它唯一地确定了一个网络资源。其他属性中的dc:title、dc:identifier、dc:subject、dc:description、dc:creator和dc:date,分别表示题目、标识符、主题、简介、创造者、日期,这几项都属于都柏林核心,等号后面是相应的值。至于trackback:ping属性,这一项在都柏林核心中没有规定,但是也可以加上去,从中可以看到RDF资源描述框架的灵活和强大。

[延伸阅读]

1. RDF Tutorial
2. W3C: RDF Primer

本文转载自:http://www.ruanyifeng.com/blog/2008/02/rdf.html

永和

永和

粉丝 809
博文 20
码字总数 9162
作品 0
广州
产品经理
私信 提问
资源描述框架RDF

在图书馆里,每一本书都要被编目,这样才能方便查找和利用。于是,很早就有人想到,网上所有的资源也需要"编目"。 如果要对网络资源编目,首先就必须有一套"编目规则"。资源描述框架(Resou...

阮一峰
2008/02/25
0
0
【学习】RDF · 资源描述框架

RDF是一个框架,用来描述web资源。它使用Web标识符来标识事物,并通过属性与属性值来描述资源。 资源是可拥有URI的任何事物,比如 http://www.jianshu.com/writer 属性是拥有名称的资源,比如...

jxfactor
2015/10/23
0
0
RDF API for PHP

RAP - RDF API for PHP 资源描述框架(RDF)是用于描述网络资源的 W3C 标准,比如网页的标题、作者、修改日期、内容以及版权信息。 RAP是一套基于 GNU LESSER GENERAL PUBLIC LICENSE (LGPL)...

匿名
2010/12/30
1K
0
【Semantic Web】从G. Antoniou等人视角看语义网(一)语义网愿景

高速发展的万维网已经成为人类历史上影响最深远、最广泛的信息传播媒介,同时也推动着下一代万维网技术的发展。1998年,万维网的发明人Tim Berners-Lee 提出了语义网(Semantic Web)的设想。...

qq_28869927
2018/01/16
0
0
图数据库--AllegroGraph

AllegroGraph是一款老牌图数据库,据称其负载“数十亿RDF(即资源描述框架)三元组仍可保持高性能”。尽管RDF三元组可以作为边线来处理,但AllegroGraph的原本设计意图是创建以RDF为中心的语义...

匿名
2017/09/09
886
1

没有更多内容

加载失败,请刷新页面

加载更多

只需一步,在Spring Boot中统一Restful API返回值格式与统一处理异常

统一返回值 在前后端分离大行其道的今天,有一个统一的返回值格式不仅能使我们的接口看起来更漂亮,而且还可以使前端可以统一处理很多东西,避免很多问题的产生。 比较通用的返回值格式如下:...

晓月寒丶
昨天
59
0
区块链应用到供应链上的好处和实际案例

区块链可以解决供应链中的很多问题,例如记录以及追踪产品。那么使用区块链应用到各产品供应链上到底有什么好处?猎头悬赏平台解优人才网小编给大家做个简单的分享: 使用区块链的最突出的优...

猎头悬赏平台
昨天
28
0
全世界到底有多少软件开发人员?

埃文斯数据公司(Evans Data Corporation) 2019 最新的统计数据(原文)显示,2018 年全球共有 2300 万软件开发人员,预计到 2019 年底这个数字将达到 2640万,到 2023 年达到 2770万。 而来自...

红薯
昨天
65
0
Go 语言基础—— 通道(channel)

通过通信来共享内存(Java是通过共享内存来通信的) 定义 func service() string {time.Sleep(time.Millisecond * 50)return "Done"}func AsyncService() chan string {retCh := mak......

刘一草
昨天
58
0
Apache Flink 零基础入门(一):基础概念解析

Apache Flink 的定义、架构及原理 Apache Flink 是一个分布式大数据处理引擎,可对有限数据流和无限数据流进行有状态或无状态的计算,能够部署在各种集群环境,对各种规模大小的数据进行快速...

Vincent-Duan
昨天
60
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部