最近在思考安全本体工程,做了多源异构数据的集成,以前多为看一看,没有实际全部实现,其实实现过程中就会发现很多问题。
根据之前对本体和知识图谱的思考,把实例偏向于知识图谱构建时需要的东西,在本体构建过程中,更多的是概念。概念比起实例,要严格得多,比较明显的例子有:大楼是概念,清水河校区主楼是实例。
一开始考虑的是使用带标签的本地叙词表去做本体树或本体森林的更新,但在搜集完各种数据源之后发现,要做本体树/森林的更新必须要三元组库,也就是说,从文本数据中获取的不能只是Pyate抽出来的一些术语,还需要有三元组。
其次,要对三元组进行大致分类,如谓词是某些特殊词时,表示子类关系(层次关系-主语是概念,宾语也是概念)、实例关系(钱钱是比格-主语是实例,宾语是概念),是一般词的时候,表示非层次关系(1:主语是概念,宾语也是概念;2:主语是实例,宾语也是实例)。
把大致分类的三元组存储到三元组库里,在更新本体树或本体森林的时候,把本地叙词表和三元组结合起来弄。