本体构建探索13--本体相关论文主题和套路

原创
2024/04/17 00:35
阅读数 71

经过研一开会听的那些,到现在,从无知到一知半解,尝试来解释一下本体和有关本体的文章套路。

从概念来说,本体是知识形式化表示,从实际来说,它可以用一个或多个标准化的文件来表示(可以是RDF、OWL之类的)。在2000-2010年间,本体还是火过一段时间,一般和语义网(Semantic Web)一起出现。自2012年谷歌提知识图谱之后,不少人转而拥抱知识图谱,在介绍知识图谱技术栈的时候,还是会把本体拿出来。

根据我第一次以本体为题论文投稿的经历,审稿人说ontology是一个mature field。成熟领域隐含意思就是过去活过,好摘的果子已经被摘得差不多了。

现在看专门搞本体的,要么是德国佬这些欧洲人,要么是斯坦福搞生物信息的人(有成熟的医疗、生物信息本体),要么就是国内那几个学阀,不过国内这些人不是专门搞本体了,还是偏向知识图谱甚至现在的大语言模型更多一些。

有以下套路:

1、本体建模套路:这种就是针对一个领域,甚至是领域内的一个问题,说提出了一个本体,然后行文思路就是,先强调这个领域缺少这样的本体,然后一通介绍,最后用能力问题之类的东西刷一刷。这种文章一直都有产出,但是不好刻意地去水,结合安全领域搞一个就差不多得了,再搞其他领域过分了。

2、本体工程套路:这是针对本体工程的方法论,提出一点想法。也是我现在正在考虑的内容,比如著名的NeOn,斯坦福七步法这些,你可以在他们的基础上做一点变化,或者是针对一个领域去弄一个本体构建框架。这种文章,有的是直接介绍整个构建方法的,有的是拿其中一个片段出来讨论的,比如怎么提取能力问题中的术语。

3、本体学习套路:这是针对本体自动化构建的,里面具体的有术语抽取、概念层次关系抽取、概念非层次关系抽取等,仔细一看,这些也是NLP的一些经典任务,在LLM出来之后,收到不少冲击。典型的是ISWC2023上已经有德国佬在弄LLM支持的本体学习,最近又有LLM支持的本体工程。

4、本体算法套路:这里针对本体里的逻辑推理,搞里面的算法优化之类的工作,可以是基于描述逻辑的。这种门槛很高,通篇数学公式,一般得是学阀或者有传承的实验室才好弄。但我认为仍然是一个套路,是一种挤牙膏式的产出。

最后就是涉及核心的,不是套路的内容,结合数理逻辑的问题,去做有关本体的理论证明,这种很难。明显,以我的智力不太够。

结论:不好弄,因为我只能遵从1、2、3套路来弄一些肤浅的工作,所谓学术性不够。所以要好好思考如何到知识图谱,已经如何应用。

 

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
0 评论
0 收藏
0
分享
返回顶部
顶部