图书馆看到了书《基于人工智能的网络空间安全》,它的前两章都和安全本体有关。虽然还没有仔细看,但里面不少都是已经见过的安全领域本体,像是一个综述。
今天在构思论文的时候,发现了一个问题,就是在我的视角里,自动构建本体极其困难,哪怕是一个子类关系,这都不是很容易得到的。你凭什么说自己的东西顶用,尤其是在不需要那么多实例数据的情况下。
那我的创新之处就要转移到本体工程方法论上,要说我这个方法适合安全领域的本体开发,然后就可以自然而然地把人工操作给填补回来,因为有人工操作,所以很多“自动化”得到的结果都只是参考,没法一锤定音。本体的这些任务,真的不好弄,你凭什么叫某个术语是概念,而不是实例呢?你抽取出一个实例,你如何知道这个实例属于哪种概念呢?你得到一个对象属性关系,你怎么知道它的domain和range分别是什么概念呢?你从数据源里得到一个数据属性,你怎么知道这个数据属性是属于谁的呢?
那我觉得,得到真正高质量的本体,一个适用于安全本体工程的方法论是必需的,多站在巨人的肩膀上。重新审视一下本体学习,或许从单独比较某一个任务的角度来看,本体学习还是可以的,但是把那么多技术集成在一起,实现本体学习的全过程,这个生成的本体真的正确吗?即便大致正确,它又真的可用吗?安全领域的本体学习,又有些像以前李老师和我说的态势预测一样,莫做太玄乎,你可以说是,也可以说不是。
我要打通从本体到知识图谱,再到安全应用的通路,必须用一个经过人工保证质量的本体。