字符串间距离 N-Gram

原创
2017/02/10 11:49
阅读数 492

 

N-Gram距离 = |GN(s)|+|GN(t)|−2×|GN(s)∩GN(t)|

 

|GN(s)| 是字符串 s 的 N-Gram集合,N 值一般取2或者3,假设N=2为例对字符串Gorbachev和Gorbechyov进行分段:

 

距离:8 + 9 − 2 × 4 = 9

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部