总结:机器学习之Jaccard相似度

原创
02/07 09:12
阅读数 503

一、介绍

Jaccard相似系数用于比较有限样本集之间的相似性和差异性。

定义:给定两个集合A和B, jaccard 系数定义为A与B交集的大小与并集大小的比值,jaccard值越大说明相似度越高。

得出的Jaccard相似系数值在0到1之间。

当A和B都为空时,jaccard(A,B)=1;

与Jaccard 系数相关的指标叫做Jaccard 距离,用于描述集合之间的不相似度。Jaccard 距离越大,样本相似度越低。公式定义如下:
 

二、

 

参考:

常见文本相似度计算方法简介

展开阅读全文
打赏
0
0 收藏
分享
加载中
更多评论
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部