加载中
聚类算法介绍

聚类,就是根据数据的“相似性”将数据分为多类的过程。 评估不同样本之间的“相似性”,通常使用的方法为计算样本之间的“距离”。距离计算方法的不同会影响聚类结果的好坏。 1)簇类型 (1...

2019/03/12 19:28
52
sklearn聚类模型:基于密度的DBSCAN;基于混合高斯模型的GMM

1 sklearn聚类方法详解 2 对比不同聚类算法在不同数据集上的表现 3 用scikit-learn学习K-Means聚类 4 用scikit-learn学习DBSCAN聚类 (基于密度的聚类) 5 DBSCAN密度聚类算法 6 混合高斯模型...

2019/03/13 15:04
266
K-Means 及 K-Means++

原始K-means算法最开始随机选取数据集中K个点作为聚类中心,而K-means++按照如下的思想选取K个聚类中心: 假设已经选取了n个初始聚类中心(0<n<K),则在选取第n+1个聚类中心时:距离当前n个聚...

2019/03/13 15:13
39
ann搜索算法(Approximate Nearest Neighbor)

ANN的方法分为三大类:基于树的方法、哈希方法、矢量量化方法。brute-force搜索的方式是在全空间进行搜索,为了加快查找的速度,几乎所有的ANN方法都是通过对全空间分割,将其分割成很多小的...

2019/03/12 19:58
148
ANN中乘积量化与多维倒排小结

  目前特征向量的比对加速优化能极大缩短比对耗时,改善用户体验。 优化的途径主要有两种,一是使用指令集(SSE,AVX)加速运算。二是使用ANN替代暴力搜索。 乘积量化和倒排索引组合是ANN中...

2019/03/12 20:26
161

没有更多内容

加载失败,请刷新页面

没有更多内容

返回顶部
顶部