["首页","博客标签","我","开源","深度学习","机器学习","自然语言","爬虫","编程","开发语言","前端开发","生活","论文","关于me"]
聚类算法 Kmeans
作者: IntoHole | 可以转载, 但必须以超链接形式标明文章原始出处和作者信息及版权声明
网址: http://www.buyiker.com/2015/05/03/data-cluster-kmeans.html
KMeans 聚类算法
Kmeans难点
- k值确定
- 距离公式选择
- 欧几得距离
- 马氏距离
- 闵可夫斯基距离
- 汉明距离
- 广义Jaccard系数
- Jaccard系数
- 数据处理
KMeans家族
- KMeans++: 用权重方式随机生成质心,让质心在距离上.离的远一些,让聚类更加随机,避免在点密集部分,过分集中
- Kmedios: 更新质心,不是类内数据平均值,而是类中离所有数据,距离最近的数据,作为新的中心,让聚类效果更加有代表性!
参考