k-means算法是什么

发布时间:2021-12-04 17:28:38 作者:柒染
来源:亿速云 阅读:122

这篇文章将为大家详细讲解有关k-means算法是什么,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。

聚类算法属于无监督的机器学习算法,即没有类别标签y,需要根据数据特征将相似的数据分为一组。k-means为聚类算法中最简单、常见的一种,通过计算距离,将相似性高的数据分在一起。

随机选择k个点作为聚类中心,计算其他点与中心点的距离,选择距离最近的中心并归类,归类完成后计算每类的新中心点,重新计算每个点与中心点的聚类并选择距离最近的归类,重复此过程,直至中心点不再变化。

k-means算法是什么

需要注意的是,使用k-means算法时,要先确认k的值,即想分为几类,k值一般设定为3-5。下图为从网上截取的图片,可以直观看到通过4次迭代,将点聚为3个簇(cluster)的过程。

k-means算法是什么

在R中实现k-means聚类,可以直接使用kmeans()函数。在下面的例子中,我们使用iris数据集进行演示。

k-means算法是什么

k-means算法是什么

颜色代表聚类后得到的结果,形状代表真实的划分,“*”为聚类中心点。如下可查看每个样本点的聚类结果:

k-means算法是什么

在python中实现k-means聚类,可以使用sklearn.cluster中的KMeans()函数同样使用iris数据集进行演示。

k-means算法是什么

k-means算法是什么

颜色代表聚类后得到的结果。

优点

(1)算法原理简单,聚类速度快。

(2)容易实现。

缺点

(1)k值需要事先给定,有时候不知道分成几类最合适。

(2)初始中心点的选择会影响聚类效果。这也是为什么每次进行聚类后,得到结果不同的原因。

(3)因为通过距离判断点的相似度进行聚类,因此k-means算法有一定的使用局限。当潜在簇的形状为大小相近的近似圆形,且每个簇之间聚类较明显,k-means聚类结果比较理想。

关于k-means算法是什么就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看到。

推荐阅读:
  1. k-means算法原理以及数学知识
  2. Spark实现K-Means算法代码示例

免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。

k-means

上一篇:如何用python进行静态爬虫及地址经纬度转换

下一篇:LINUX C系统编程与PYTHON中的时间模块对比是怎样的

相关阅读

您好,登录后才能下订单哦!

密码登录
登录注册
其他方式登录
点击 登录注册 即表示同意《亿速云用户服务条款》