在Matlab中,kmeans函数用于执行k均值聚类算法。它的语法如下:
[idx, C] = kmeans(X, k)
其中,X是一个m×n的矩阵,表示包含m个样本的数据集,每个样本有n个特征;k是要分成的聚类数目;idx是一个m×1的向量,表示每个样本所属的聚类索引;C是一个k×n的矩阵,表示每个聚类的中心点。
kmeans函数通过迭代将数据集划分成k个聚类,每个聚类用一个中心点表示。它使用欧几里得距离来度量样本之间的相似性,并尝试最小化样本到其所属聚类中心的距离之和。
使用kmeans函数的步骤如下:
以下是一个示例:
data = [1,2; 2,1; 4,5; 5,4; 8,9; 9,8];
k = 2;
[idx, C] = kmeans(data, k);
在这个示例中,数据集data有6个样本,每个样本有2个特征。我们将数据集分成2个聚类。最后,idx将包含每个样本所属的聚类索引,C将包含两个聚类的中心点。