Python聚类：K-means算法和聚类中心

作者：很菜不狗

2024.02.18 06:39

浏览量：2

简介：K-means算法是一种常用的聚类方法，它通过迭代过程将数据划分为K个聚类，并计算每个聚类的中心。在Python中，我们可以使用Scikit-learn库中的KMeans类来实现K-means算法。下面是一个简单的例子，演示如何使用K-means算法对数据进行聚类，并计算每个聚类的中心。

首先，我们需要导入必要的库。在本例中，我们将使用NumPy库来处理数据，并使用Scikit-learn库中的KMeans类来实现K-means算法。

import numpy as np
from sklearn.cluster import KMeans

接下来，我们将创建一个数据集。在本例中，我们将使用NumPy生成一个随机的二维数据集。

# 创建数据集
data = np.random.rand(100, 2)

现在，我们可以使用KMeans类来对数据进行聚类。在本例中，我们将指定聚类的数量为3。

# 创建KMeans对象并拟合数据
kmeans = KMeans(n_clusters=3)
kmeans.fit(data)

现在，我们可以使用KMeans对象的labels_属性来获取每个数据点的聚类标签。

# 获取每个数据点的聚类标签
labels = kmeans.labels_

我们还可以使用KMeans对象的clustercenters属性来获取每个聚类的中心。

# 获取每个聚类的中心
centers = kmeans.cluster_centers_

现在，我们可以将聚类中心可视化。在本例中，我们将使用Matplotlib库来绘制散点图和圆圈图。

# 导入Matplotlib库
import matplotlib.pyplot as plt
# 绘制散点图和圆圈图
plt.scatter(data[:, 0], data[:, 1], c=labels, cmap='viridis')
plt.scatter(centers[:, 0], centers[:, 1], c='red', s=200, alpha=0.5)
plt.show()

在这个例子中，我们使用K-means算法对随机生成的数据集进行了聚类，并计算了每个聚类的中心。我们还使用Matplotlib库将聚类结果可视化。请注意，这只是一个简单的例子，实际应用中可能需要更复杂的数据预处理和参数调整过程。

Python聚类：K-means算法和聚类中心

最热文章