K-means聚类分析的Python代码实现

简介：K-means是一种常用的聚类分析算法，它通过将数据点分配给最近的均值（即簇中心）来将数据分成K个集群。下面是一个使用Python和sklearn库实现K-means聚类分析的简单示例代码。

首先，我们需要导入必要的库。在本例中，我们将使用sklearn库中的KMeans类来进行聚类分析。

from sklearn.cluster import KMeans
import numpy as np

接下来，我们需要生成一些随机数据来进行聚类分析。在这个例子中，我们将生成一个包含100个点的二维数组，其中每个点的坐标都是随机生成的。

# 生成随机数据
data = np.random.rand(100, 2)

现在，我们可以创建一个KMeans对象，并使用fit方法对数据进行聚类分析。在这个例子中，我们将设置簇的数量为3。

# 创建KMeans对象
kmeans = KMeans(n_clusters=3)
# 对数据进行聚类分析
kmeans.fit(data)

在fit方法完成后，我们可以使用labels_属性获取每个数据点的簇标签。标签为0、1或2的点分别属于第1个、第2个和第3个簇。

# 获取每个数据点的簇标签
labels = kmeans.labels_

我们还可以使用clustercenters属性获取簇中心点的坐标。这些点是每个簇中所有点的均值。

# 获取簇中心点的坐标
centers = kmeans.cluster_centers_

现在，我们可以将数据点和簇中心点绘制在二维平面上，以便更好地理解聚类结果。我们可以使用matplotlib库来实现这一点。

from matplotlib import pyplot as plt
# 绘制数据点和簇中心点
plt.scatter(data[:, 0], data[:, 1], c=labels)
plt.scatter(centers[:, 0], centers[:, 1], c='red', marker='x')
plt.show()

上述代码将绘制一个散点图，其中每个点的颜色表示其所属的簇，红色的’x’表示每个簇的中心点。通过观察图形，我们可以直观地了解聚类结果。
请注意，这只是一个简单的示例，实际应用中可能需要对数据进行预处理（例如标准化或归一化），以及调整KMeans算法的参数（例如初始化方法、迭代次数和停止准则等）以获得更好的聚类效果。此外，还可以使用其他聚类算法（例如层次聚类和DBSCAN）来处理不同的聚类问题。

K-means聚类分析的Python代码实现

最热文章