[问答]

K均值聚类算法的MATLAB怎么实现？

问答对人有帮助，内容完整，我也想知道答案 0 什么是K-均值聚类法？ K均值聚类算法的matlab怎么实现？ 0
2021-6-10 10:01:25　　评论淘帖0 邀请回答您可以邀请以下用户，快速回答问题 × Elva_chen 该类别下有 5 个回答。邀请回答 cmh25 该类别下有 5 个回答。邀请回答风动影随该类别下有 5 个回答。邀请回答 uwuefsdf 该类别下有 5 个回答。邀请回答 60user48 该类别下有 5 个回答。邀请回答 billbian 该类别下有 5 个回答。邀请回答 hvyweyrrwwrr 该类别下有 4 个回答。邀请回答 Oo一笑该类别下有 4 个回答。邀请回答 dechun28448 该类别下有 4 个回答。邀请回答 huhuiyun 该类别下有 4 个回答。邀请回答 freedom0zh 该类别下有 4 个回答。邀请回答 60user106 该类别下有 4 个回答。邀请回答 h1654155602.2407 该类别下有 4 个回答。邀请回答 sdgsgsgs 该类别下有 4 个回答。邀请回答 qa110 该类别下有 4 个回答。邀请回答梅子74 该类别下有 4 个回答。邀请回答蟹蟹蟹蟹该类别下有 4 个回答。邀请回答 zkzk196599 该类别下有 4 个回答。邀请回答 tozhyan 该类别下有 4 个回答。邀请回答该怎么起名字呢该类别下有 3 个回答。邀请回答举报莫联雪相关推荐 • FCM聚类算法以及改进模糊聚类算法用于医学图像分割的matlab源程序 3728 • 请教51用的聚类算法 1918 • 模糊C-均值聚类,请教大虾帮我解释下面的程序 2014 • 有关路径相似度matlab实现的问题，真心求助，万分感谢 3366 • 请教一种可识别未受污染点的中值/均值滤波matlab程序 2341 • 如何实现基于四阶累积量的自适应均值滤波算法？ 1804 • Mahout 0.9中的聚类(Clustering)工具的用法 1372 • 急求局部均值分解 MATLAB程序 3640 • 基于二维图像的FFT算法实现matlab程序 6501 • MATLAB中如何做到去列平均值 4211 1个回答

答案对人有帮助，有参考价值 0 　　1.K-均值聚类法的概述　　之前在参加数学建模的过程中用到过这种聚类方法，但是当时只是简单知道了在matlab中如何调用工具箱进行聚类，并不是特别清楚它的原理。最近因为在学模式识别，又重新接触了这种聚类算法，所以便仔细地研究了一下它的原理。弄懂了之后就自己手工用matlab编程实现了，最后的结果还不错，嘿嘿~~~ 　　简单来说，K-均值聚类就是在给定了一组样本（x1， x2，。。.xn）（xi， i = 1， 2，。。. n均是向量）之后，假设要将其聚为 m（《n）类，可以按照如下的步骤实现：　　Step 1：从（x1， x2，。。.xn）中随机选择 m 个向量（y1，y2，。。.ym）作为初始的聚类中心（可以随意指定，不在n个向量中选择也可以）; 　　Step 2：计算（x1， x2，。。.xn）到这 m 个聚类中心的距离（严格来说为 2阶范数）; 　　Step 3：对于每一个 xi（i = 1，2，。。.n）比较其到（y1，y2，。。.ym）距离，找出其中的最小值，若到 yj 的距离最小，则将 xi 归为第j类; 　　Step 4： m 类分好之后，计算每一类的均值向量作为每一类新的聚类中心; 　　Step 5：比较新的聚类中心与老的聚类中心之间的距离，若大于设定的阈值，则跳到 Step2; 否则输出分类结果和聚类中心，算法结束。　　OK，废话不多说，直接上Matlab代码。　　% 利用K-均值聚类的原理，实现对一组数据的分类。这里以一组二维的点为例。　　N = 40; % 点的个数　　X = 10rand（1，N）; 　　Y = 10rand（1，N）; % 随机生成一组横纵坐标取值均在（0，10）之间的点，X Y 分别代表横纵坐标　　plot（X， Y， ‘r’）; % 绘出原始的数据点　　xlabel（‘X’）; 　　ylabel（‘Y’）; 　　title（‘聚类之前的数据点’）; 　　n = 2; %将所有的数据点分为两类　　m = 1; %迭代次数　　eps = 1e-7; % 迭代结束的阈值　　u1 = ［X（1），Y（1）］; %初始化第一个聚类中心　　u2 = ［X（2），Y（2）］; %初始化第二个聚类中心　　U1 = zeros（2，100）; 　　U2 = zeros（2，100）; %U1，U2 用于存放各次迭代两个聚类中心的横纵坐标　　U1（：，2） = u1; 　　U2（：，2） = u2; 　　D = zeros（2，N）; %初始化数据点与聚类中心的距离　　while（abs（U1（1，m） - U1（1，m+1））》 eps \|\| abs（U1（2，m） - U1（2，m+1）》 eps \|\| abs（U2（1，m） - U2（1，m+1））》 eps \|\| abs（U2（2，m） - U2（2，m+1））》 eps））　　m = m +1; 　　% 计算所有点到两个聚类中心的距离　　for i = 1 ： N 　　D（1，i） = sqrt（（X（i） - U1（1，m））^2 + （Y（i） - U1（2，m））^2）; 　　end 　　for i = 1 ： N 　　D（2，i） = sqrt（（X（i） - U2（1，m））^2 + （Y（i） - U2（2，m））^2）; 　　end 　　A = zeros（2，N）; % A用于存放第一类的数据点　　B = zeros（2，N）; % B用于存放第二类的数据点　　for k = 1： N 　　［MIN，index］ = min（D（：，k））; 　　if index == 1 % 点属于第一个聚类中心　　A（1，k） = X（k）; 　　A（2，k） = Y（k）; 　　else % 点属于第二个聚类中心　　B（1，k） = X（k）; 　　B（2，k） = Y（k）; 　　end 　　end 　　indexA = find（A（1，：） ~= 0）; % 找出第一类中的点　　indexB = find（B（1，：） ~= 0）; % 找出第二类中的点　　U1（1，m+1） = mean（A（1，indexA））; 　　U1（2，m+1） = mean（A（2，indexA））; 　　U2（1，m+1） = mean（B（1，indexB））; 　　U2（2，m+1） = mean（B（2，indexB））; % 更新两个聚类中心　　end 　　figure; 　　plot（A（1，indexA）， A（2，indexA）， ‘b’）; % 作出第一类点的图形　　hold on 　　plot（B（1，indexB）， B（2，indexB）， ‘oy’）; %作出第二类点的图形　　hold on 　　centerx = ［U1（1，m） U2（1，m）］; 　　centery = ［U1（2，m） U2（2，m）］; 　　plot（centerx ， centery， ‘+g’）; % 画出两个聚类中心点　　xlabel（‘X’）; 　　ylabel（‘Y’）; 　　title（‘聚类之后的数据点’）; 　　disp（［‘迭代的次数为：’，num2str（m）］）; 　　得到的分类结果如下：　　　　　　50个随机生成的点分为两类迭代只需要4步，从上图来看，分类的效果还是不错的。但是每次运行可能分类的结果会不一样，这是因为这些点是随机生成的，而且也没有明确的分类标准的缘故。

2021-6-10 11:27:59 评论举报张杰