请选择 进入手机版 | 继续访问电脑版

291 【SPSS的K-means聚类分析】在SPSS中进行医学数据的K-means聚类分析

[复制链接]
291 0
    在前几期,我们介绍了针对多个相关样本比较的Friedman M检验和Kendall和谐系数检验的方法。

    详见:

    《SPSS中非参数检验之多个相关样本比较的Friedman M检验

    《SPSS进行多个医学等级变量的Kandall和谐系数检验

    当变量为针对同一对象的不同观测且观测结果为二值(如满意与不满意等)结果时,样本观测变量为相关的二值样本。如在医学研究中,多名专家针对众多患者的症状打分、不同检测仪器针对不同样本的合格性检验等,此时,均需要采用CoChran Q检验。


1SPSS视频教程(陈老师)

2基本形式

   K-means聚类,也称快速聚类法或逐步聚类法。其聚类的基本思想是按照指定的分类数,按照某种原则选择某些观测作为凝聚点;按就近原则将剩余观测向凝聚点聚集,得到初始分类方案,并计算各初始分类的均值;使用计算出的均值再次就近向均值聚集,各观测的分类情况会在运算过程中不断改变,分类完毕后再次计算各类的均值;如此反复循环,直到凝聚点位置达到收敛标准为止。
3适用范围

    K-means聚类适用于连续的数据资料,已知样本分类,且要求数据符合正态分布、方差齐性的条件,同时K-means聚类仅只能对记录进行分类。
4案例解读

    我们收集了一份80名糖尿病患者的晨起血糖值的记录,如果需要将糖尿病患者患病情况分为正常、可控和严重三类,采用K-means聚类分析进行具体分类,具体操作如下:

    (1)具体操作步骤

    ①依次点击“分析——分类——K-均值聚类”。



    ②出现“K-均值聚类分析”窗口。



    ③将晨起血糖变量放入“变量”框中,并在聚类数框中填入“3”;点击“保存”,出现“K-均值聚类分析:保存新变量”对话框,勾选“聚类成员”。



    ④点击“选项”,出现“K-均值聚类分析:图”对话框,勾选“初始聚类中心”和“每个个案的聚类信息”。



     ⑤点击“继续”,“确定”,得到分析结果。

    (2)结果解读

    ①回到“数据视图”窗口,可以看到,数据列中出现了对个案记录进行分类的结果。



   ②其次,查看“每个聚类中的个案数目”表,可以看到,有29名患者为第1类,21名患者为第2类,30名患者为第3类。



    ③最后,查看“最终聚类中心”表,该表反映了各分类的聚类中心即均值的情况,可以看到,第1类的晨起血糖均值为7.99,第2类晨起血糖均值为5.39,第3类血糖均值为10.55。由此我们可以大致得知,第1类患者为血糖可控,第2类患者为血糖正常,第3类患者血糖情况严重。


5小结

    本文对K-means聚类分析的基本原理、适用范围及其在SPSS的具体操作应用进行了详细介绍。临床研究中,在大样本数据的训练下,可以得到稳定的类别划分,并需结合专业知识进行合理整合。我们将持续更新更多实用的采用SPSS软件、SAS软件、R软件以及Graghpad等软件的操作应用,敬请关注!
6联系我们

谦瑞数据www.databbs.net

为您提供一站式数据分析服务。

详询客服QQ(微信同号)370666643

关注谦瑞数据、杏花开医学统计微信公众号,赠送一大波数据分析实战视频教程哦!


7SPSS案例数据下载




本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册  

x

当他人从你分享的链接访问本页面时,你将获得奖励

举报 使用道具

回复
您需要登录后才可以回帖 登录 | 立即注册  

本版积分规则

悬赏提问(必答)

 
 
在线咨询
提供一站式
数据分析服务
客服QQ/微信号
370666643
微信扫一扫添加客服
快速回复 返回顶部 返回列表