爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
查看: 7523|回复: 6

[求助] Python Kmeans聚类分析疑问

[复制链接]
发表于 2022-8-5 17:10:22 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册

x


本人基于python的kmeans聚类,指定random_state为固定数字后,将循环次数也设置的比较大(如100、1000),相同的数据,每次聚类的结果(即每一类的数目和内容)都会不同,不知道问题出在哪里?怎样提高聚类结果的稳定度?

如果每次聚类都不一样的话,这个结果还有什么意义呢?

希望得到大家的解答 谢谢了!
密码修改失败请联系微信:mofangbao
发表于 2022-8-5 19:40:00 | 显示全部楼层
kmeans本来每次结果就是不一样的
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-8-5 20:50:52 | 显示全部楼层
wjy_ecnu 发表于 2022-8-5 19:40
kmeans本来每次结果就是不一样的

标签的顺序会变  这个我知道;但是具体每一类包含的样本数也在一直变,这样分类结果不稳定呀?不知道怎么解释
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

发表于 2022-8-6 07:43:16 | 显示全部楼层
因为聚类的时候先随机挑出几个样本,后面的结果和第一次挑出的样本有关。参考一下K聚类算法
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

发表于 2022-8-6 08:38:51 | 显示全部楼层
紫藤萝 发表于 2022-8-5 20:50
标签的顺序会变  这个我知道;但是具体每一类包含的样本数也在一直变,这样分类结果不稳定呀?不知道怎么 ...

如果想要稳定的结果  就要确定N个中心点和  聚类的时候的顺序   先确定N个中心点的位置  再按照一定的顺序去判断每个点落在哪个类里    但是我觉得没要必要
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-8-6 22:28:22 | 显示全部楼层
wjy_ecnu 发表于 2022-8-6 08:38
如果想要稳定的结果  就要确定N个中心点和  聚类的时候的顺序   先确定N个中心点的位置  再按照一定的顺 ...

哦哦 理解了。但是在kmeans,我设置了相同 的random_state,就代表初始聚类中心是相同的,但是这个聚类顺序 不知道是不是也是一样。如果每次结果都变的话,说明这个结果具有不可重复性,还怎么解释问题呢
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

 楼主| 发表于 2022-8-6 22:30:26 | 显示全部楼层
紫藤萝 发表于 2022-8-5 20:50
标签的顺序会变  这个我知道;但是具体每一类包含的样本数也在一直变,这样分类结果不稳定呀?不知道怎么 ...

是的 和初始聚类中心有关系,不过我已经设置为一样的了,为什么结果还在变
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表