爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 11926|回复: 0

[经验总结] 机器学习之聚类算法简介

[复制链接]

新浪微博达人勋

发表于 2022-10-6 00:13:41 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
聚类(cluster)算法,应用范围广,也是【数据挖掘】的重要组成部分。

交互图示例:

聚类算法不是一个算法,而是一个有50多年历史的算法家族。

其中,【K均值(K-Means)算法】是目前应用最广的,
它的算法形式是设置种子中心,然后计算数据点的距离,来迭代调整,直至收敛。
还有个跟它很类似的【K中心点(K-Medoids)算法】,也是同样的步骤。
这2个算法都要求手动设置分的簇的个数k,即算法名字中K的由来。
当然,需要人来设定K是一个缺憾。

传统的聚类算法是按“距离”来归类的,适用于“球形类型”的数据。
有的算法是基于“密度”(区域内对象的数量)来聚类的,
把密度够大的区域连在一起,这样就可以发现任意形状的类,还可以过滤噪声。
这个我很喜欢,它可以帮助我从二维图中提取几何形状,何其妙哉!
基于密度的算法有【DBSCAN算法】和【OPTICS算法】,
缺点:需要用户设置参数,对参数十分敏感。

还有【凝聚层次聚类】和【分裂层次聚类】,这2个算法的计算方向是相反的。

【sting算法】的形式是“嵌套网格化”,优点是速度快。

密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表