爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 8794|回复: 1

[参考资料] matlab求三种相关系数

[复制链接]

新浪微博达人勋

发表于 2020-4-4 16:00:02 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x

在多元分析中我们经常要用到相关系数。常用的相关系数有三种:Pearson相关系数,Kendall相关系数和Spearman相关系数。

一、Pearson相关系数

Pearson相关系数是英国统计学家皮尔逊于20世纪提出的一种计算直线相关的方法。

按照大学的线性数学水平来理解, 它比较复杂一点,可以看做是两组数据的向量夹角的余弦.


Pearson相关系数用来衡量两个数据集合是否在一条线上面。其计算公式为:


                               
登录/注册后可看大图

一个具体的计算的例子:

X Y1 22 53 6


                               
登录/注册后可看大图


而利用matlab计算:函数 corrcoef


皮尔逊相关的约束条件

  • 1 两个变量间有线性关系
  • 2 变量是连续变量
  • 3 变量均符合正态分布,且二元分布也符合正态分布
  • 4 两变量独立

皮尔逊相关系数适用于:

(1)两个变量之间是线性关系,都是连续数据。

(2)两个变量的总体是正态分布,或接近正态的单峰分布。

(3)两个变量的观测值是成对的,每对观测值之间相互独立。


二、Kendall相关系数

Kendall相关系数是以Maurice Kendall命名的,并经常用希腊字母τ(tau)表示其值。Kendall相关系数用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况,Kendall相关系数的取值范围在-1到1之间,当τ为1时,表示两个随机变量拥有一致的等级相关性;当τ为-1时,表示两个随机变量拥有完全相反的等级相关性;当τ为0时,表示两个随机变量是相互独立的。

三、Spearman相关系数

Spearman等级相关系数又称秩相关系,它以Charles Spearman命名,并经常用希腊字母ρ(rho)表示其值。它是利用两变量的秩次大小作线性相关分析,Spearman等级相关系数用来估计两个变量X、Y之间的相关性,其中变量间的相关性可以使用单调函数来描述。如果两个变量取值的两个集合中均不存在相同的两个元素,那么,当其中一个变量可以表示为另一个变量的很好的单调函数时(即两个变量的变化趋势相同),两个变量之间的ρ可以达到+1或-1。

四、Matlab程序

1.X与Y是两个变量取值所构成的向量

Pearson相关系数:corr(X,Y,'type','Pearson')

Kendall相关系数:corr(X,Y,'type','Kendall')

Spearman相关系数:corr(X,Y,'type','Spearman')

2.X是一个数据矩阵,列为个变量取值

Pearson相关系数:corr(X,'type','Pearson')

Kendall相关系数:corr(X,'type','Kendall')

Spearman相关系数:corr(X,'type','Spearman')


1.corrcoef

corrcoef(X):返回从矩阵X形成的一个相关系数矩阵,若X是一个m*n的矩阵,那么得到的相关系数矩阵A就是一个n*n的对称矩阵,A中的第i行第j列的元素表示的就是X第i列和第j列的相关系数。

corrcoef(X,Y):它的作用和corrcoef([X,Y])是一样的,表示序列x和序列y的相关系数,得到的结果是一个2*2矩阵,其中对角线上的元素分别表示x和y的自相关,非对角线上的元素分别表示x与y的相关系数和y与x的相关系数,两个是相等的。

corrcoef函数算出来的是皮尔逊相关系数。

corrcoef函数计算相关系数是在matlab提供的cov函数基础上进行计算的,形成的矩阵是


                               
登录/注册后可看大图

  2.corr

corr(X)输出的结果和corrcoef是一致的,但是corr可以自己选择相关系数的类型。matlab提供三种,默认的是皮尔逊相关系数,剩下的两种是kendall和spearman.


相关程度与相关函数的之间的联系
在概率论和统计学中,相关(Correlation,或称相关系数或关联系数),显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。最常用的是皮尔逊积矩相关系数。其定义是两个变量协方差除以两个变量的标准差(方差的平方根)。

    相关系数只是一个比率,不是等单位量度,无什么单位名称,也不是相关的百分数,一般取小数点后两位来表示。相关系数的正负号只表示相关的方向,绝对值表示相关的程度。因为不是等单位的度量,因而不能说相关系数0.7是0.35两倍,只能说相关系数为0.7的二列变量相关程度比相关系数为0.35的二列变量相关程度更为密切和更高。也不能说相关系数从0.70到0.80与相关系数从0.30到0.40增加的程度一样大。

对于相关系数的大小所表示的意义目前在统计学界尚不一致,但通常按下是这样认为的:
相关系数      相关程度
0.00-±0.30    微相关
±0.30-±0.50  实相关
±0.50-±0.80  显著相关
±0.80-±1.00  高度相关








评分

参与人数 1金钱 +20 收起 理由
wjy_ecnu + 20

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2020-6-12 09:45:07 | 显示全部楼层
学习一下,mark
密码修改失败请联系微信:mofangbao
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表