爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 10970|回复: 16

[经验总结] 关于M-K趋势检验中“结”的概念的认识和疑惑

[复制链接]

新浪微博达人勋

发表于 2014-1-9 14:24:55 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
      最近在做毕业论文,很感谢herenso的《Mann-kendall趋势检验的方法介绍(附计算程序)》这个帖子,对这个方法了解了许多。但对这个方法中关于“结”的概念在查阅一些文献后有一些不同的看法,我的看法是这样的,望大家批评指正:        这是herenso的原贴(因为原贴公式中没有给出ei的定义,也可能是我理解错了):在第3点中提到:“计算过程中提到的“结”(tie)的概念,我原来也不懂,查阅文献后目前是这么理解的:“结”就是时间序列中的相同数据,“结”的宽度(the extent of any tie)是指序列中等于这个数的样本数量。例如对于一个序列/1,2,2,3,3,3/,有e1=1,e2=2,e3=3 。”关于“结”的概念和“结”的宽度的理解我也觉得是这样的,但在举例/1,2,2,3,3,3/中,应该是e1=1(结宽为1的是1),e2=1(结宽为2的是2,但它是一组结),e3=1(结宽为3的是3,它也是一组结),也就是说数字1算一个结,它的结宽是1。数字2算一个结,它的结宽是2。数字3算一个结,它的结宽是3 。我是根据这篇(1) Long-term trends of annual temperature and precipitation time series in Japan. 中的说法来理解的:
87.png
in which Σ denotes the summation over all ties and ei is the number of ties of extent i. For example, in the data set 5, 5, 6, 7, 8, 8, 8, 10, 10, 11, 12, 12, the ei values are as follows: e1=3 [three untied values (6, 7, 11)], e2=3 [three ties of extent two (5, 10, 12)], e3=1 [one tie of extent three (8)], and for all larger values of i, ei=0。
      但在herenso提到的第4点“对于气象人关心的很多变量,如年平均降水量,属于实型变量,出现某两年降水量相等的情况极少(就算数值上相等,也与数据精度有关),从而出现结宽e>1的情况也少,而e=1时e(e-1)(2e+5)=0。因此个人认为可以不考虑结的问题,采用简化后的方程。文末所附程序也没有考虑结。当然我不知道自己对于结的理解是否正确,如有谬误还请大家指教。”。我认为这样理解是对的,比如在10年的降水量中如果没有两年的降水量相等的话,那么这会是这样一组数据(随便编的):600,650,721,611mm。。。。那么这组数据中就没有结,也就是e1=10,但代入到公式t*(t-1)*(2t+5)中(第二篇文献)就是10*(1*(1-1)*(2*1+5))=0(这也是我关于第一篇文献中关于公式ei*(ei-1)*(2ei+5)的疑问,如果按照这个公式的话,根据第一篇文献的理解,e1就是10,那么结果就不是0了
      之后我又找了些文献(我是学水文的,这些文献都是水文领域里顶级期刊的文献)。(2)Techniques of trend analysis for monthly water quality data。这篇文献是1982年的文章,好像是最早采用M-K趋势检验的文章:

这篇文章中也有提到结的概念。在(3)Handbook of Hydrology中也有提到结的概念:

在(4)Trends in foods and low fows in the United States: impact of spatial correlation这篇文章中对结的概念是:

      在第一篇文献中in which Σ denotes the summation over all ties and ei is the number of ties of extent i. For example, in the data set 5, 5, 6, 7, 8, 8, 8, 10, 10, 11, 12, 12, the ei values are as follows: e1=3 [three untied values (6, 7, 11)], e2=3 [three ties of extent two (5, 10, 12)], e3=1 [one tie of extent three (8)], and for all larger values of i, ei=0。关于结的理解很清晰了。但我的疑问是关于在第一篇文献中提到 ei is the number of ties of extent i的。
      在提到结的文献中,关于方差S的算法的公式描述大概有这几种:(1)第二篇文献中以t的方式出现,t是任何一个结的数据的宽度(2)在herenso的《Mann-kendall趋势检验的方法介绍(附计算程序)》这个帖子中,第一篇文献,第三篇文献以ei的形式出现。(4)第4篇文献中有ti和i。
      问题就是第一篇文献中对ei的描述是正确的吗还是我的理解有误。举个例子,以第二篇文献的数据为例:four ties of two,one tie of three.那这可以是这样的一组数:1,1,2,2,3,3,4,4,5,5,5。按照第2篇文献的计算就是4*18+1*66=138。按照第三篇文献的算法是:这里有5个结组,n=5。第一组:1,1第二组2,2,第三组3,3,第四组4,4,第5组5,5,5。第一组e1=2,第二组e2=2,第三组e3=2,第四组e4=2,第5组e5=3,代入公式计算得138.按照第一篇文献的算法的话,i指的是结的宽度(相同的数有几个),ei是宽度为i的结的个数,那么e1=0,e2=4,e3=1,代入公式的话就是156.按照第4篇的文献的算法的得出的结果也是138.
      啰嗦了这么多,我纠结的就是关于“结”的概念的解释第一篇文献给出的是对的话,那么根据它关于ei的解释却与其他三篇文献解释的不一样,第一篇文献和第三篇文献的公式是一样的,但他们对ei的解释却不一样(要不然就是我对英文理解错了),但第4篇文献却在公式中给出了“ti is the number of ties of extent i”(也就是ei)和i,公式是ti*(i)*(i-1)*(2i+5)。因此,我认为第一篇文献中关于ei的解释应该是错的。
      另外在中文文献中大部分或是没提结的概念或是忽略了结的计算,因为我还没开始对数据进行处理,所以也不知结这个部分在计算中是否重要。

评分

参与人数 1金钱 +12 贡献 +5 收起 理由
mofangbao + 12 + 5 谢谢分享与讨论

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2014-1-9 14:28:28 | 显示全部楼层
额,第2,3,4篇的文献的图不见了,这是第2篇文献的图:

第二篇文献

第二篇文献
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2014-1-9 14:29:44 | 显示全部楼层
第三篇文献:

第三篇文献

第三篇文献
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2014-1-9 14:30:27 | 显示全部楼层
第4篇文献:

第4篇文献

第4篇文献
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2014-1-9 15:50:14 | 显示全部楼层
感谢分享
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2014-1-9 16:49:27 | 显示全部楼层
ncl dim_numrun_n跟你的 结 有点儿像
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 成长值: 0
发表于 2014-1-9 17:31:35 | 显示全部楼层
“结”是否是结点的意思,这个在复杂网络里面有很多这样的概念。
不过我们通常做MK的时候,魏凤英老师的程序也好、吴洪宝的也好,你图片给的那一项,只保留了前面的,后面的求和项,也就是涉及到ei项,是被省略了的。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2014-1-9 17:31:49 | 显示全部楼层
例如对于一个序列/1,2,2,3,3,3/,我理解的结只有两个,即2和3,第一个结2的宽度是2,第二个结的宽度是3,其中的1不能算结,因为没有重复数据。
“第一篇文献中in which Σ denotes the summation over all ties and ei is the number of ties of extent i. For example, in the data set 5, 5, 6, 7, 8, 8, 8, 10, 10, 11, 12, 12, the ei values are as follows: e1=3 [three untied values (6, 7, 11)], e2=3 [three ties of extent two (5, 10, 12)], e3=1 [one tie of extent three (8)], and for all larger values of i, ei=0。”中结的解释有矛盾:e1=3 [three untied values (6, 7, 11)],作者将其解释为3个untied values,与tied 不是矛盾吗?
我也是在学习M-K检验,希望高手解答一下,谢谢!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2014-1-9 17:43:28 | 显示全部楼层
R统计中有M-K趋势检验,而且是考虑了结的。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2014-1-9 19:38:39 | 显示全部楼层

第一篇文献中把单个的值称作没有结的值,它的“结宽为”1,代入公式中后t*(t-1)*(2t-5)这一项就为0了。根据言深深版主的回答,这应该是把ei项忽略的原因,因为需要检测的时间序列中很少有相同的值。
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表