日志

相关系数 r 的误差估计-Bootstrap

已有 776 次阅读2018-2-8 12:23 |个人分类:matlab

Bootstrap的好处是不需要太多假设。（不假设正态分布）
论文请看 http://www.jstor.org/stable/2685844
Efron, B., & Gong, G. (1983). A leisurely look at the bootstrap, the jackknife, and cross-validation. The American Statistician, 37(1), 36-48.

Matlab代码：
load lawdata
rng default % For reproducibility
bootci(1000,@corr,lsat,gpa)

但要注意数据不能有太强的自相关。有的话就得另外找办法：
http://danida.vnu.edu.vn/cpis/files/Books/Statistical%20methods%20in%20the%20atmospheric%20sciences,%20D.%20Wilks%20(2ed.,%20IGS%2091,%20Elsevier,%202006)(ISBN%200127519661)(649s).pdf
Wilks的书的p.169最后一段开始讨论了几个可能方法：
1. 拟合自相关过程，变换成不相关的序列，Bootstrap不相关的序列，变换回带相关序列
2. Nearest-neighbor bootstrapping: resample的抽签依赖于前一个抽到的数字。
3. Moving-block bootstrap: 利用 n' = n*(1-rho1)/(1+rho1) 计算等效自由度，利用公式5.28求L（moving block的大小）。

4. 假设正态的方法：
http://bbs.06climate.com/forum.php?mod=attachment&aid=NzE3Nzd8ZWU4YmI0ODUxZjI1YTkyYmFlMTZjMTdjYzc2NWRjMTV8MTUxODA2MjcyMg%3D%3D&request=yes&_f=.pdf
Bretherton et al. (1999): p.14/20。当两个序列X和Y有了自相关以后，新的有效采样数（effective sample size, ESS)从原来的T降到 T*，如公式30（或者31，如果是Markov过程，一阶自相关的T次方远小于1）
并同时参考前面Efron and Gong 1983的Sect 5.
phi = arctanh rho = 0.5*ln[(1+rho)/(1-rho)]
phihat ~ Normal( phi+rho/(2(n-1)), 1/(n-3) )
Invert以上正态分布。

收藏分享邀请举报

packard的个人空间 http://bbs.06climate.com/?87401 [收藏] [复制] [分享] [RSS]

日志

相关系数 r 的误差估计-Bootstrap

全部作者的其他最新日志

评论 (0 个评论)

packard