Bootstrap的好处是不需要太多假设。(不假设正态分布)
论文请看
http://www.jstor.org/stable/2685844Efron, B., & Gong, G. (1983). A leisurely look at the bootstrap, the jackknife, and cross-validation.
The American Statistician,
37(1), 36-48.
Matlab代码:
load
lawdata
rng
default % For reproducibility
bootci(1000,@corr,lsat,gpa)
但要注意数据不能有太强的自相关。有的话就得另外找办法:
http://danida.vnu.edu.vn/cpis/files/Books/Statistical%20methods%20in%20the%20atmospheric%20sciences,%20D.%20Wilks%20(2ed.,%20IGS%2091,%20Elsevier,%202006)(ISBN%200127519661)(649s).pdfWilks的书的p.169最后一段开始讨论了几个可能方法:
1. 拟合自相关过程,变换成不相关的序列,Bootstrap不相关的序列,变换回带相关序列
2. Nearest-neighbor bootstrapping: resample的抽签依赖于前一个抽到的数字。
3. Moving-block bootstrap: 利用 n' = n*(1-rho1)/(1+rho1) 计算等效自由度,利用公式5.28求L(moving block的大小)。
4. 假设正态的方法:
http://bbs.06climate.com/forum.php?mod=attachment&aid=NzE3Nzd8ZWU4YmI0ODUxZjI1YTkyYmFlMTZjMTdjYzc2NWRjMTV8MTUxODA2MjcyMg%3D%3D&request=yes&_f=.pdfBretherton et al. (1999): p.14/20。当两个序列X和Y有了自相关以后,新的有效采样数(effective sample size, ESS)从原来的T降到 T*,如公式30(或者31,如果是Markov过程,一阶自相关的T次方远小于1)
并同时参考前面Efron and Gong 1983的Sect 5.
phi = arctanh rho = 0.5*ln[(1+rho)/(1-rho)]
phihat ~ Normal( phi+rho/(2(n-1)), 1/(n-3) )
Invert以上正态分布。