登录后查看更多精彩内容~
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
本帖最后由 张学文 于 2015-2-8 20:34 编辑
气温的概率分布是正态(单峰)分布还是双峰分布? 张学文,2015/2/8 气象统计的传统教育在告诉我们,任何一个地点的气温,其出现不同值的概率一般符合著名的正态分布(高斯分布)。记得我在过去分析新疆的一些气象站的温度分布,这个结论大体上差不多。气温几乎成为气象学中理解正态分布的优秀实例。如果你发现某地的气温不符合正态分布,并且写成文章,估计编审人员会认为是反面结果而不能发表…但是, 但是后来我逐步明白,所谓各地的气温符合单峰的正态分布,其实是指当地的一些温度的平均值而言的,如年平均温度,月平均温度等等。如果你运用更多的样本(这应当更有权威性),而不去取平均值。任何一个地方的温度随机样本的统计特征则它与正态分布就相差甚远,并且出现了双峰。下面的乌鲁木齐温度样本统计就是例子。 乌鲁木齐不同温度的出现概率 (10年,每天24个数据,合计87648个样本) 这个双峰分布说明冬、夏的温度比较多而春秋的温度比较少
为什么这个大样本的统计竟然与正态分布差这么多?难道是我们统计错了? 细一分析就明白,过去所谓的正态分布仅是对应对于确定的时间阶段而言的。例如你仅仅分析3月(或者任意特定的月份)。它应当是正态分布。如果你在把四季的不同温度,早晚的不同温度都拿来做统计分析,那么它可能就是我们给的乌鲁木齐这个例子的情况了。 所以我们不能说上面乌鲁木齐的这个温度分布图错误,我们仅能说过去没有人注意这种统计分析,而简单地相信了书本上的结论(其实是有条件的)。 为什么温度分布就是这样? 其实问题很简单:地球上任何地点的温度存在明显的日变化和年变化。即我们不能在认可温度存在随机变化(承认它是随机变量),进行统计分析时,而忽略它的日变化、年变化问题。 理论分析指出一个随机变量均匀地在+1到-1之间取值(这等价与时间均匀的前进),那么此变量的概率分布就是一个均匀分布。但是此取值的正弦值则是一个M型的概率分布(见下面的博客文章)。注意,我们观测的乌鲁木齐温度概率分布就十分类似M型的双峰分布。 所以任何地点的大量的温度数据的概率分布与其说一般是符合正态分布,不如说它符合双峰M型分布,而仅有特定季节内的温度,或者平均温度,才符合教科书上说的正态分布。 --------- 这是李小文老师要的双峰概率分布吗? 张学文,2013/7/2 方才看到这个问题,我没有弄清楚原意。 但是我过去注意到对一个sin函数均匀随机采样,其取值为不同概率的分布就是双峰概率分布。不过它的自变量在-1,1之间。,也许与李老师要的比较合适?是否需要改造一下,这里我没有加入参数,其实在sin前面加了系数就是参数了。 本人关于双峰的问题好像在气象要素分布的博客中给出过例子,现在记不清了。 下面是我在2011年7月做的图
|