爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 11150|回复: 14

气温的概率分布是正态(单峰)分布还是双峰分布?

[复制链接]

新浪微博达人勋

发表于 2015-2-8 17:47:52 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
本帖最后由 张学文 于 2015-2-8 20:34 编辑

气温的概率分布是正态(单峰)分布还是双峰分布?
张学文,2015/2/8
气象统计的传统教育在告诉我们,任何一个地点的气温,其出现不同值的概率一般符合著名的正态分布(高斯分布)。记得我在过去分析新疆的一些气象站的温度分布,这个结论大体上差不多。气温几乎成为气象学中理解正态分布的优秀实例。如果你发现某地的气温不符合正态分布,并且写成文章,估计编审人员会认为是反面结果而不能发表但是,
但是后来我逐步明白,所谓各地的气温符合单峰的正态分布,其实是指当地的一些温度的平均值而言的,如年平均温度,月平均温度等等。如果你运用更多的样本(这应当更有权威性),而不去取平均值。任何一个地方的温度随机样本的统计特征则它与正态分布就相差甚远,并且出现了双峰。下面的乌鲁木齐温度样本统计就是例子。
乌鲁木齐不同温度的出现概率
10年,每天24个数据,合计87648个样本)
这个双峰分布说明冬、夏的温度比较多而春秋的温度比较少
173055vejhrwr8ff6de6ua.gif





为什么这个大样本的统计竟然与正态分布差这么多?难道是我们统计错了?
细一分析就明白,过去所谓的正态分布仅是对应对于确定的时间阶段而言的。例如你仅仅分析3月(或者任意特定的月份)。它应当是正态分布。如果你在把四季的不同温度,早晚的不同温度都拿来做统计分析,那么它可能就是我们给的乌鲁木齐这个例子的情况了。
所以我们不能说上面乌鲁木齐的这个温度分布图错误,我们仅能说过去没有人注意这种统计分析,而简单地相信了书本上的结论(其实是有条件的)。
为什么温度分布就是这样?
其实问题很简单:地球上任何地点的温度存在明显的日变化和年变化。即我们不能在认可温度存在随机变化(承认它是随机变量),进行统计分析时,而忽略它的日变化、年变化问题。
理论分析指出一个随机变量均匀地在+1-1之间取值(这等价与时间均匀的前进),那么此变量的概率分布就是一个均匀分布。但是此取值的正弦值则是一个M型的概率分布(见下面的博客文章)。注意,我们观测的乌鲁木齐温度概率分布就十分类似M型的双峰分布。
所以任何地点的大量的温度数据的概率分布与其说一般是符合正态分布,不如说它符合双峰M型分布,而仅有特定季节内的温度,或者平均温度,才符合教科书上说的正态分布。
---------
这是李小文老师要的双峰概率分布吗?
张学文,2013/7/2
方才看到这个问题,我没有弄清楚原意。
但是我过去注意到对一个sin函数均匀随机采样,其取值为不同概率的分布就是双峰概率分布。不过它的自变量在-1,1之间。,也许与李老师要的比较合适?是否需要改造一下,这里我没有加入参数,其实在sin前面加了系数就是参数了。
本人关于双峰的问题好像在气象要素分布的博客中给出过例子,现在记不清了。
下面是我在2011年7月做的图

173123e81e2xxxjwwx5u58.gif


本文引用地址:http://blog.sciencenet.cn/blog-2024-704658.html此文来自科学网张学文博客

http://blog.sciencenet.cn/blog-2024-866605.html此文来自科学网张学文博客
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 成长值: 0
发表于 2015-2-8 20:07:05 | 显示全部楼层
本帖最后由 言深深 于 2015-2-8 20:08 编辑

这种结果是可以理解的。
但是我想,我们所说的正态分布,可能更多的是为了将同一个时次上面的资料进行研究,这样绘制出来的时间序列才具有相互之间的可研究性。比如都取每天x时刻的温度资料,绘制概率分布图。
但是如果,随机采样,比如分别取,1,3,4,6,8,13,15,16,17,18,23这些时刻,等等的数据放在一起研究比较,那么必然涉及到数据采样不均匀。很可能出现您绘制的双峰结构。
我也统计多很多的温度资料(当然,是已经公布的,日平均,或者月平均资料,或者海温资料),也基本上是正态分布的。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-8 20:17:14 | 显示全部楼层
MARK,此贴会火
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-2-8 20:32:21 | 显示全部楼层
想一想,如果每1秒钟读一个温度数,取一天的资料,就是86400个样本,在晴天,其温度分布也是M型分布!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-8 22:12:36 | 显示全部楼层
统计上的确有很多的内容值得深入思考!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-9 00:35:19 | 显示全部楼层
这是重大发现
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-9 08:38:38 | 显示全部楼层
图上的两个峰值,我感觉有点像10年的平均最低和最高气温。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-9 11:06:52 | 显示全部楼层
豁然开朗,最近也在做统计检验,于是对样本温度进行了正态检验,结果不是正态分布,我取的是日资料,总共一年的气温资料,虽然不是双峰分布但也不是正态分布,spass统计检验没过
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2015-2-9 13:23:19 | 显示全部楼层
nunu18 发表于 2015-2-9 11:06
豁然开朗,最近也在做统计检验,于是对样本温度进行了正态检验,结果不是正态分布,我取的是日资料,总共一 ...

我们被温度基本是正态分布的思维定式蒙蔽得太深了。
不同含义的温度样本其概率分布是不同的。纯随机取样的原始样本,则基本是双峰分布。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2015-2-9 18:48:47 | 显示全部楼层

不一样的才值得发表吧。
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表