爱气象,爱气象家园! 

气象家园

 找回密码
 立即注册

QQ登录

只需一步,快速开始

新浪微博登陆

只需一步, 快速开始

搜索
查看: 108086|回复: 144

距平、距平百分率、标准化距平——“一波三折”之“平”

  [复制链接]

新浪微博达人勋

发表于 2013-6-12 13:32:36 | 显示全部楼层 |阅读模式

登录后查看更多精彩内容~

您需要 登录 才可以下载或查看,没有帐号?立即注册 新浪微博登陆

x
本帖最后由 hillside 于 2013-6-16 22:27 编辑

       近日看到气象家园有网友询问“标准化距平”的含义,我意识到这确实是一个字面上有些含糊的说法,是一个值得推敲的问题。它是“对距平的标准化(即先求距平)”还是“标准化后的距平(先求标准化序列,再算距平)”?遂对“距平”展开了一番搜索。
                                                                                   一   离差、标准差的含义     
       在统计学中,算术平均数可以简称为均数(或均值),单个样本值与均数之差称”离均差“(简称”离差“),也称偏差。《试验设计与统计》(方萍等,浙江大学出版社)第9页称:”离均差的总和为零,故不能用于反映变异程度。若将各离均差平方再求和,即离均差平方和,就可以克服上述弊端,但这样做尚有一个缺点,就是离均差平方和会随样本容量N的大小而改变。为便于比较,用N来除之,即可得到离均差平方的平均值 ,简称方差或均方。方差虽能反映变量的变异程度,但由于离均差取了平方,使它与原始数据的数值和单位都不适应,需要将方差开方还原,方差的平方根正值就是标准差。”
     

                                                                                 二  “距平”的含义与使用范围

       距平就是一组数据中的某一个数与平均数之间的差。 距平主要是一个大气科学术语,它就是一般数量统计学著作中通常所称的“离差”。比之离差、偏差。距平似乎更受大气研究者青睐。距平的英语单词是什么?除了Anomaly,departure也可以表示距平。      据台湾(中央)气象局相关网页(http://photino.cwb.gov.tw/rdcweb/lib/h/g_000870.htm)介绍:“在气候统计中, (距平 通常指一地区在特定期间之气象要素 (尤指温度、降水) 与同地区该项要素准平均(Normal)之离差(Departure) 或偏差(Deviation) 在气象学中亦可指某地之气象要素 (尤指温度) 数值与同一时期该所在纬度上之纬向平均值之离差。如欧洲之西北沿岸在冬季较同纬度其它地区为温暖, 即称为「温度正距平 (偏差) , 又如西伯利亚之东北部, 冬季较其它同纬度地区为冷, 即称为「温度负距平 (偏差) 」。
      从网上搜索来看,《气象学报》 1956年02期的《关于我国大范围正负月温距平出现情况的探讨》(杨鉴初)应是最早采用距平说法的文献之一。该文摘要称:“本次根据20年的我国逐月温度距平图,对出现大范围正负距平的月份加以统计分析,获得了一些前后出现情况之间的关联现象,可以在长期预报工作中提供参考。本文并对大范围正负月温距平出现的几种情况,与某些大型天气过程的韵律作用联系起来看,因此月温距平图在反映大气环流的性质方面有了新的意义。”

      百度百科在“距平”词项下的解释是:“距平值在气象上,主要是用来确定某个时段或时次的数据,相对于该数据的某个长期平均值(如30年平均值)是高还是低。而原始值通常是用来表征某个时段或时次真实水平。比如,一个地区某天的平均气温是14度,该地区该天平均气温的30年平均值是12度,那么该地区该天的平均气温距平就是2度。2度的距平表明今天的平均气温相对于该地区该天平均气温的30年平均值偏高2度。但是人体所能感觉的真实气温是14度。距平的特性:平均值为0,使用方便;直接作为气象预报值,比较直观(偏高/偏低)。”      
1 降水距平与降水相对变率


     地学词典网站(http://www.geology.com.cn/wiki/doc-view-25791.html)对于“降水距平(precipitation anomaly)”的解释是:“某地个别年(月)份的降水量与多年(该月)平均值之差称为降水距平。其值有正有负,将某地区的某些年份降水距平的绝对值相加,再除以记录年份数,就得出该地区平均降水距平值;再将平均降水距平值除以该地区多年平均降水量所得的百分率,称为该地降水相对变率或相对平均差。它是反映区域气候特征的重要指标之一 。”  
    疑问:平均降水距平一说是否有科学依据? 相应的降水相对变率或相对平均差我也不太了解。  

2 气温距平
       在历史上,气温距平(单位:℃)是有特定含义的,它是指某地气温与同纬度平均气温之差,而不是一般意义的平均值。  
      百度百科在“气温距平”项下的解释是:“平均气温距平就是一系列平均气温(日平均气温、月平均气温等)与总平均气温的差值。平均气温距平增高就是说明这个差值增大了,相应时间段内的温度出现了异常。”

      为什么不使用降水或气温值自身而采用距平,成都信息工程学院的肖天贵老师在课件《现代统计分析方法及软件应用》中介绍:“距平:原资料减去其平均值(气候平均值)所得差值,有时称异常(anomaly)。由于通常研究的是变量的变率Variability,而不注重它的平均情况,所以不失一般性,假设Ex是零向量,把距平作为分析对象,距平X,则Ex=0。”

3.累计距平
      百度百科称:累计距平即距平值的累加!现摘录魏凤英《现代气候统计诊断与预测技术》第43页的解释。 累计距平(魏凤英).JPG
                                                                                        三   距平百分率
  
       距平百分率( 如:percentage of precipitation anomalies )也是标准化的一种,互动百科对于“距平百分率”的一段介绍是:“举个例子,如果实测降水量为50mm,历史同期均值为100mm,那么它为负距平,距平为-50,如果另一处降水量为10mm,历史同期为50mm,这样它的距平是-40,但是当我们把这两个站点进行对比时,如果直接比较量的大小就不能体现变化的程度,所以距平百分率就是对距平进行了标准化处理,就如数学中的使用标准差的目的是一样的,只是把它用在气象学上了。


                                                                                      四  标准化距平

      1.“标准化距平”的语言学杂想
     (降水)标准化距平”倒底是“即先求(降水序列)距平,再进行标准化“还是”先求标准化(降水)序列,再算距平”,汉语词汇结构本身是难以自圆其说的。这涉及“标准化”是动词还是名词。不过,用反证法可以取得一定的鉴别效果。从形式上,“距平标准化”更容易理解为“距平的标准化 ”,没有明显的歧义。如果带歧义的”标准化距平“的真实含义能用”不带歧义的“距平的标准化”代替,那么,讲求严谨的科学语言应当弃歧义而用单义。
   科学著述、外交文件追求严谨、避免歧解。以国际语言来说,法语被称做世界上语法最严谨的语言,它的语法比德语严谨,很多国际法律或国际案例都是用法语写的。法语中每个单词只有一个意思,不会混淆,所以联合国所有的文件都是以法文为版本的,再根据法文翻译成其它文字。当不同语种翻译有分歧的时候大多采信法语版本。        
       标准化距平的英语表达应是Normalized Anomaly,它的字面结构与含义似乎是单一的、明确的,就是先求 Anomaly,再Normalized。
       从英语字面看,Normalized Anomaly很有意思,它其实是同一个词根,可直译为“不正常(值)的正常化”、“不标准(值)的标准化” 。      
    以上侧重从语言学角度探讨了标准化距平的真实含义。如果不是,那只能说该中文词组是不严谨的或有待改进的。
       由于此前我对“标准化距平”的具体算法不太了解,只从语言学视角进行了探索。然而,看了一些英文文献后,我的理解发生了一些变化。我们来看哥伦比亚大学《气候分析教程》网页(http://iridl.ldeo.columbia.edu/d ... rial/Climatologies/)的介绍:
                                                                                 Introduction                                                                                                 

    Climatology is commonly known as the study of our climate, yet the term encompasses many other important definitions. Climatology is also defined as the long-term average of a given variable, often over time periods of 20-30 years. Climatologies are frequently employed in the atmospheric sciences, and may be computed for a variety of time ranges. A monthly climatology, for example, will produce a mean value for each month and a daily climatology will produce a mean value for each day, over a specified time range. Anomalies, or the deviation from the mean, are created by subtracting climatological values from observed data.
     When seasonal variations are present within a set of data, it often helps to express the data in terms of standardized anomalies. Standardized anomalies, also referred to as normalized anomalies,are calculated by dividing anomalies by the climatological standard deviation. They generally provide more information about the magnitude of the anomalies because influences of dispersion have been removed. It is not necessary that a dataset have a particular distribution to express it in terms of standardized anomalies.


       综合英语文献中“标准化距平standardized anomalies”的含义,“标准化距平”的真实含义很可能是先求距平,再进行标准化。那么,上述的“反证法”假设的前提就存在问题了。因此,语言学的、合乎逻辑的解答是:“‘标准化距平’的翻译并不是理想的,“距平标准化”可能才是更合适的译法。”
     部分网友以为,“标准化距平”应当是先对原系列求标准化,获得标准化序列,此后在此基础上再计算距平。这种说法可能不太成立。



       2.标准化距平的科学定义
      有人可能认为标准化距平很简单,不需要这么多言辞。其实,这个问题并不如此简单。幸好,英雄所见略同。网上的一个气候学课件与我的想法不谋而合。现摘录部分内容如下:
      数据标准化处理是数据变换的方式之一,当数据之间无法直接进行比较时,例如不同季节之间的温度,数据变换是一种有益的方法。通常处理方法是距平标准化,也可以采用不受异常值影响的方式,如原数据减去中位数,再除以IQR进行标准化,但几乎没有人使用这种处理方法。




1.JPG
•

2.JPG


3.JPG

   

                                                                       五   “平” 之“一波三折“

      在气候学当中,“平”并非数学上那么平常,”平“字在气候学发展过程中其实出现过、现在仍存在三种不同层面的含义:
1.同纬度的长期平均值,并不是某点自身的多年平均值;
2.某个特定长时段的固定值,并不是某点或某区域多年平均值;
3.某点或某研究区域自身的完全的、真实的平均值。

    什么是距“平”之平,参考系是什么?附件之短文《变年循环参考系下的中国气候变率研究_距平_概念的新认识》作了简短的描述。

注:本人认为,本帖的亮点之一在于点出“距平”之”平的““一波三折”,因时间关系,不太展开。距平之”平“并不像”期望”那样严格与允平,它有三种不同的内涵。欢迎的兴趣的网友接着分析。

附1:气象家园相关帖

标准化距平

距平变化的解释

有关距平的问题
关于累积距平的作图

excel版累计距平

求解EOF所需的距平场和标准化场

调试该源代码求累计距平,有一个错误未能找出来
[脚本编辑] 我画的海温距平图为什么是错的?
EOF分解及标准化
[源代码] 相关和极差标准化的两个“微”程序

[求助] 这个eof程序为什么出不了结果??(此帖中有标准化计算的程序描述,正确与否不详)

[经验总结] 详解用origin做数据的标准化方法


附2:一篇对现有气候距平理论提出批评的博士论文《一个建立气候距平参照系的新方法及其检验和应用》(导师:符淙斌院士),现摘录如下:

       本论文利用中国区域地表气温观测资料的实例,阐述了传统距平存在的两大主要问题:①物理上不唯一、②仍然包含年循环,并提出了解决这些问题的一个途径,即以自适应获得的年循环作为气候距平的参照系,并通过实例比较阐明了它的优越性,进而提出了新的距平参照系建立的必要性,此外还用观测资料探讨了气候态的稳定性。
   具体工作和主要结论如下:
   (1)用已知信号的理想实验、以及与其他方法的实例比较,验证了本论文使用的核心方法一集合经验模分解(EEMD)方法在提取年循环分量以及年际年代际尺度分量上的鲁棒性(robustness)以及相比其他方法的优越性;
   (2)用中国区域地表气温观测资料的实例阐述了传统距平存在的两大主要问题:①物理上不唯一、②仍然包含年循环;用EEMD方法自适应地从逐日气温资料中提取其年循环(频一幅调制的年循环,MAC),将MAC参照系与传统距平参照系、MAC参照系下的距平与传统距平进行了比较,分析了它的振幅和春季位相在过去50多年的变化及其可能的原因,进而阐明新的距平参照系的优越性和必要性。
   结果显示:①MAC分量占了原序列的绝大部分方差贡献(基本在90%左右);它是频一幅调制的,它在过去50多年的交化非常大,甚至超过了年际变率的量级。②传统的距平参照系会因为新资料的加入而改变,因而物理上不唯一,与实际不符;不仅如此,传统距平仍然包含年循环,没有达到“距平”的目的。而MAC参照系是固定的参照系,相同的研究时段不因新资料的加入而发生改变,它在物理上的唯一性与实际相符;以MAC作为参照系的气候距平基本克服了传统距平的以上两大问题。此外,传统距平不仅包含有年周期,和所谓的“去掉年周期(距平)”矛盾,而且它还包含了尺度小于年周期的波动,不适合直接用来研究“年际年代际变率”;同样,13个月滑动平均也去不掉年循环,其效果甚至还不如传统距平;相比之下,MAC参照系下的低频分量更适合用来描述“年际年代际变率”。③温室效应并不能解释1961~2002年间中国气温MAC的振幅变化趋势(从减幅趋势转为1980年代末期后的增幅趋势),而同期中国地区到达地面的太阳总辐射的总体减少趋势(变暗趋势)以及1980s未期后的回升趋势(变亮趋势)可能才是主要原因。④自适应且唯一地定义了新的气候春分日,得到北京站1952-2006年间气候春分日总的线性趋势为提前2.6天/年代,其中因MAC分量本身的变化而变的部分为提前1天/年代,因年代际的增暖趋势分量而变的部分为1.6天/年代,而年际分量对总的提前趋势有微弱的贡献。此外,因MAC分量本身变化而变的部分存在很大的年际变率,在研究时段内相差可多达19天,这部分变率可能的预报因子是2月份西伯利亚地区的海平面气压强度。⑤中国北方地区绝大部分站点在1953-2002年间出现了春季提前的趋势,然而因MAC而变的部分则存在明显的东、西部差异。

      
附3:一篇提出"距平变量"或"变量距平"概念与其优越性的小论文《距平变量在降水趋势预报中的运用_盛家荣》(见于附件)

附4:                                                                                闲暇游戏——找差别      
      附图二幅是中国长期降水信息研究与发布的两大权威性巨头(国家气候中心、水利部水文局)各自制作的降水量距平图。今天(2013.6.12)只能下载到两幅日期相近的图。








2013年6月11日全国降水距平指数图(水文部水文局).JPG
2013年5.30-6.9日全国降水量距平百分率分布图(国家气候中心).JPG
4.JPG

变年循环参考系下的中国气候变率研究_距平_概念的新认识_钱诚.caj

59.37 KB, 下载次数: 44, 下载积分: 金钱 -5

气候统计-第二章1.ppt

4.46 MB, 下载次数: 104, 下载积分: 金钱 -5

传统距平与变年循环参照系下的中国气温变率比较_赵天保.caj

1.52 MB, 下载次数: 38, 下载积分: 金钱 -5

距平变量在降水趋势预报中的运用_盛家荣.caj

59.35 KB, 下载次数: 23, 下载积分: 金钱 -5

评分

参与人数 8金钱 +73 贡献 +14 收起 理由
宇恒李 + 5 很给力!
帽帽 + 1 很给力!
yuqianhao0315 + 2
米兰-老虎 + 1 很给力!
xueyanhou + 8 + 1 很给力!
言深深 + 22 + 6
mofangbao + 20 + 6
斥鷃 + 14 + 1 东西挺丰富的~

查看全部评分

密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-6-13 10:46:56 | 显示全部楼层
解释应回归到计算过程。
密码修改失败请联系微信:mofangbao
回复 支持 1 反对 0

使用道具 举报

新浪微博达人勋

发表于 2013-6-12 17:40:39 | 显示全部楼层
谢谢分享了,学习一下。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-6-12 18:20:11 | 显示全部楼层
标准化距平如果是先求标准化的话,怎么还能距平呢?标准化序列的平均值不是0么?
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2013-6-12 20:41:32 | 显示全部楼层

具体情形我也不太清楚。从数学上来看,二者都是可以运算的。二者的数学关系我没有分析。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-6-12 21:05:34 | 显示全部楼层
看的好累啊
拜托不要把问题复杂化
总结楼主意思:
“标准化距平”的真实含义很可能是先求距平,再进行标准化
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2013-6-12 21:09:24 | 显示全部楼层
刷牙 发表于 2013-6-12 21:05
看的好累啊
拜托不要把问题复杂化
总结楼主意思:

各取所需吧。觉得化简为繁的,大可一笑而过。
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-6-12 21:12:03 | 显示全部楼层
十分详细,十分好!
密码修改失败请联系微信:mofangbao

新浪微博达人勋

发表于 2013-6-12 21:21:48 | 显示全部楼层
hillside 发表于 2013-6-12 21:09
各取所需吧。觉得化简为繁的,大可一笑而过。

我伤害了你,还一笑而过
真不是啊
还是很谢谢楼主的分享
密码修改失败请联系微信:mofangbao

新浪微博达人勋

 楼主| 发表于 2013-6-12 21:31:10 | 显示全部楼层
本帖最后由 hillside 于 2013-6-12 22:59 编辑
刷牙 发表于 2013-6-12 21:21
我伤害了你,还一笑而过
真不是啊
还是很谢谢楼主的分享

没有伤害哟
不太谦虚地说,这是一份力作。不过,放在这儿不是很合适。因为这个话题有些枯燥,很多人觉得咬文嚼字、思考哲学性问题太累。

点评

距平百分率就是对距平进行了标准化处理?“标准化距平”的真实含义很可能是先求距平,再进行标准化? 那么问题来了?距平百分率=标准化距平?  发表于 2023-3-10 19:22
密码修改失败请联系微信:mofangbao
您需要登录后才可以回帖 登录 | 立即注册 新浪微博登陆

本版积分规则

Copyright ©2011-2014 bbs.06climate.com All Rights Reserved.  Powered by Discuz! (京ICP-10201084)

本站信息均由会员发表,不代表气象家园立场,禁止在本站发表与国家法律相抵触言论

快速回复 返回顶部 返回列表