对平均数的理解

发布时间:2019-01-13 19:14:02   来源:文档文库   
字号:

漫谈对平均数的理解

平均数是集中量数的代表也是最常用的一种描述统计指标它反映了数据的代表性.也即可以通过平均数对数据的集中性或代表性有一个直观的了解其次平均数也是常用的一种统计量,许多推断统计方法都是基于平均数进行的目前大多数统计方法中平均数都占有最重要的位置.无论是要掌握某个总体的状况还是要比较不同总体的差异等,都涉及到平均数.

在分析数据的时候,面对一组数据,人们最容易想到的是对这些数据进行求和,看他们的总数是多少。然而,总数常常远远大于每一个具体数据,不能反映数据的真实状态,很难推断数据产生背景的真实状态。如果出现了两组数据总数相等的情况,用总数便很难对两组数据进行评价。鉴于此,人们想到了用一个量来表示数据的一般水平,以消除数据个数造成的总数和单个数据的偏差,便用总数除以个数,也就是平均数来代表数据的一般水平或者大致状态。

平均数的特征有很多。首先,平均数介于最大值和最小值之间,即平均数比最小的数大一些,比最大的数小一些。其次,平均数是一个虚拟值,即平均数不一定是这一组数据中的数;平均数反映的是一组数据的特征,不是其中每一个数据的特征;为了弥补这一缺陷,统计学上用众数来代表数据的一般情况,众数是一个真实值。同时,平均数易受极端数据的影响,即一个数据离平均数越远,对平均数的影响越大。例如:全班有30名学生,某次测试成绩如下:590分、2280分、12分、110分、甲同学78分,则平均值为301x5x90+22x80+2+10+78=76.67分,甲同学78分,高于平均值却是全班倒数第三名。因此,多数比赛算选手的平均分,需要去掉一个最高分和一个最低分。最后,所有的数据在平均数上下波动,它们的偏差之和等于0,也就是说,平均数不能衡量偏差;为了衡量偏差,也就是数据的集中程度,统计学中又引入方差和标准差。

不同平均数适合不同的场合。算术平均数受所有数据的影响, 且要求数据与单位要一一对应。调和平均数在经济分析中常作为算术平均数的变形使用, 二者应用于不同形式的资料上。几何平均数应用在比率的平均数的求解上, 并要求各比率乘积有意义。中位数是居中的数值,能够反映总体标志值的一般水平,具有较好的代表性。当总体各单位的标志值有明显的集中趋势时,众数可作为最为合理的代表值。 

  平均数可以反映社会和经济发展一般水平,显示国民经济运行过程均衡状态,表明事件现象共性特征,比如,人均居住面积、职工平均工资、平均发展速度等。但由于人们对平均数特别是算术平均数的计算方法、计算范围和指标含义理解不够,常出现计算不准确和不科学,引起对平均数的质疑和不信任。例如,多年以来我国一直用人均居住面积来反映居民居住的一般水平,这个指标是根据所有人居住面积计算的算术平均数,如果我们不对居住面积的分布进行分析而得出这个值就得出我国居民居住的水平的结论,是不科学的。有报道说,我国居民的居住水平有很大提高,中国房地产协会会长扬慎(2001):“人均居住面积反映居民的住房的水平很不科学,当官的、有钱的住的是大房子,甚至几处,可职工的住房大部分是几十平米,把官人和富人阶层的住房面积平均到普通百姓的头上,怎么能算住房水平的提高?”这样的平均数受到质疑,人们认为平均数掩盖了居民居住的真实水平。 

  平均数是反映总体集中性, 反映一般水平即大部分单位的水平的指标,但此时确实掩盖了事物的真实,人均居住面积、职工平均工资分别掩盖了绝大多数职工的居住水平和真实收入。这说明了算术平均数的使用在这种情况下是不合适的,不科学的,算术平均数应用上有其局限性。 

  从严格意义上说,算术平均数是同一总体的标志总量和单位总量之比,即要求计算平均数时要求分子分母一一对应。而我们平时说的人均收入、人均GDP等值,并不是严格意义上的平均值,而是反映经济发展、人民富裕的强度指标,计算时它们的分子分母不是一一对应的,这个时候就需要我们分清什么是强度相对数,什么是算术平均数。算术平均数是所有数据即标志值之和除以单位数,受所有数据的影响,要应用在数据分布比较均匀的情况下,在有极值的时候使用这样的值不能真实反映一般水平。算术平均数受极值影响,而且极大值比极小值对算术平均数的影响还要大,有极大值时呈正偏,算术平均数大于众数和中位数,有人为了表现其业绩、政绩,主观夸大其成绩,使用算术平均数就不难理解,把个别突出的极大数据平均到全体单位上来, 使一般水平的数值加大,表现某些人的功绩。 

  统计平均数,在统计学上也称为平均指标,是统计指标中非常重要的一种指标,也是国家统计局公布的常见一种统计数据,其重要性在于平均指标的平均涵义:它反映了现象分布的集中趋势,代表了社会与经济发展的一般水平。既然平均数是若干个体数据的一个代表值,因而与个体数据存在一定差异,是再正常不过的了。对于反映我国职工工资一般水平的平均工资,也就必然会出现有一部分人的工资高于平均工资,而另外有一部分人的工资低于平均工资,尤其在地区收入、行业收入、城乡收入差距悬殊的今天,出现这种现象就更加普遍了。这样一来,无论是高于平均工资水平的人,还是低于平均工资水平的人,都会认为国家统计局公布的平均工资不能真实反映他们的实际工资水平。所以,我们必须清楚:平均数只是反映了一种共性,尽管平均数来自于众多的个体数据,但它决不等于个体数据,“平均决不等于平等”,公平更有不小的距离。 

 看到了算术平均数在使用中存在的问题,是由于应用这样的数值时没有满足条件和前提,所以受到质疑,但我们不能据此否定算术平均数,这个指标在经济分析中,在反映总体一般水平问题上,起着重要作用。我们只能说,在经济分析中应该更好地应用算术平均数,更准确恰当地反映事物的本质。我们需要正确理解统计平均数的科学涵义及其局限性,加大我国统计制度的改革的力度,积极与国际接轨掌握平均数的使用场合和条件,准确恰当运用结合偏态指标,合理应用各种平均指标。我们既不能一味迷信算术平均数,也不能因为有了对这个数值的质疑而否定这个指标,在实际的经济分析中应该具体问题具体分析,更好地应用平均数这个指标来反映总体本质特征,更好地使用统计信息,更好地运用统计这种手段。 

平均数的应用时多方面的,美国人达莱尔哈夫在他的名著《统计陷阱》中写到:为了让顾客购买加利福尼亚的一处房产,我巧舌如簧,费尽心思地让他相信,附近居民的年收入平均有15000美元,这是个富人区,因为人有那么一点势利,在与朋友聊天时,总会看似不经意告诉他们现在你住那儿。但当我为了降低税率,降低财产估价,或降低公共交通费用而呼吁时,我的理由是:我们支付不起各种上涨的费用,因为附近的居民的平均年收入只有3500美元。这两个平均数都是合法的平均数,有着合法的计算方法。我的诡计是每次使用了不同的平均数。因为这里的居民收入是显著偏斜的,大多数居民是小农工薪阶层或靠养老金为生的退休老人,但有3家却是来度周末的百万富翁。这3家百万富翁的收入提高了总收入,相应提高了算术平均数。这里居民有一半家庭是收入低于3500美元,另一半超过3500美元。于是,当希望数据较大时,我便使用算术平均数,当希望数据较小时,我便使用中位数。 

  从上例中,我们可看出,由于平均数计算方法的多样性,使用者存在多种选择。前者是按算术平均数计算的,后面是中位数,计算方法本身没错,那为什么给人一种假象呢。那是因为,平均数使总体各单位数量差异给掩盖,给抵消,给抽象了,算术平均数受极端值的影响,使平均数字远离大多数的变量值。这里居民年收入大约有15000美元,主要是3家高收入的百万富翁的高收入拉动的,这里一半家庭收入是低于3500美元,因此,富区是虚构的,正是列宁所说的是虚构平均数。 

不可否认,平均指标确实存在一些缺陷,如平均数并非在任何情况下都能反映大多数,特别是在我国收入差距拉大,影响收入的各种因素复杂多变的情况下更是如此。同时在运用时受到资料分布的限制等等,但这并不意味着我们就可以否定平均指标的代表性作用,进而废弃它。相反,如果我们能够更谨慎、更科学、更准确地运用平均数,进而学会掌握和使用可以衡量平均数是否具有代表性,是否能够代表大多数的标准差和标准差系数的话,那么我们就会对采用各种不同平均数计算出的不同结果和得出的不同结果有清醒的认识。正如有些专家所说如果我们在全民中普及统计知识的教育,更科学更严谨地掌握和运用平均指标,那么,我们就会对采用各种不同平均指标的计算结果和结论有清醒的认识,就会对各种人均指标背后所掩盖和反映的发人深省的问题,做出进一步的分析和解释 

本文来源:https://www.2haoxitong.net/k/doc/eacb892a294ac850ad02de80d4d8d15abe2300c6.html

《对平均数的理解.doc》
将本文的Word文档下载到电脑,方便收藏和打印
推荐度:
点击下载文档

文档为doc格式