对于上面社保局公布的统计信息,网上大多数的吐槽和抱怨,都集中在
平均值是常用的数据描述性指标,这个指标比较容易理解。平均值(简称均值),是用一组数据的和除以这组数据的个数得到的。
分位数是把数据分为两个部分,左侧部分的面积占整体的总面积比率就是
对分位数的概念要深入理解。比如,国家气象局公布:某年的最大降雨量是千年一遇。这个公布信息被无数网友拍砖。理由是:除非从北宋时期就开始统计每年的最大降雨量,否则没有那么多数据可以证明今年的最大降雨量是千年一遇(1000年中的最大值)。
实际上,从统计层面而言,收集50~100年的最大降雨量数据,针对这些数据,通过软件拟合一个最贴合的分布。然后,就可以根据这个分布的数学模型来推算,以今年的最大降雨量的数值来分割分布曲线,最终,可以计算得到分割线左侧和右侧的面积占总面积的百分比各是多少。
例如,以今年的最大降雨量的数值来分割分布曲线,左侧的面积占总面积比率是0.999,那么右侧的面积占总面积的比率就是0.001(千分之一),那么就代表今年的最大降雨量是千年一遇。如果左侧的面积占总面积比率是0.9999,那么右侧的面积占整体比率就是万分之一,那么就代表今年的最大降雨量是万年一遇。
大家学习了平均值和中位数的概念以后,就可以正确理解平均工资代表的实际含义了。很多人都认为,平均工资就是应该工资的平分点,处于平均工资位置的人,有一半人的工资比他高,一半人的工资比他低。这个概念是错误的,其实这是混淆了平均值和中位数之间的概念。要判断平均值和中位数是否相等,要看具体分布的情况。
但是对于右偏型的分布,比如工资、寿命、设备修理时间这类数据而言,这类分布右侧的尾巴拖得很长。对于这类数据,比如工资,平均工资要比中位工资大很多。
大家想一下,*云、**腾、**林、**东,他们一年的收入可以平均多少个最低工资呢?由于少数高收入者拉高了平均值,导致了大部分人的工资都低于平均工资,所以大家看到公布的平均工资才会觉得心里不平衡。
好了,说了那么多,最后归纳总结一下,大家要记的这样一条真理:统计学可以大家带来科学合理的分析评价结果,给决策提供重要的支持依据。但是,