安卓手机扫描二维码安装App

几个统计量的概念、定义及区别



1、平均数(arithmetic average)


平均数也叫算术平均数. 一组数据中所有数据之和除以数据的个数,反映数据集中趋势.


nn 个数 a1a_1a2a_2a3a_3\cdotsana_n 的算术平均数的公式为:


AnA_n =a1+a2+a3++ann=\dfrac{a_1 +a_2 +a_3 + \cdots +a_n}{n}


2、加权平均数(weighted average)


nn 个数 a1a_1a2a_2a3a_3\cdotsana_n 的权分别是 w1w_1w2w_2w3w_3\cdotswnw_n ,则这 nn 个数的加权平均数为:



a\overline{a} =a1w1+a2w2+a3w3++anwnw1+w2+w3++wn=\dfrac{a_1 w_1 +a_2 w_2 +a_3 w_3 +\cdots + a_n w_n}{w_1 +w_2 +w_3 + \cdots +w_n}


权的英文是weight,有表示数据重要程度的意思.


nn 个数 a1a_1a2a_2a3a_3\cdotsana_n ,若每个数的出现次数分别是 f1f_1f2f_2f3f_3\cdotsfnf_n ,则


a\overline{a} =a1f1+a2f2+a3f3++anfnn=\dfrac{a_1 f_1 +a_2 f_2 +a_3 f_3 +\cdots + a_n f_n}{n}


也称为这 nn 个数的加权平均数.


3、中位数(median)


将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数。如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.


4、众数(mode)


一组数据中出现次数最多的数据称为这组数据的众数. 如果一组数据中出现次数最多的数有多个,则这几个数都称为这组数据的众数.


5、方差(variance)


设有 nn 个数据 a1a_1a2a_2a3a_3\cdotsana_n ,各数据与它们的平均数 pp 的差的平方分别是 (a1p)2(a_1 -p)^2(a2p)2(a_2 -p)^2(a3p)2(a_3 -p)^2\cdots(anp)2(a_n -p)^2 ,则称


s2s^2 =(a1p)2+(a2p)2+(a2p)2++(anp)2n=\dfrac{(a_1 -p)^2 +(a_2 -p)^2 +(a_2 -p)^2+\cdots + (a_n -p)^2}{n}


为这组数据的方差,


方差用于衡量一组数据波动(离散程度)的大小. 方差越大,数据波动越大;方差越小,数据波动越小. 换句话说,数据分布越分散,方差就越大;数据分布越集中,方差越小.


6、极差(range)


一组数据中最大值与最小值的差称为这组数据的极差. 极差反应了数据的波动范围.


7、平均差(average deviation)


设有 nn 个数据 a1a_1a2a_2a3a_3\cdotsana_n ,平均数是 pp,则


(AD)(AD) =a1p+a2p+a2p++anpn=\dfrac{|a_1 -p| +|a_2 -p| +|a_2 -p|+\cdots + |a_n -p|}{n}


称为这组数据的平均差,其含义是各个值之间的差异程度.



8、标准差(standard deviation)


标准差也称为均方差,是方差的算术平方根,即


s=s2s=\sqrt{s^2}


由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来,就得到标准差.





苹果手机扫描二维码安装App