几个统计量的概念、定义及区别
1、平均数(arithmetic average)
平均数也叫算术平均数. 一组数据中所有数据之和除以数据的个数,反映数据集中趋势.
n 个数 a1 、a2 、a3 、⋯ 、an 的算术平均数的公式为:
An =na1+a2+a3+⋯+an
2、加权平均数(weighted average)
n 个数 a1 、a2 、a3 、⋯ 、an 的权分别是 w1 、w2 、w3 、⋯ 、wn ,则这 n 个数的加权平均数为:
a =w1+w2+w3+⋯+wna1w1+a2w2+a3w3+⋯+anwn
权的英文是weight,有表示数据重要程度的意思.
在 n 个数 a1 、a2 、a3 、⋯ 、an ,若每个数的出现次数分别是 f1 、f2 、f3 、⋯ 、fn ,则
a =na1f1+a2f2+a3f3+⋯+anfn
也称为这 n 个数的加权平均数.
3、中位数(median)
将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数。如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.
4、众数(mode)
一组数据中出现次数最多的数据称为这组数据的众数. 如果一组数据中出现次数最多的数有多个,则这几个数都称为这组数据的众数.
5、方差(variance)
设有 n 个数据 a1 、a2 、a3 、⋯ 、an ,各数据与它们的平均数 p 的差的平方分别是 (a1−p)2 、(a2−p)2 、(a3−p)2 、⋯ 、(an−p)2 ,则称
s2 =n(a1−p)2+(a2−p)2+(a2−p)2+⋯+(an−p)2
为这组数据的方差,
方差用于衡量一组数据波动(离散程度)的大小. 方差越大,数据波动越大;方差越小,数据波动越小. 换句话说,数据分布越分散,方差就越大;数据分布越集中,方差越小.
6、极差(range)
一组数据中最大值与最小值的差称为这组数据的极差. 极差反应了数据的波动范围.
7、平均差(average deviation)
设有 n 个数据 a1 、a2 、a3 、⋯ 、an ,平均数是 p,则
(AD) =n∣a1−p∣+∣a2−p∣+∣a2−p∣+⋯+∣an−p∣
称为这组数据的平均差,其含义是各个值之间的差异程度.
8、标准差(standard deviation)
标准差也称为均方差,是方差的算术平方根,即
s=√s2
由于方差是数据的平方,与检测值本身相差太大,人们难以直观的衡量,所以常用方差开根号换算回来,就得到标准差.