平均数 vs 中位数
理解这两个集中趋势指标的差异及其在不同数据分布中的表现
平均数
中位数
基本概念
平均数
平均数是一组数据的总和除以数据点的数量,它对所有数据点都敏感,包括异常值。
公式: 平均数 = (x₁ + x₂ + ... + xₙ) / n
中位数
中位数是一组数据排序后位于中间位置的数值,它对异常值不敏感,更能代表数据的中间水平。
公式: 当n为奇数时,中位数 = x₍ₙ₊₁₎/₂;当n为偶数时,中位数 = (xₙ/₂ + xₙ/₂₊₁) / 2
互动演示
平均数
0中位数
0调整数据点
拖动滑块改变数值,观察平均数和中位数的变化
关键区别
对异常值的敏感性
平均数受异常值影响较大,而中位数相对稳定。
数据分布
在对称分布中,平均数和中位数接近;在偏态分布中,两者差异较大。
适用场景
平均数适合没有异常值的对称分布,中位数适合有异常值的偏态分布。
练习题
问题 1
一组数据:3, 5, 7, 9, 100。哪个数值更能代表这组数据的中心趋势?
问题 2
在一个对称分布的数据集中,平均数和中位数的关系是?
总结
何时使用平均数?
- 数据分布相对对称
- 没有极端异常值
- 需要考虑所有数据点的影响
- 数据呈正态分布
何时使用中位数?
- 数据分布偏态
- 存在极端异常值
- 需要一个稳健的中心指标
- 数据是顺序数据
理解平均数和中位数的区别是数据分析的基础。选择合适的集中趋势指标可以更准确地描述和解释数据。