平均数 vs 中位数

平均数 vs 中位数

理解这两个集中趋势指标的差异及其在不同数据分布中的表现

平均数
中位数

基本概念

平均数

平均数是一组数据的总和除以数据点的数量,它对所有数据点都敏感,包括异常值。

公式: 平均数 = (x₁ + x₂ + ... + xₙ) / n

中位数

中位数是一组数据排序后位于中间位置的数值,它对异常值不敏感,更能代表数据的中间水平。

公式: 当n为奇数时,中位数 = x₍ₙ₊₁₎/₂;当n为偶数时,中位数 = (xₙ/₂ + xₙ/₂₊₁) / 2

互动演示

平均数

0

中位数

0

调整数据点

拖动滑块改变数值,观察平均数和中位数的变化

关键区别

对异常值的敏感性

平均数受异常值影响较大,而中位数相对稳定。

数据分布

在对称分布中,平均数和中位数接近;在偏态分布中,两者差异较大。

适用场景

平均数适合没有异常值的对称分布,中位数适合有异常值的偏态分布。

练习题

问题 1

一组数据:3, 5, 7, 9, 100。哪个数值更能代表这组数据的中心趋势?

问题 2

在一个对称分布的数据集中,平均数和中位数的关系是?

总结

何时使用平均数?

  • 数据分布相对对称
  • 没有极端异常值
  • 需要考虑所有数据点的影响
  • 数据呈正态分布

何时使用中位数?

  • 数据分布偏态
  • 存在极端异常值
  • 需要一个稳健的中心指标
  • 数据是顺序数据

理解平均数和中位数的区别是数据分析的基础。选择合适的集中趋势指标可以更准确地描述和解释数据。