平均數 vs 中位數
理解這兩個集中趨勢指標的差異及其在不同數據分布中的表現
平均數
中位數
基本概念
平均數
平均數是一組數據的總和除以數據點的數量,它對所有數據點都敏感,包括異常值。
公式: 平均數 = (x₁ + x₂ + ... + xₙ) / n
中位數
中位數是一組數據排序後位於中間位置的數值,它對異常值不敏感,更能代表數據的中間水平。
公式: 當n為奇數時,中位數 = x₍ₙ₊₁₎/₂;當n為偶數時,中位數 = (xₙ/₂ + xₙ/₂₊₁) / 2
互動演示
平均數
0中位數
0調整數據點
拖動滑塊改變數值,觀察平均數和中位數的變化
關鍵區別
對異常值的敏感性
平均數受異常值影響較大,而中位數相對穩定。
數據分布
在對稱分布中,平均數和中位數接近;在偏態分布中,兩者差異較大。
適用場景
平均數適合沒有異常值的對稱分布,中位數適合有異常值的偏態分布。
練習題
問題 1
一組數據:3, 5, 7, 9, 100。哪個數值更能代表這組數據的中心趨勢?
問題 2
在一個對稱分布的數據集中,平均數和中位數的關係是?
總結
何時使用平均數?
- 數據分布相對對稱
- 沒有極端異常值
- 需要考慮所有數據點的影響
- 數據呈正態分布
何時使用中位數?
- 數據分布偏態
- 存在極端異常值
- 需要一個穩健的中心指標
- 數據是順序數據
理解平均數和中位數的區別是數據分析的基礎。選擇合適的集中趨勢指標可以更準確地描述和解釋數據。