moomz
/vs·science·zh

📊Mean vs Median📐

均值和中位数都描述数据的"中心",但当数据分布偏斜时,两者的结果可能差异悬殊。

用 moomz 发起投票:谁赢?
moomz.com — 10秒、匿名、免费
📊Mean
  • 所有数值之和除以数据个数
  • 利用了每一个数据点
  • 在日常统计和计算中最为常见
  • 受极端离群值影响显著
  • 便于在进一步的数学公式中使用
📐Median
  • 数据排序后的中间值
  • 将数据集分成相等的两半
  • 几乎不受极端离群值影响
  • 更能代表偏斜数据中的典型值
  • 常用于收入、房价等数据

结论

对称且无明显离群值的数据使用均值;数据偏斜时——如收入数据——使用中位数,因为少数极高值会将均值拉偏,远离大多数人的实际水平。

常见问题

为什么收入数据倾向于用中位数?+

收入因少数极高收入者而严重偏斜,中位数更能反映普通人的实际收入。

均值和中位数可以相等吗?+

可以。在完全对称的分布中,均值和中位数相同。

哪种平均数对离群值更敏感?+

均值。单个极端值就能使其明显偏移,而中位数对离群值具有抵抗力。

其他语言

更多 science

用 moomz 发起投票:谁赢?