四分位偏差意思

四分位偏差(Quartile Deviation),也稱為四分位距(Interquartile Range,IQR),是描述數據集中趨勢和分散程度的一個統計量。它用於衡量數據集中第二四分位數(Q2,也稱為中位數)和第三四分位數(Q3)之間的距離,即數據集中50%的值所在的範圍。

具體來說,四分位偏差是通過以下步驟計算的:

  1. 首先,確定數據集中的最小值和最大值,然後計算第一四分位數(Q1)和第二四分位數(Q2)。
  2. 計算Q3,它是數據集中75%的值低於的值。
  3. 計算Q1和Q3之間的距離,即四分位距(IQR)。

四分位偏差通常用於評估數據集的分散程度,因為它不受極端值的影響,因此在數據中有異常值時,使用四分位偏差比使用標準偏差更能準確地描述數據的分散情況。

四分位偏差是一個非常有用的統計量,因為它可以告訴我們數據集中大多數值所在的範圍,並且可以用來識別異常值。在某些情況下,如果一個數據點比Q3加上1.5倍的四分位偏差大,或者比Q1減去1.5倍的四分位偏差小,那麼這個數據點就被認為是異常值。