偏態是什麼意思
在統計學中,偏態(Skewness)是指數據分佈的不對稱性。一個數據集可能呈現左偏(負偏態)或右偏(正偏態)。
左偏(負偏態):當數據集的峰值向左傾斜(即向最小值的方向傾斜),長尾向右延伸時,這個數據集被稱為左偏或負偏態。這種情況下,數據集的眾數(Mode)小於中數(Median),並且中數小於平均數(Mean)。這種分佈通常在自然界中較為常見,因為它們通常包含一些極端值,這些極端值拉長了數據的尾部。
右偏(正偏態):當數據集的峰值向右傾斜(即向最大值的方向傾斜),長尾向左延伸時,這個數據集被稱為右偏或正偏態。這種情況下,數據集的眾數小於中數,並且中數大於平均數。這種分佈在某些人為數據中較為常見,例如收入分佈。
在統計學中,通常使用偏態係數(Skewness Coefficient)來量化偏態的程度。偏態係數可以是一個正數(表示正偏態)、一個負數(表示負偏態)或接近於零(表示數據接近對稱分佈)。偏態係數的絕對值越大,表示偏態越嚴重。
偏態在數據分析中是一個重要的概念,它有助於我們理解數據的特性,並選擇適當的統計方法來進行進一步的分析。例如,如果數據是右偏的,那麼在計算平均數時,極端值會對結果產生更大的影響,這可能會導致對數據集整體情況的誤解。在這種情況下,使用中數或分位數(Quantile)可能更為合適。