卡方分配意思

卡方分布(Chi-square distribution)是一種常見的連續型隨機變數的機率分布,通常用來檢驗兩個分類變數是否獨立,或者用來檢驗某個理論頻數分布與實際頻數分布是否一致。卡方分布可以用來檢驗以下幾種情況:

  1. 擬合優度檢驗(Goodness of fit test):用於檢驗一個樣本是否符合某個理論分布。
  2. 獨立性檢驗(Test of independence):用於檢驗兩個分類變數是否獨立。
  3. homogeneity檢驗:用於檢驗多個樣本的頻率是否相同。

卡方分布的定義如下:

設ξ1, ξ2, ..., ξn是獨立的隨機變數,它們都服從標準常態分配N(0,1)。卡方分布是這些隨機變數的平方和Σξi^2的分布。卡方分布的機率密度函式為:

f(x) = \frac{1}{2^{n/2}\Gamma(n/2)}x^{n/2-1}e^{-x/2}, \quad x > 0

其中n是自由度(degrees of freedom),它是卡方分布的一個重要參數,決定了分布的形狀。自由度通常是卡方分布中獨立變數的個數。

卡方分布的期望(均值)為E(X) = n,方差為Var(X) = 2n。卡方分布的形狀隨著自由度的變化而變化,當自由度n較大時,卡方分布接近於常態分配。

在實際套用中,卡方分布通常用於統計推斷和假設檢驗,特別是在分析分類數據時非常有用。例如,在醫學研究中,研究者可能會使用卡方分布來檢驗不同治療方法的有效性;在市場調查中,研究者可能會使用卡方分布來檢驗不同地區消費者偏好的差異。