白話空間統計之四:p值和z得分(中)是什麼意思
在統計學中,特別是在進行假設檢驗(hypothesis testing)時,我們會使用p值和z得分來評估我們的假設是否成立。以下是用白話解釋p值和z得分:
p值(P-value):
- p值是指在零假設(null hypothesis)為真的情況下,觀察到數據或更極端數據的機率。
- 換句話說,p值是描述了數據有多麼不符合零假設。
- 如果p值很小,意味著數據與零假設的符合程度非常低,這可能表明我們的假設應該被拒絕。
- 通常,如果p值小於或等於預先設定的顯著性水平(significance level, α),例如0.05,我們會說結果是「顯著的」,並且拒絕零假設。
z得分(Z-score):
- z得分是一個標準化分數,用來描述一個樣本數值與其平均值之間的距離,以標準差來表示。
- 如果我們想要知道一個樣本數值在整個分佈中的相對位置,就可以使用z得分。
- z得分可以幫助我們進行假設檢驗,例如在常態分佈下,如果樣本平均數的z得分大於或小於某個臨界值,我們可以拒絕零假設。
舉個例子來說明: 假設你想要知道新藥是否比舊藥更有效。你進行了一項實驗,給一半的病人新藥,另一半病人舊藥。實驗結果顯示,新藥組的病人恢復時間比舊藥組短。
現在你要進行假設檢驗,假設你想要檢驗新藥是否真的比舊藥有效(零假設是新藥和舊藥沒有差異)。
-
p值:如果p值很小,例如0.01,這意味著在假設新藥和舊藥沒有差異的情況下,觀察到新藥組恢復時間更短的機率只有1%。這是一個很小的機率,因此你可能會拒絕零假設,認為新藥確實更有效。
-
z得分:如果你計算樣本平均恢復時間的z得分,並且這個z得分大於臨界值(例如1.96,對於α=0.05的顯著性水平),這意味著樣本平均數與假設的總體平均數之間的差異是如此之大,以至於在常態分佈下,這種情況發生的機率很小。這也支持了你拒絕零假設的決定。
總結來說,p值和z得分都是用來評估假設檢驗的工具,p值告訴我們觀察到的數據有多麼不符合零假設,而z得分則是用來描述樣本數值與總體平均數之間的距離。