假設檢定是在統計推論中常用的方法,也是初級統計學一定會講到的重要單元。
我們在假設檢定的過程中,會建立兩種假設:
H0:虛無假設 (null hypothesis) 就是我們要檢測是否為真的事情
H1: 對立假設 (alternative hypothesis)
本文要介紹的是做假設檢定時可能犯的兩種錯誤:
型一錯誤:H0事實上成立,但統計檢驗的結果不支持零假設(拒絕零假設)。
If we reject a true null hypothesis, we make a Type 1 error.
型二錯誤:H0事實上不成立,但統計檢驗的結果支持零假設(不拒絕零假設)。
Not rejecting a false null hypothesis is a Type 2 error.
建議直接把這兩句背起來,不要用生活情境記憶型一型二錯誤的定義!
例如維基百科上把型一錯誤和偽陽性 false positive當成同一件事,型二錯誤和偽陰性 false negative當成同一件事。
這是因為習慣上將H0定義為沒有生病、沒有懷孕,
所以偽陽性(明明沒確診卻誤判為有)就是型一錯誤,偽陰性(明明確診卻誤判為沒有)就是型二錯誤。
但如果今天將H0改定義為有生病,偽陽性就不是型一錯誤了。
同理,也有人會說型一錯誤就是「錯殺」(準確來說,是「錯殺」虛無假設)
這個說法通常是對的,因為習慣上將H0定義為沒有罪,
所以「錯殺」(明明沒罪卻誤判為有)就是型一錯誤,「錯放」(明明有罪卻誤判為沒有)就是型二錯誤。
但如果今天將H0改定義為有罪,「錯殺」就不是型一錯誤了。
雖然理論上H0、H1可以隨意定義,但自己做研究時還是盡量遵守將H0/虛無假設/零假設定義為「沒有__」的大原則,避免混淆讀者。
坊間的統計軟體一般將H0定義為係數= 0 ,跑出來如果拒絕H0,就表示係數顯著異於 0 。
有種說法是型一錯誤比較嚴重,這是因為在做研究時我們常會希望係數顯著(就可以推論「有影響」、「有差異」)
這時如果犯了型一錯誤而不自知,其實係數沒有顯著異於 0 ,我們卻拒絕了H0,就可能做出錯誤的推論。
如果犯了型一錯誤而不自知,其實係數有顯著異於 0 ,我們卻以為沒有,那頂多以為自己還沒做出結果而已。
但是,「型一錯誤比較嚴重」不能當作一個通則,到底哪種錯誤比較嚴重(偽陽性vs偽陰性/錯殺vs錯放),完全依情境而異。
推薦孔令傑老師清楚的教學影片:
「機率與統計」07-08「假設檢定:The two types of errors」