支援度是什麼意思

支援度(Support)是資料探勘和機器學習中的一個概念,特別是在關聯規則學習(association rule learning)中,用來評估一條規則的強度或可靠性。支援度用來表示在某個資料集中,規則的左邊(antecedent)或右邊(consequent)發生的頻率。

例如,在零售資料集中,我們可能有一條規則:

如果 {購買餅乾} → {購買牛奶}

這裡,{購買餅乾} 是規則的左邊,而 {購買牛奶} 是規則的右邊。支援度用來衡量在資料集中,有多少交易同時包含了 {購買餅乾} 和 {購買牛奶}。

支援度的計算公式如下:

支援度({購買餅乾} 且 {購買牛奶}) = 同時包含 {購買餅乾} 和 {購買牛奶}的交易數 / 總交易數

支援度越高,表示規則發生的頻率越高,也就是說,購買餅乾和購買牛奶同時發生的頻率越高。在關聯規則學習中,支援度通常用來篩選出最常見的項目組合,這些組合可以用來構建規則。