關聯規則 (Association Rules)
經由關聯矩陣產生規則:
<蘇打水>:可口可樂, 百事可樂
<低糖蘇打水>:健怡可樂 ,低糖百事可樂
優點 | 缺點 |
|
|
理論
當挖掘演算法所找出的規則滿足使用者訂定的最小的minimum support與minimum confidence的門檻時,這個規則才會成立。
元組 | 出現頻率 |
A | 45% |
B | 42.5% |
C | 40% |
A和B | 25% |
A和C | 20% |
B和C | 15% |
A和B和C | 5% |
關聯規則的種類
屬性值:(1) Boolean association rule :僅探討item是否出現 (2) Association rule with repeated items 探討item的購買數量
資料維度:(1)單一維度關聯規則(single dimensional association rules若買牛奶,則會買麵包。 (2) 多重( multi dimensional association rules) 加上「年齡」「收入」「購買」三個維度。
抽象層級:在規則中的項目或屬性可以跨不同的概念層級。如「年齡」與「Toyota汽車」
規則 | 說明 | 範例 |
若 A 則 B | 若"條件句",則"結論句"。 | 若買柳橙汁則會買牛奶(80%) |
若 B 則 A | 若買牛奶則會買柳橙汁(70%) | |
若 A 則 非B | 若買清潔劑則不會買牛奶(60%) | |
若 (A 與 B )則 C | 會比" 若 A 則 B 與 C " 有用 | 若買柳橙汁與牛奶則會買汽水 |
若 A 則 (B 與 C) | 若買柳橙汁則會買牛奶與汽水 | |
若 (A 與 非B )則 C | (無關規則Dissociation Rules) | |
若 非A 與 非B 則 非 C | 若沒買柳橙汁且沒買汽水則也不會買牛奶 |
流程
選擇正確的物品組合 ,越詳細的分類代表分析結果會越實用,但是資料量會隨之而增加。組合數會依照商品數量成幾何級數增加,在一百種商品的情況下,三種商品的組合為161,700種。將少見的商品用較高階的分類項歸類,如此一來,出現的機會會較多。經由關聯矩陣產生規則:
虛擬標籤(Virtual Items)
虛擬標籤的目的在幫助分析過程中,利用分類法所無法提供的資訊,來描述一筆交易,但它們並不是真的分類項 ,可以用來比較差異。<蘇打水>:可口可樂, 百事可樂
<低糖蘇打水>:健怡可樂 ,低糖百事可樂
應用
- 實行目標行銷
- 進行市場區隔
- 選擇目標顧客
- 分析顧客行為,銀行提供的多項服務,來分析客戶可能需要那些服務。
- 改進市場陳設
- 組合搭設商品,電話公司提供的多項套裝(捆綁銷售)服務。
- 發堀不良率,不尋常的多項保險申請,可能是欺詐行爲。
留言
張貼留言