Associative Classficiation
Rule-based classification의 일종이다.
Rule을 찾아내는 방법을 association rule mining(apriori, FP-growth 등)으로 수행한다.
Association rule을 생성하고 classification을 위해서 association rule을 사용한다.
아래와 같이 precondition들의 conjunction으로 표현한다.
$p_1 \cap p_2 \cap ... \cap p_i \rightarrow A_{class} = C (conf, sup)$
Confidence, Support
Minimum confidence와 minimum support 이상인 것들에 대해서 classification이 수행된다.
Threshold를 크게하여 엄격하게 설정하면 rule의 accuracy는 높아지더라도 cover는 낮아진다.
따라서 적절한 threshold를 설정해야 한다.
Not exclusive, not exhaustive
- not exclusive
- 두 개 이상의 rule에 대해 cover 될 수 있다.
- 따라서 conflict가 발생할 수 있으므로 conflict resolution이 필요하다.
- 보통 threshold를 높임으로써 conflict를 해결한다.
- not exhaustive
- confidence와 support가 threshold보다 크지 않으면 어떠한 rule에도 속하지 않을 수 있다.
특징
여러 개의 attribute 사이에서 좀 더 strong한 association을 찾는다.
- effective 하다.
- 많은 경우에 정확도가 더 높다.
- coverage가 낮을 수 있다.
vs. Decision Tree
Associative classification가 더 effective하다.
- decision tree : greedy하기 때문에 뒤는 고려하지 않고 그 순간에 하나의 attribute의 homogeneous만을 본다.
- associative classification : 여러 attribute의 관계와 최종 class label과의 관계를 동시에 보기 때문에 더 효율적이다.
'Computer Science > Data Science' 카테고리의 다른 글
[Classification] K-NN(K-Nearest Neighbor) Algorithm (0) | 2022.04.18 |
---|---|
Eager Learning vs. Lazy Learning (0) | 2022.04.18 |
[Classification] Rule-based Classification (0) | 2022.04.18 |
[Classification] Bayesian Classification (0) | 2022.04.18 |
[Decision Tree] Gini Index (0) | 2022.04.18 |
댓글