본문 바로가기
Computer Science/Data Science

[Classification] Associative Classification

by Gofo 2022. 4. 18.

Associative Classficiation

Rule-based classification의 일종이다.

 

Rule을 찾아내는 방법을 association rule mining(apriori, FP-growth 등)으로 수행한다.

Association rule을 생성하고 classification을 위해서 association rule을 사용한다.

 

아래와 같이 precondition들의 conjunction으로 표현한다.

$p_1 \cap p_2 \cap ... \cap p_i \rightarrow A_{class} = C (conf, sup)$

 

Confidence, Support

Minimum confidence와 minimum support 이상인 것들에 대해서 classification이 수행된다.

Threshold를 크게하여 엄격하게 설정하면 rule의 accuracy는 높아지더라도 cover는 낮아진다.

따라서 적절한 threshold를 설정해야 한다.

 

Not exclusive, not exhaustive

  • not exclusive
    • 두 개 이상의 rule에 대해 cover 될 수 있다.
    • 따라서 conflict가 발생할 수 있으므로 conflict resolution이 필요하다.
    • 보통 threshold를 높임으로써 conflict를 해결한다.
  • not exhaustive
    • confidence와 support가 threshold보다 크지 않으면 어떠한 rule에도 속하지 않을 수 있다.

 

특징

여러 개의 attribute 사이에서 좀 더 strong한 association을 찾는다.

  • effective 하다.
  • 많은 경우에 정확도가 더 높다.
  • coverage가 낮을 수 있다.

 

vs. Decision Tree

Associative classification가 더 effective하다.

  • decision tree : greedy하기 때문에 뒤는 고려하지 않고 그 순간에 하나의 attribute의 homogeneous만을 본다.
  • associative classification : 여러 attribute의 관계와 최종 class label과의 관계를 동시에 보기 때문에 더 효율적이다.

 

 

댓글