본문 바로가기
Computer Science/Data Science

Multi-level Association, Multi-dimensional Association

by Gofo 2022. 4. 17.

Multi-Level Association

Item들 간에 hierarchy가 존재하는 것을 말한다.

 

배경

Uniform support를 적용하면 레벨에 관계 없이 동일한 min_sup을 적용하게 된다.

그런데 lower level의 item들은 더 작은 support를 가질 확률이 높기 때문에 lower level에 대한 association rule은 나오기 힘들다.

 

따라서 Support를 flexible하게 설정할 필요가 있다.

 

Reduced Support

Lower level에 대한 threshold(min_sup)을 줄여준다.

 

Redundant Rules

몇몇 descendent rule이 ancestor rule에 의해 찾아지고 설명되는 경우가 있다.

이러한 descendent rule을 redundant하다고 한다.

 

Descendent rule이 redundant한 경우는 다음과 같다.

  • descendent rule의 support가 ancestor rule을 통해 예측가능한 것과 유사하다.
  • descendent rule의 confidence가 ancestor rule의 confidence와 유사하다.

 

예시

  • ancestor : milk $\rightarrow$ wheat bread (support : 8% / confidence : 70%)
  • descendent : 2% milk $\rightarrow$ wheat bread (support : 2% / confidence : 72%)

 

해결 : Redundancy Filtering

Descendent rule이 redundant한 경우 제거해서 ancsetor로 cover한다.

Redundant하지 않은 경우 descendent rule을 남겨서 ancestor의 의미를 강조하는 역할로 사용한다.

 


Multi-Dimensional Association

Dimension = predicate = attribute

 

Single-dimensional Rule

지금까지 봐왔던 것들은 모두 single-dimensional rule이다.

하나의 attribute를 가지고 있기 때문에 dimension을 생략해서 value로만 나타내었다.

 

예 : milk $\rightarrow$ bread

 

Multi-dimensional Rule

2개 이상의 dimension(predicate, attribute)를 가지고 있는 rule을 말한다.

 

  • inter-dimension association rule
    • predicate를 반복하지 않는다.
    • 중복되는 predicate가 없다.
    • 예시
      • age(X, "19-25") $\cap$ ocupation(X, "student") $\rightarrow$ buys(X, "coke")
      • 위 예시의 dimension은 3이다.
  • hybrid-dimension association rule
    • 중복되는 predicate가 존재한다.
    • 예시
      • age(X, "19-25") $\cap$ buys(X, "popcorn") $\rightarrow$ buys(X, "coke")
      • 위 예시의 dimension도 3이다.

 

댓글