Multi-Level Association
Item들 간에 hierarchy가 존재하는 것을 말한다.
배경
Uniform support를 적용하면 레벨에 관계 없이 동일한 min_sup을 적용하게 된다.
그런데 lower level의 item들은 더 작은 support를 가질 확률이 높기 때문에 lower level에 대한 association rule은 나오기 힘들다.
따라서 Support를 flexible하게 설정할 필요가 있다.
Reduced Support
Lower level에 대한 threshold(min_sup)을 줄여준다.
Redundant Rules
몇몇 descendent rule이 ancestor rule에 의해 찾아지고 설명되는 경우가 있다.
이러한 descendent rule을 redundant하다고 한다.
Descendent rule이 redundant한 경우는 다음과 같다.
- descendent rule의 support가 ancestor rule을 통해 예측가능한 것과 유사하다.
- descendent rule의 confidence가 ancestor rule의 confidence와 유사하다.
예시
- ancestor : milk $\rightarrow$ wheat bread (support : 8% / confidence : 70%)
- descendent : 2% milk $\rightarrow$ wheat bread (support : 2% / confidence : 72%)
해결 : Redundancy Filtering
Descendent rule이 redundant한 경우 제거해서 ancsetor로 cover한다.
Redundant하지 않은 경우 descendent rule을 남겨서 ancestor의 의미를 강조하는 역할로 사용한다.
Multi-Dimensional Association
Dimension = predicate = attribute
Single-dimensional Rule
지금까지 봐왔던 것들은 모두 single-dimensional rule이다.
하나의 attribute를 가지고 있기 때문에 dimension을 생략해서 value로만 나타내었다.
예 : milk $\rightarrow$ bread
Multi-dimensional Rule
2개 이상의 dimension(predicate, attribute)를 가지고 있는 rule을 말한다.
- inter-dimension association rule
- predicate를 반복하지 않는다.
- 중복되는 predicate가 없다.
- 예시
- age(X, "19-25") $\cap$ ocupation(X, "student") $\rightarrow$ buys(X, "coke")
- 위 예시의 dimension은 3이다.
- hybrid-dimension association rule
- 중복되는 predicate가 존재한다.
- 예시
- age(X, "19-25") $\cap$ buys(X, "popcorn") $\rightarrow$ buys(X, "coke")
- 위 예시의 dimension도 3이다.
'Computer Science > Data Science' 카테고리의 다른 글
Correlations (Lift) (0) | 2022.04.17 |
---|---|
Quantitative Association Mining (0) | 2022.04.17 |
[Frequent Pattern Mining] CHARM (using Vertical Data Format) (0) | 2022.04.17 |
[Closed Pattern Mining] CLOSET (0) | 2022.04.17 |
[Max Pattern Mining] MaxMiner (0) | 2022.04.17 |
댓글