Proximity Measure for Mixed Attributes Type
각 타입의 attribute에 대해 distance를 구하고 이에 대해 weighted avearge를 취한다.
각 타입별 Distance
- f가 binary이거나 nominal 일 때,
- $x_{if} = x_{jf} \rightarrow d_{ij}^{(f)} = 0$
- else $d_{ij} ^{(f)} = 1$
- f가 numeric 일 때, normalized distance 사용
- f가 ordinal 일 때
- rank 순서대로 $r_{if}$을 매기고
- interval-scaled 처럼 $z_{if} = \frac{r_{if} - 1}{M_f - 1}$ 계산
'Computer Science > Data Science' 카테고리의 다른 글
Cluster Analysis (0) | 2022.06.05 |
---|---|
[Measure Proximity] For Documents - using Cosine Similarity (0) | 2022.06.03 |
[Measure Proximity] For Ordinal Attribute (0) | 2022.06.03 |
[Measure Proximity] For Numeric Data (0) | 2022.06.03 |
[Measure Proximity] For Binary Attribute (0) | 2022.06.03 |
댓글