Measure Proximity
Data의 similarity 혹은 dissimilarity를 proximity라 한다.
Attribute의 type에 따라 similarity를 계산하는 방법이 다르다.
- nominal = categories : 유한한 수의 value를 가지고 각 value 사이에 대소 관계가 없음
- binary : 0 or 1
- symmetric binary : 두 value의 중요도가 동일
- asymmetric binary : 두 value의 중요도가 다름
- ordinal : value 간 순서가 존재하지만 순서 간의 크기는 정해져 있지 않음
- numeric = quantitative : value 간 순서가 존재하고 크기를 비교할 수 있다.
- ratio-scaled : value 간 크기를 대수적으로 표현할 수 있다.
- interval-scaled : value 간 크기를 대수적으로 표현할 수 없다.
'Computer Science > Data Science' 카테고리의 다른 글
[Measure Proximity] For Binary Attribute (0) | 2022.06.03 |
---|---|
[Measure Proximity] For Nominal Attribute (0) | 2022.06.03 |
Proximity : Similarity, Dissimilarity (0) | 2022.06.03 |
[Data Visualization] Scatter Plot (0) | 2022.06.03 |
[Data Visualization] Quantile-Quantile Plot (Q-Q Plot) (0) | 2022.06.03 |
댓글