본문 바로가기
Computer Science/Data Science

Measure Proximity

by Gofo 2022. 6. 3.

Measure Proximity

Data의 similarity 혹은 dissimilarity를 proximity라 한다.

 

Attribute의 type에 따라 similarity를 계산하는 방법이 다르다.

  • nominal = categories : 유한한 수의 value를 가지고 각 value 사이에 대소 관계가 없음
  • binary : 0 or 1
    • symmetric binary : 두 value의 중요도가 동일
    • asymmetric binary : 두 value의 중요도가 다름
  • ordinal : value 간 순서가 존재하지만 순서 간의 크기는 정해져 있지 않음
  • numeric = quantitative : value 간 순서가 존재하고 크기를 비교할 수 있다. 
    • ratio-scaled : value 간 크기를 대수적으로 표현할 수 있다.
    • interval-scaled : value 간 크기를 대수적으로 표현할 수 없다.

 

댓글