본문 바로가기
Computer Science/Data Science

[Partitioning Clustering Method] K-Medoids

by Gofo 2022. 6. 6.

K-Medoids

배경 : K-Means의 문제

K-means algorithm은 outlier에 민감하다.

 

Outlier는 extremely large/small value를 갖기 때문에 데이터의 distribution을 왜곡시킨다.

K-means는 단순한 mean으로 만들어진 centroid를 seed point로 이용하기 때문에 outlier에 민감하다.

 

K-Medoids

K-medoids는 mean을 통해 만들어진 virtual object(centroid) 대신 데이터의 중심에 존재하는 real object(medoid)를 이용한다.

 

Medoid는 median과 같이 cluster 내의 중심에 위치하는 real-object이기 때문에 outlier에 휘둘리지 않는다.

또한 다른 객체와의 거리가 가장 짧은 real object이기도 하다.

 

종류

  • PAM (Partitioning Around Medoids)
  • CLARA, CLARANS : Randomized sampling

 

 

댓글