K-Medoids
배경 : K-Means의 문제
K-means algorithm은 outlier에 민감하다.
Outlier는 extremely large/small value를 갖기 때문에 데이터의 distribution을 왜곡시킨다.
K-means는 단순한 mean으로 만들어진 centroid를 seed point로 이용하기 때문에 outlier에 민감하다.
K-Medoids
K-medoids는 mean을 통해 만들어진 virtual object(centroid) 대신 데이터의 중심에 존재하는 real object(medoid)를 이용한다.
Medoid는 median과 같이 cluster 내의 중심에 위치하는 real-object이기 때문에 outlier에 휘둘리지 않는다.
또한 다른 객체와의 거리가 가장 짧은 real object이기도 하다.
종류
- PAM (Partitioning Around Medoids)
- CLARA, CLARANS : Randomized sampling
'Computer Science > Data Science' 카테고리의 다른 글
[K-Medoids] CLARA (Clustering LARge Applications) (0) | 2022.06.06 |
---|---|
[K-Medoids] PAM (Partitioning Around Medoids) (0) | 2022.06.06 |
[Partitioning Clustering Method] K-Modes (0) | 2022.06.06 |
[Partitioning Clustering Method] K-Means (0) | 2022.06.06 |
[Cluster Analysis] Partitioning Algorithm (0) | 2022.06.06 |
댓글