기본미션

<aside> 💡 k-평균 알고리즘 작동방식 설명하기

</aside>

  1. 무작위로 k개의 클러스터 중심을 정합니다.
  2. 각 샘플에서 가장 가까운 클러스터 중심을 찾아 해당 클러스터의 샘플로 지정합니다.
  3. 클러스터에 속한 샘플의 평균값으로 클러스터 중심을 변경합니다.
  4. 클러스터 중심에 변화가 없을 때까지 2번으로 돌아가 반복합니다.

Untitled

먼저 3개의 클러스터 중심(빨간 점)을 랜덤하게 지정합니다(①). 그리고 클러스터 중심에서 가장 가까운 샘플을 하나의 클러스터로 묶습니다. 왼쪽 위부터 시계 방향으로 바나나 2개와 사과 1개 클러스터, 바나나 1개와 파인애플 2개 클러스터, 사과 2개와 파인애플 1개 클러스터가 만들어졌습니다. 클러스터에는 순서나 번호는 의미가 없습니다.

그 다음 클러스터의 중심을 다시 계산하여 이동시킵니다. 맨 아래 클러스터는 사과 쪽으로 중심이 조금 더 이동하고 왼쪽 위의 클러스터는 바나나 쪽으로 중심이 더 이동하는 식입니다.

클러스터 중심을 다시 계산한 다음 가장 가까운 샘플을 다시 클러스터로 묶습니다(②). 이제 3개의 클러스터에는 바나나와 파인애플, 사과가 3개씩 올바르게 묶여 있습니다. 다시 한번 클러스터 중심을 계산합니다. 그다음 빨간 점을 클러스터의 가운데 부분으로 이동시킵니다.

이동된 클러스터 중심에서 다시 한번 가장 가까운 샘플을 클러스터로 묶습니다(③). 중심에서 가장 가까운 샘플은 이전 클러스터(②)와 동일합니다. 따라서 만들어진 클러스터에 변동이 없으므로 k-평균 알고리즘을 종료합니다.

용어정리