크루스칼(Kruskal) 알고리즘
설명
크루스칼 알고리즘은 프림 알고리즘과 함께 그래프에서 MST(Minimum Spanning Tree)를 찾을 때 사용 되는 알고리즘이다. 알고리즘을 전개하는 과정에서 소속집단의 검색과 합병기능이 필요한데, 이를 위해 유니온파인드에 대한 선행 학습이 필요하다.
크루스칼 알고리즘은 사이클을 이루지 않고 크기가 작은 간선부터 탐색해 나아가는 방법을 사용한다. 이때, 사이클 생성 여부를 확인하기 위해 유니온 파인드를 사용한다.
다음과 같은 그래프가 있다.
위 그래프에 존재하는 모든 간선을 크기순으로 정렬한 뒤 사이클이 생기지 않는다면 선택한다.
현재 존재하는 간선 중 가장 크기가 작은 것은 정점3과 정점4를 잇는 간선이고, 이 간선을 선택해도 사이클이 생기지 않으므로 선택한다.
위 과정을 계속 반복하다보면 다음과 같은 상황을 마주친다. 이때, 선택되었던 간선들은 파란색으로 표시했다.
위 그림을 보면, 가중치의 크기순으로 선택하는 과정에서 현재 빨간색 간선을 보고있다.
그러나 정점5와 정점6을 잇는 순간, 정점3-정점4-정점6-정점5로 이루어진 사이클이 생기게 된다.
따라서 다음과 같은 과정을 이어나가게 된다.
이로써 MST를 찾아냈다. 위 과정으로 간선을 선택해 모든 정점으로 이루어진 Tree가 완성된다면, MST를 찾아낸 것이다. 또한, 이후 과정에서 마주치게 될 모든 간선들은 반드시 사이클을 이루게 만들기 때문에 선택되지 않는다.
따라서 구현의 과정에서 정점 V개에 대해 간선 V-1개가 이미 선택되었다면 더 이상 탐색을 하지 않는 방법을 통해 최적화를 진행할 수 있다.
구현
유니온 파인드에서 find, merge fucntion이 구현되어있어야 한다.
void kruskal(){
int num_edges = 0;
sort(edges.begin(), edges.end());
for(pair<int, int> edge : edges){
if(num_edges >= V-1) break;
if(find[edge.first] == find[edge.second]) continue;
merge(edge.first, edge.second);
is_selected[edge.first][edge.second] = is_selected[edge.second][edge.first] = true;
num_edges++;
}
}
시간복잡도
정점의 개수 V, 간선의 개수 E 일때, 각 단계의 유니온파인드 과정에서 소요되는 시간을 O(V)로 러프하게 잡아도 모든 간선을 정렬하는 과정에서 이미 O(ElogE)의 시간이 소요되기 때문에 전체 시간복잡도는 O(ElogE)로 표현될 수 있다.
또한, 만약 그래프가 Dense하다면, E = V^2 이므로, O(ElogV)로도 나타낼 수 있다.
추천문제
크루스칼 기본예제
응용 심화문제
유니온 파인드에 대한 선행이 되어있다면 어렵지 않게 이해할 수 있었다.
MST는 코딩테스트에서도 꽤나 자주 등장하는 만만한 알고리즘이기 때문에 학습해놓는 것이 좋다.