코딩테스트 준비/알고리즘

LIS(Longest Increasing Subsequence - 최장 증가 수열) 알고리즘 (1)

떵목이 2021. 9. 3. 22:26

LIS(Longest Increasing Subsequence - 최장 증가 수열) (1)

https://www.acmicpc.net/problem/11053

 

11053번: 가장 긴 증가하는 부분 수열

수열 A가 주어졌을 때, 가장 긴 증가하는 부분 수열을 구하는 프로그램을 작성하시오. 예를 들어, 수열 A = {10, 20, 10, 30, 20, 50} 인 경우에 가장 긴 증가하는 부분 수열은 A = {10, 20, 10, 30, 20, 50} 이

www.acmicpc.net


!본 글에서는 최장 증가 수열의 길이만 구한다!

또한 본글에서 설명하는 알고리즘의 시간복잡도는 O(N^2)이므로 매우 느리다.

크기가 작은 배열에서 간단한 아이디어로 구현을 하고싶을 때 사용하기 바람.

 

1. LIS의 길이와 수열을 O(N^2)으로 구하는 방법 : 여기(링크)

2. LIS의 길이를 O(N*log(N))으로 구하는 방법 : 여기(링크)

3. LIS의 길이와 수열을 O(N*log(N))으로 구하는 방법 : 여기(링크)

 

LIS는 어떤 수열의 증가하는 부분 수열중 가장 긴 부분 수열을 찾는 알고리즘이다.

예를 들어 {10, 20, 10, 30, 20, 50}이라는 수열이 있을 때 가장 긴 증가하는 부분수열은 {10, 20, 30, 50}이 될 것이다. 

위 예제의 경우 길이가 짧아서 눈대중으로 금방 찾을 수 있고 간단한 아이디어로도 금방 해결할 수 있지만, 수열의 길이가 길어질 경우는 골치가 아파진다.

LIS는 이런 경우에서 쓸 수 있는 알고리즘이다.

 

설명


LIS는 기본적으로 Dynamic Programming(DP)를 이용한다. 

수열의 처음부터 시작하며 DP[index]에는 현재 index번째 값을 포함하여 가장 긴 증가수열의 길이를 저장한다.

때문에 DP[index]값에는 수열의 처음부터 index-1까지 작은 수의 DP값중 가장 큰 값+1을 저장하면 된다.

만약 작은 수가 없었다면 1을 저장한다.

얻은 DP값중 가장 큰 값이 이 알고리즘이 요구하는 답(가장 긴 증가수열의 길이)이다.

 

위에서 언급한 {10, 20, 10, 30, 20, 50}로 설명을 해보겠다.

 

 

1. {10, 20, 10, 30, 20, 50}

arr[0]이전에 arr[0]보다 작은 수는 없으므로 DP[0]에 1을 저장한다.

index 0 1 2 3 4 5
DP 1 0 0 0 0 0

2. {10, 20, 10, 30, 20, 50}

arr[1]이전에 arr[1]보다 작은 수의 DP값중 가장 큰 값은 1이므로 +1을한 2를 저장한다.

index 0 1 2 3 4 5
DP 1 2 0 0 0 0

3. {10, 20, 10, 30, 20, 50}

index 0 1 2 3 4 5
DP 1 2 1 0 0 0

4. {10, 20, 10, 30, 20, 50}

arr[3]이전에 arr[3]보다 작은 수의 DP값중 가장 큰 값은 2이므로 +1을한 3을 저장한다.

index 0 1 2 3 4 5
DP 1 2 1 3 0 0

위 과정들을 index가 5일때까지 마치면 저장된 DP는 다음과 같다.

index 0 1 2 3 4 5
DP 1 2 1 3 2 4

 

구한 DP값중 가장 큰 값은 4이므로 가장 긴 증가하는 부분수열의 길이는 4이다. 

 

구현


항상 하는 말이지만 DP는 아이디어를 뽑아내기가 어렵지 구현은 점화식만 쓰면 되기 때문에 쉽다.

int num[] // 숫자 배열
int dp[] //dp
int ans=0; // 답
for (int i = 0;i < n;i++) {
	int tmp = 0;
	for (int j = 1;j < i;j++) {
		if (num[j] < num[i]) {
			tmp = max(tmp, dp[j]);
		}
	}
	dp[i]=tmp;
    ans = max(dp[i],ans);
}

이로써 최장 증가 수열의 길이를 구해보았다. 이 코드를 그대로 쓰면 백준 11053번 (가장 긴 증가하는 부분 수열)을 해결할 수 있다!

 

그러나 이 알고리즘은 느리다.

index를 늘려가며 이중 for문을 돌기 때문에 O(N^2)의 시간이 걸린다고 할 수 있다. 

이는 num[]배열을 돌며(O(N)) 최적의(자기보다 작은데 dp값은 최대인)곳을 찾기 위해 num[]배열을 다시 돌기(O(N)) 때문인데, 최적의 위치를 찾는 것을 O(logN)으로 줄여 O(N*logN)으로 줄인 알고리즘의 설명은 여기(링크)에 있다. 반드시 본 글을 정확히 이해한 후 넘어가길 바란다.