[실전 알고리즘] 0x0A강 - 그리디_구버전

[실전 알고리즘] 0x0A강 - 그리디_구버전.pdf


------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

현재 보고있는 강의는 구버전입니다. 내용에는 문제가 없으나 리뉴얼 중이니 이 게시글을 참고해주세요.

------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------


거의 3주정도 잘 쉬고 왔습니다 ^___^ 그리디를 해봅시다.



그리디는 매번 선택에서 지금 가장 최적인 답을 근시안적으로 택하는 알고리즘입니다. 뒤의 예시를 보면 더 이해가 잘 갈 것입니다. 지금 강의 구성도 그렇지만 보통 다이나믹 프로그래밍과 묶어서 많이 배우게 되는 알고리즘입니다.


당연하겠지만 대다수의 경우 근시안적인 선택을 하는 그리디는 올바른 답을 주지 않습니다. 그러나 일부 문제에서는 그리디 알고리즘이 올바른 답을 주기 때문에 그리디를 이용해 시간복잡도를 줄일 수 있습니다.


그리디 알고리즘을 사용하려면 우선 해당 알고리즘이 성립함을 수학적으로 엄밀하게 증명해야 합니다. 그렇지 않고 그냥 감으로 때려맞춰서 코딩을 하면 WA만 누적시키고 시간을 버리게 될 수도 있습니다.


코딩테스트 수준에서는 학부 과정에서 언급되는 유명한 몇몇 예시 안에서 나올 가능성이 크고, 이번 강의에서도 그 정도 수준까지만 다룰 것입니다. 더 어려운 내용이 나오면 그냥 속으로 회사 욕하면서 한 99%의 사람들은 못풀었겠거니 생각하면 마음이 편안한 부분입니다 ㅎㅅㅎ


바로 실전 문제로 들어갑시다. BOJ 11047번 : 동전 0 문제입니다. 만약 $K$가 작았다면 이 문제를 DP로 해결할 수 있다는 사실을 알겠나요?


$D[i] = i$를 만들기 위해 필요한 동전의 최솟값이라고 해봅시다. 그러면 $D[i] = min(D[i-[A[0]], D[i-A[1]], D[i-A[2]], ...)+1$입니다. 그런데 이 경우 시간복잡도는 $O(NK)$이기 때문에 이 문제에서는 시간 초과가 발생할 것입니다. 이 문제는 그리디 알고리즘으로 해결해야 합니다.


직관적으로 생각해봅시다. 만약 10, 50, 100, 500원 동전들로 물건의 가격을 지불할 때 동전을 적게 소모하고 싶으면 어떤 방식으로 지불하나요? 일단 500원 동전을 최대한 많이 쓰고, 이후 100, 50, 10원 순으로 최대한 많이 쓸 것입니다. 이 방식이 가장 동전을 적게 소모하는 방법임을 증명할 수 있을까요?


다음 슬라이드부터 증명을 할 것인데, 그다지 어렵지 않지만 증명에 익숙하지 않으면 잘 이해가 안 갈수도 있습니다. 만약 그렇다면 이해를 포기하고 결론만 받아들이고 넘어가셔도 무방합니다.


첫 번째 보조정리는 "동전을 최소로 소모하면서 물건값을 지불하려면 10/100원 동전은 4개 이하, 50원 동전은 1개 이하로 사용되어야 한다." 입니다. 귀류법으로 증명을 저렇게 적어두긴 했지만, 생각해보면 굉장히 당연한 얘기입니다. 10/100원 동전을 5개 이상 사용하게 되면 50/500원 동전으로 대체하는게 더 이득이고 50원 동전을 2개 이상 사용하면 100원 동전으로 대체하는게 더 이득이니까요.


두 번째 보조 정리는 "동전을 최소로 소모하면서 물건값을 지불하려면 우선 500원 동전을 최대한 많이 사용해야 한다."입니다. 이는 첫 번째 보조 정리로부터 유도가 가능한데, 첫 번째 보조 정리로 인해 10, 50, 100원 동전으로는 물건값을 최대 490원까지밖에 감당할 수 없으니 500원 동전을 다 사용하지 않을 경우 10, 50, 100원 동전으로 물건 값을 500원 이상 감당해야 하는 상황이 되어서 마찬가지로 귀류법으로 두 번째 보조 정리를 증명할 수 있습니다.


Lemma 2를 통해 동전을 최소로 소모하면서 물건값을 지불하려면 우선 500원 동전을 최대한 많이 사용해야 한다는 사실을 알았습니다. 마찬가지 논리를 이용하면 500원 동전을 최대한 많이 사용한 이후에는 100원 동전을, 그 이후에는 50원을, 마지막으로 10원 동전을 최대한 많이 사용해야함을 증명할 수 있고, 그리디 알고리즘의 정당성 증명이 끝났습니다.


500/100/50/10원 동전을 일반화시킨 문제에서의 상황도 $A_i$가 $A_{i-1}$의 배수이기 때문ㅇ ㅔ동일한 방식으로 $A_{N-1}$부터 차례로 최대한 많이 사용하는 알고리즘이 성립하고, 또 정당성을 증명할 수 있습니다. 예시 코드를 참고하세요.


과연 동전 사이에 배수 관계가 성립하지 않을 때에도 동일한 그리디 알고리즘이 성립할까요? 직접 반례를 고민해보세요.


동전이 1원, 9원, 10원일 때 18원을 생각해보면 배수 관계가 아닐 떄에는 그리디 알고리즘이 성립하지 않음을 쉽게 알 수 있습니다.


두 번째 문제 BOJ 1931번 : 회의실배정을 풀어봅시다. 이 문제는 task scheduling problem이라고 불리기도 합니다.


일단 $O(N^2)$ DP를 알아봅시다. 이를 위해서는 우선 회의를 끝나는 시간이 빠른 순으로 정렬해야 합니다. 그리고 끝나는 시간이 같다면 시작 시간이 빠른 순으로 정렬합시다. 이후 $D[i] = i$번째 회의를 마지막으로 진행했을 때 최대 사용할 수 있는 회의의 수라고 해봅시다.


$D[i] = max(D[j])+1$ ($j$번째 회의의 끝나는 시간이 $i$번째 회의의 시작 시간 이상인 모든 $j$에 대해) 입니다.


그런데 이 경우 이중 for문을 돌면서 이전의 모든 회의를 확인해야하니 시간복잡도는 $O(N^2)$으로 이 문제에서는 시간 초과가 발생할 것입니다.


직관적으로 생각했을 때, 현재 $t$시간이라고 할 때 시작 시간이 $t$이상인 모든 회의 중에서 가장 먼저 끝나는 회의를 택하는 것이 가장 좋은 선택일 것 같습니다. 이를 증명해봅시다.


"현재 $t$시간이라고 할 때 시작 시간이 $t$이상인 모든 회의 중에서 가장 먼저 끝나는 회의를 택하는 것이 최적 해이다."라는 명제를 증명해봅시다. 이 명제의 증명 또한 귀류법으로 할 수 있습니다. 시작 시간이 $t$ 이상인 모든 회의 중에서 가장 먼저 끝나는 회의 $A$를 택하는 대신 $A$보다 늦게 끝나는 $B$를 택했을 때 더 많은 회의를 진행할 수 있었다고 가정해봅시다. 그런데 회의 $B$를 택해 진행한 스케쥴에서 회의 $B$ 대신 $A$를 사용해도 아무런 모순이 발생하지 않습니다. 그러므로 회의 $A$를 택해도 적어도 회의 $B$를 택했을 때 만큼의 회의는 진행할 수 있음이 보장됩니다. 그러므로 귀류법에 의해 명제는 참입니다.


그림으로 설명하면 이런 식입니다. 현재 파란색 선이 회의 $B$를 택함으로서 선택된 스케쥴입니다.


그런데 회의 $B$ 대신 $A$를 사용해도 아무런 모순이 발생하지 않습니다.


구현을 위해서는 우선 회의를 정렬해야 하는데 STL pair를 활용하면 쉽게 정렬할 수 있습니다. 이후 현재 시간에서 가능한 회의들 중에서 끝나는 시간이 가장 빠른 회의를 계속 고르면 됩니다. 직접 구현해보세요.(예시 코드)


만약 시작 시간을 고려하지 않고 끝나는 시간만을 고려해 정렬했을 경우 어떤 테스트케이스에 대해 문제가 생길지 고민해보세요. 해당 문제의 질문 게시판에 가면 이 질문에 대한 답을 얻을 수 있습니다.


마지막으로 다룰 문제는 BOJ 2217번 : 로프입니다. 이 문제는 앞의 두 문제처럼 학부 수업 시간에 다루는 유명한 그리디 예제는 아니지만 쉬운 난이도의 괜찮은 문제이기 때문에 소개드립니다.


당연하겠지만 $N$이 최대 10만이기 때문에 모든 로프조합을 다 해보는 $O(2^N)$ 알고리즘은 시간 내에 돌아갈 수 없습니다. 대신 그리디 알고리즘을 한 번 고민해봅시다.


로프를 $A$개 고르겠다고 미리 정했다고 칩시다. 그러면 주어진 $N$개의 로프 중에 어떤 것들을 고를건가요? 상식적으로 생각했을 때 가장 튼튼한 $A$개를 고를 것입니다. 이건 굳이 증명을 할 필요가 없을 정도로 당연한 얘기입니다.


달리 표현하면 로프를 $A$개 고를 경우 $W[N-A] \times A$ 만큼의 무게를 지탱할 수 있다는 의미입니다. (예시 코드)


맨 처음 설명했지만 다시 한 번 말하자면 그리디는 대다수의 문제에서 사용될 수 없는 알고리즘으로, 주어진 문제가 그리디로 풀릴 것 같다는 느낌이 들어도 엄밀하고 증명을 하고 사용해야 귀중한 시간을 날리지 않을 수 있습니다.


그리디로 풀 수 있을 것 같지만 그렇지 않은 예시를 몇 가지 들겠습니다.


첫 번째로 0/1 knapsack problem입니다. 부피 $K$까지 담을 수 있는 가방에 부피가 $A_i$, 가치가 $C_i$인 물건 $i = 1,2,3, ... , N$이 주어졌을 때 어떤 물건을 택해야 가방의 부피 제한을 만족하면서 가장 가치를 높일 수 있을까요?


일단 딱 떠오르는 그리디 알고리즘은 현재 가방에 넣을 수 있는 물건 중에서 부피 대비 가치가 높은 물건(즉 $C_i / A_i$가 큰 물건) 순으로 넣는 알고리즘입니다. 그러나 해당 알고리즘은 가방의 부피가 10이고 물건이 (6, 7), (5, 5), (5, 3)일 때 잘못 동작하게 됩니다.


이 문제의 정해는 $O(NK)$ DP 혹은 $O(2^N)$ 전수조사입니다.


두 번째 문제는 BOJ 1477번 : 휴게소 입니다. 뭔가 현재 휴게소가 없는 가장 긴 구간의 중점에 새로운 휴게소를 계속 세우면 될 것 같지만, 휴게소가 0개일 때 새로운 휴게소 2개를 세우는 과정을 생각해보면 바로 반례가 드러납니다. 정해는 $O(Nlg1000)$ 이분탐색입니다. 정확히는 parametric search라는 기법인데, 언젠가 대회 알고리즘 강의를 만든다면 거기엔 넣겠지만 이번 실전 알고리즘 강의에서는 다루지 않을 내용입니다. 


이번 강의에서 그리디 알고리즘에 대해 배웠고 대표적인 문제 3개를 다뤘습니다. 그리고 대다수의 문제에서 그리디 알고리즘을 사용할 수 없음을 알았습니다.


코딩테스트에서 그리디 알고리즘 문제가 나온다면 오늘 소개한 대표 문제 수준일 것입니다. 이 수준을 넘어서면 어차피 대부분의 사람이 풀어내지 못해 의미가 없습니다.


만약 시간이 넉넉하게 남았고 현재 보는 문제의 그리디 알고리즘을 찾은 것 같은데, 반례도 못 찾겠고 알고리즘의 정당성을 증명하지도 못하겠으면 일단 건너뛰고 다른 문제를 보는게 낫습니다. 그러나 시간이 촉박해 다른 문제를 고민할 시간이 부족하면 증명 없이 바로 코드로 옮기는게 낫습니다. 그대로 시험이 끝나느니 시도라도 해보는게 좋으니까요.


뻔한 얘기지만 그리디 문제를 많이 풀어보면 내가 세운 알고리즘의 반례를 찾는 능력도, 정당성을 유추하는 능력도 향상됩니다. 시간 남으면 문제 많이 풀어보세요.


  Comments
  • 비밀댓글입니다
  • 안녕하세요. 오늘도 공부 잘하구 갑니다. 오늘 앞 문제는 다 '그리디'라는 것을 보고 풀어서 그런지 수월하게 풀 수 있었어요! 재밌네요 ㅎㅎㅎ
    근데 1477번의 경우는 반례의 경우를 생각지도 못했네요 ㅠ 너무 단순히 생각해서 그런가... 아무튼 오늘도 배우고가요! 감사합니다!
  • 알고리즘 초보
    알고리즘 공부하는데 많은 도움을 얻고 있습니다. 감사합니다.공부하다가 질문이 있어서 댓글을 남깁니다.
    1. WA가 뭔가요??
    2. 처음엔 DP로 생각하고 풀다가 그리디로 넘어가는 것으로 이해했는데 맞나요??.
    • 1. WA = Wrong Answer, 즉 틀린 답을 의미합니다.

      2. 그리디는 본문의 내용처럼 현재 상태에서 가장 좋아보이는 것을 택하는 알고리즘으로, 운 좋게 이 방법으로 올바른 답을 얻을 수 있는 상황에서만 사용할 수 있습니다.

      예시 문제 1, 2번은 DP로부터 넘어왔지만 3번은 그렇지 않습니다. 즉 그리디로 풀 수 있는 문제의 유형은 DP처럼 보이는 것만 있는건 아니고 굉장히 다양합니다.
  • 그리디
    안녕하세요! 좋은 글 감사드립니다.
    본문을 읽다가 궁금증이 생겨서 댓글을 남깁니다.

    2번째 회의실 배정 문제에서 O(n^2) dp 풀이에서 4번째 줄에
    "j번째 회의의 끝나는 시간이 ii번째 회의의 시작 시간 이상인 모든 jj에 대해"
    에서 '이상'을 '이하'로 고쳐야 할 것 같은데 제대로 이해한 게 맞나요??
댓글 쓰기