(분할 정복) 병합 정렬(merge sort)

자료구조와 알고리즘 2020. 10. 31. 17:29

1. 병합 정렬 (merge sort)

재귀용법을 활용한 정렬 알고리즘
1. 리스트를 절반으로 잘라 비슷한 크기의 두 부분 리스트로 나눈다.
2. 각 부분 리스트를 재귀적으로 합병 정렬을 이용해 정렬한다.
3. 두 부분 리스트를 다시 하나의 정렬된 리스트로 합병한다.

직접 눈으로 보면 더 이해가 쉽다: https://visualgo.net/en/sorting

출처: 위키피디아

2. 알고리즘 이해

데이터가 네 개 일때 (데이터 갯수에 따라 복잡도가 떨어지는 것은 아니므로, 네 개로 바로 로직을 이해해보자.)
- 예: data_list = [1, 9, 3, 2]
  - 먼저 [1, 9], [3, 2] 로 나누고
  - 다시 앞 부분은 [1], [9] 로 나누고
  - 다시 정렬해서 합친다. [1, 9]
  - 다음 [3, 2] 는 [3], [2] 로 나누고
  - 다시 정렬해서 합친다 [2, 3] (여기까지 재귀용법)
  - 이제 [1, 9] 와 [2, 3]을 합친다.
    - 1 < 2 이니 [1]
    - 9 > 2 이니 [1, 2]
    - 9 > 3 이니 [1, 2, 3]
    - 9 밖에 없으니, [1, 2, 3, 9]

3. 알고리즘 구현

mergesplit 함수 만들기
- 만약 리스트 갯수가 한개이면 해당 값 리턴
- 그렇지 않으면, 리스트를 앞뒤, 두 개로 나누기
- left = mergesplit(앞)
- right = mergesplit(뒤)
- merge(left, right)
merge 함수 만들기
- 리스트 변수 하나 만들기 (sorted)
- left_index, right_index = 0
- while left_index < len(left) or right_index < len(right):
  - 만약 left_index 나 right_index 가 이미 left 또는 right 리스트를 다 순회했다면, 그 반대쪽 데이터를 그대로 넣고, 해당 인덱스 1 증가
  - if left[left_index] < right[right_index]:
    - sorted.append(left[left_index])
    - left_index += 1
  - else:
    - sorted.append(right[right_index])
    - right_index += 1

작은 부분부터 작성해서 하나씩 구현하기

프로그래밍 연습
어떤 데이터리스트가 있을 때 리스트를 앞뒤로 짜르는 코드 작성해보기 (일반화)

def split_func(data):
    medium = int(len(data) / 2)
    print (medium)
    left = data[:medium]
    right = data[medium:]
    print (left, right)

split_func([1, 5,  2, 4])

[1, 5] [2, 4]

재귀용법 활용하기

프로그래밍 연습

다음 문장을 코드로 작성해보기 (merge함수는 아직은 없는 상태, 있다고만 가정)

* mergesplit 함수 만들기

- 만약 리스트 갯수가 한개이면 해당 값 리턴

- 그렇지 않으면, 리스트를 앞뒤, 두 개로 나누기

- left = mergesplit(앞)

- right = mergesplit(뒤)

- merge(left, right)

def mergesplit(data):
    if len(data) <= 1:
        return data
    medium = int(len(data) / 2)
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    return merge(left, right)

merge 함수 만들기

목표: left 와 right 의 리스트 데이터를 정렬해서 sorted_list 라는 이름으로 return 하기
left와 right는 이미 정렬된 상태 또는 데이터가 하나임

def merge(left, right):
    merged = list()
    left_point, right_point = 0, 0
    
    # case1 - left/right 둘다 있을때
    while len(left) > left_point and len(right) > right_point:
        if left[left_point] > right[right_point]:
            merged.append(right[right_point])
            right_point += 1
        else:
            merged.append(left[left_point])
            left_point += 1

    # case2 - left만 남았을때
    while len(left) > left_point:
        merged.append(left[left_point])
        left_point += 1
        
    # case3 - right만 남았을때
    while len(right) > right_point:
        merged.append(right[right_point])
        right_point += 1
    
    return merged


def mergesplit(data):
    if len(data) <= 1:
        return data
    medium = int(len(data) / 2)
    left = mergesplit(data[:medium])
    right = mergesplit(data[medium:])
    print(left)
    print(right)
    return merge(left, right)

import random

data_list = [100,200,3,4,5,6,7]
mergesplit(data_list)

[200]

[3]

[100]

[3, 200]

[4]

[5]

[6]

[7]

[4, 5]

[6, 7]

[3, 100, 200]

[4, 5, 6, 7]

Out[10]:

[3, 4, 5, 6, 7, 100, 200]

여기서 입력된 데이터가 [100, 200, 3, 4, 5, 6, 7] 이었는데 왜 print(left)에 200이 먼저 나올까 한참을 고민했다.

처음에 mergesplit(data[:medium])에서 data 값은 [100, 200, 300]이고 이는 곧 [100], [200, 3]으로 나뉜다.

print(left)가 실행 되기전 right가 실행되어 [200, 3]을 [200], [3]으로 나뉘고 print(left)가 실행되기 때문에 [200], [30], [100] 순서로 실행되는 것.

함수는 stack 구조라는 것을 생각한다면 이해하기 수월.

4. 알고리즘 분석

알고리즘 분석은 쉽지 않음, 이 부분은 참고로만 알아두자.
- 다음을 보고 이해해보자
  - 몇 단계 깊이까지 만들어지는지를 depth 라고 하고 i로 놓자. 맨 위 단계는 0으로 놓자.
    - 다음 그림에서 n/ $2^{2}$ 는 2단계 깊이라고 해보자.
    - 각 단계에 있는 하나의 노드 안의 리스트 길이는 n/ $2^{2}$ 가 된다.
    - 각 단계에는 $2^{i}$ 개의 노드가 있다.
  - 따라서, 각 단계는 항상 $2^{i} * \frac{n}{2^{i}} = O (n)$
  - 단계는 항상 $l o g_{2} n$ 개 만큼 만들어짐, 시간 복잡도는 결국 O(log n), 2는 역시 상수이므로 삭제
  - 따라서, 단계별 시간 복잡도 O(n) * O(log n) = O(n log n)

'자료구조와 알고리즘' 카테고리의 다른 글

순차탐색 (0)	2020.11.01
(분할 정복) 이진 탐색 (0)	2020.11.01
(분할 정복) 퀵 정렬 (0)	2020.10.31
동적 계획법과 분할 정복 (0)	2020.10.31
공간 복잡도 (0)	2020.10.30

ABOUT ME

개발자 개발자

1. 병합 정렬 (merge sort)

2. 알고리즘 이해

3. 알고리즘 구현

작은 부분부터 작성해서 하나씩 구현하기

재귀용법 활용하기

merge 함수 만들기

4. 알고리즘 분석

'자료구조와 알고리즘' 카테고리의 다른 글

티스토리툴바

ABOUT ME

1. 병합 정렬 (merge sort)

2. 알고리즘 이해

3. 알고리즘 구현

작은 부분부터 작성해서 하나씩 구현하기

재귀용법 활용하기

merge 함수 만들기

4. 알고리즘 분석

'자료구조와 알고리즘' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바