JUFAFA의 주저리

2015년 9월 10일 목요일

정렬 알고리즘(Sort Algorithm) (8) - 퀵 정렬(Quick Sort)

상위 글 : 정렬 알고리즘(Sort Algorithm)
1. 퀵 정렬(Quick Sort)?
한 원소를 축으로 하여 축보다 작은 원소는 축보다 앞에 위치시키고, 축보다 큰 원소는 축보다 뒤에 위치 시킵니다. 그 다음, 축의 앞부분과 축의 뒷부분을 각각 같은 방법으로 반복해줘서 정렬하는 방법이 퀵 정렬입니다.

2. 퀵 정렬의 실제

데이터를 가지고 직접 퀵 정렬을 해봅시다. (여기서는 축을 구간의 가장 뒤의 원소로 잡습니다)

1. 축을 설정한다.

2. 축보다 작은 원소는 앞쪽으로, 축보다 큰 원소는 뒷쪽으로 배치한다.

2-1. 앞쪽에서 축보다 큰 원소를 찾고, 뒤쪽에서 축보다 작은 원소를 찾은 뒤 교환해준다.

2-2. 두 검색점이 만나게 되면, 만나게 된 지점과 축을 교환해준다.

3. 축을 중심으로 앞쪽, 뒷쪽을 분할하여 다시 1~2를 반복한다.

3. C를 이용한 구현

4. 축으로 어떤 원소를 설정해야하는가? 퀵 정렬은 축을 어떤 원소로 설정하느냐에 따라 속도차이가 발생한다. 예를 들어 축이 가장 작은 원소나 가장 큰 원소일 경우, 분할의 의미가 없어지게 된다. 이렇게 될 경우 정렬하는데 소요되는 시간이 늘어나고 -> O(N^2), 심할 경우에는 함수 호출의 누적으로 인한 Stack Overflow가 발생할 수 있다. 이를 해결하기 위해서는 중간값을 갖는 원소를 축으로 설정하는 경우가 최적이겠지만, 중간값을 찾는데도 시간이 소모되기 때문에, 다음과 같은 방법들이 이용된다.

1. 랜덤으로 축을 지정.
축을 랜덤으로 지정할 경우 가장 작은 원소나 가장 큰 원소를 축으로 설정할 확률이 낮아지기 때문에 최악의 상황을 피할 수 있다.

2. 구간내 맨 앞의 원소, 중간에 위치하는 원소, 맨 뒤의 원소중에서 중간값으로 축을 지정.
이 방법을 사용할 경우 최악의 경우 일지라도 축보다 작은 값과 큰 값이 항상 하나씩 존재하게 되기 때문에 축을 중심으로 배치하는데 걸리는 시간을 조금이나마 줄일 수 있다.

이외에도 여러가지 방법이 있을 수 있고, 퀵정렬에서 축을 어떤 원소로 지정하느냐는 속도에 큰 영향을 중요한 문제이므로, 상황에 따라 적절한 방법을 이용하자.

※ 축을 나눌때 같은 값이 존재하는 경우에는 둘로 나누기 위해서 작은 쪽이나 큰 쪽에 포함되도록 해야한다.

정렬 알고리즘(Sort Algorithm) (7) - 힙 정렬(Heap Sort)

상위 글 : 정렬 알고리즘(Sort Algorithm)
1. 힙 정렬(Heap Sort)?
힙 정렬은 우선 순위 큐인 힙을 이용하여, 모든 원소를 힙에 집어넣었다가 빼는 방식으로 정렬을 하는 알고리즘 입니다.

1.1 힙이란?
이진 트리 형태로 윗쪽의 원소들이 아래쪽의 원소보다 작은 형태(Min Heap의 경우)로 저장하는 자료구조이다.

(이진 트리)

(Min Heap의 예 : 뿌리 1을 중심으로 아래쪽의 원소들은 위쪽의 원소보다 작다)

※ 이 글에서는 Min Heap을 기준으로 설명합니다.

1.2 힙에 원소를 추가하기
힙에 원소를 추가할 때는 가장 말단에 원소를 추가한 뒤 위쪽의 원소와 비교하면서 그보다 작을 경우 교환을 위쪽의 원소가 작은 경우나 뿌리에 도달할 때까지 반복하는 과정을 통해 원소를 추가하게 된다. 트리의 높이는 log N이므로 시간복잡도는 O(log N)이 된다.

1.3 힙에서 원소를 꺼내기
힙에 원소를 꺼낼 때에는 뿌리의 원소를 꺼낸 후 힙의 구조를 유지하기 위해 가장 말단의 원소를 뿌리로 옮긴 후 아래노드와 비교하여 자신이 작을 경우 교환하게 됩니다. 최악의 경우 트리의 가장 아래로 이동하게 되고, 트리의 높이는 log N이므로 시간복잡도는 O(log N)이 됩니다.

2. C를 이용한 구현

2015년 9월 8일 화요일

정렬 알고리즘(Sort Algorithm) (6) - 기수 정렬(Radix Sort)

상위 글 : 정렬 알고리즘(Sort Algorithm)
1. 기수 정렬(Radix Sort)?
기수 정렬은 정수의 자리수의 숫자를 기준으로 큐에 넣어서 순서대로 꺼내는 방식으로 정렬을 기준이 되는 자리수를 바꿔가면서 정렬을 하는 알고리즘입니다.

2. 예시

데이터를 가지고 직접 기수 정렬을 해봅시다.

1. 일의 자리수를 기준으로 각 자리수 큐에 넣는다.

큐


					35
0	1	2	3	4	5	6	7	8	9

큐


	31				35
0	1	2	3	4	5	6	7	8	9

큐

					55
	31				35
0	1	2	3	4	5	6	7	8	9

큐

	41				55
	31				35
0	1	2	3	4	5	6	7	8	9

큐

	41				55
	31			54	35
0	1	2	3	4	5	6	7	8	9

큐

	41				55
	31			54	35				49
0	1	2	3	4	5	6	7	8	9

2. 각 큐에 들어간 원소들을 순서대로 꺼낸다.

149

큐

	41				55
	31			54	35				49
0	1	2	3	4	5	6	7	8	9

149

큐

					55
	41			54	35				49
0	1	2	3	4	5	6	7	8	9

큐

					55
				54	35				49
0	1	2	3	4	5	6	7	8	9

큐

					55
					35				49
0	1	2	3	4	5	6	7	8	9

큐


					55				49
0	1	2	3	4	5	6	7	8	9

큐


									49
0	1	2	3	4	5	6	7	8	9

3. 기준이 되는 자리수를 바꿔서 반복한다.

큐


			31
0	1	2	3	4	5	6	7	8	9

큐


			31	41
0	1	2	3	4	5	6	7	8	9

큐


			31	41	54
0	1	2	3	4	5	6	7	8	9

큐

			35
			31	41	54
0	1	2	3	4	5	6	7	8	9

큐

			35		55
			31	41	54
0	1	2	3	4	5	6	7	8	9

큐

			35	49	55
			31	41	54
0	1	2	3	4	5	6	7	8	9

큐

			35	49	55
			31	41	54
0	1	2	3	4	5	6	7	8	9

큐

				49	55
			35	41	54
0	1	2	3	4	5	6	7	8	9

큐

				49	55
				41	54
0	1	2	3	4	5	6	7	8	9

큐

					55
				49	54
0	1	2	3	4	5	6	7	8	9

큐

					55
					54
0	1	2	3	4	5	6	7	8	9

큐


					55
0	1	2	3	4	5	6	7	8	9

3. C를 이용한 구현

다음은 큐를 사용하지 않고, 자릿수 숫자를 세는 방식으로 기수 정렬을 행하는 방식이다.

4. 비트를 이용한 기수 정렬
정수의 자릿수가 아닌 비트 몇개를 단위로 하여 기수 정렬을 행하는 방식으로 정수이외의 경우에도 정렬을 행할 수 있다. 단, 이 경우 HEX코드값에 따라 대소가 구분이 가능한 경우만 가능하다.

2015년 9월 3일 목요일

정렬 알고리즘(Sort Algorithm) (5) - 셸 정렬(Shell Sort)

상위 글 : 정렬 알고리즘(Sort Algorithm)
1. 셸 정렬(Shell Sort)?
셸 정렬은 삽입 정렬의 단점인 원소를 적합한 위치에 삽입하기 위해 원소들을 뒤로 옮기는 과정을 줄이기 위해, 특정한 거리씩 떨어진 원소들끼리 삽입정렬을 하고, 그 거리을 차츰 줄여나가면서, 최종적으로는 전체 원소들에 대해 삽입정렬을 하는 알고리즘입니다.

※ 삽입 정렬에 대한 내용은 정렬 알고리즘(Sort Algorithm) (4) - 삽입 정렬(Insertion Sort)(http://jufafa.blogspot.kr/2015/09/sort-algorithm-4-insertion-sort.html )를 참조해주세요.

2. 예시

데이터를 가지고 직접 셸 정렬을 해봅시다. (여기서는 원소간 거리가 3, 1로 줄어드는 경우로 합니다.)

1. 거리가 3만큼 떨어진 원소끼리 삽입 정렬을 한다.

삽입할 원소 : 3

삽입할 원소 :

삽입할 원소 : 7

삽입할 원소 :

삽입할 원소 : 8

삽입할 원소 :

2. 거리가 1만큼 떨어진 원소끼리 삽입 정렬을 한다.

삽입할 원소 : 1

삽입할 원소 :

삽입할 원소 : 8

삽입할 원소 :

삽입할 원소 : 5

삽입할 원소 :

삽입할 원소 : 7

삽입할 원소 :

삽입할 원소 : 9

삽입할 원소 :

3. 특징

셸정렬은 인접한 원소간의 정렬이 아닌 떨어진 원소간의 정렬로 인해 같은 우선순위를 갖는 원소간의 순서가 보존되지 않는다.

4. C를 이용한 구현

다음 코드는 원소간 거리를 데이터의 절반에서 부터 시작하여, 정렬이 완료될 때까지 반으로 나눠가는 방법을 사용하였다.

4. 원소간 거리를 어떻게 정해야 하는가?
셸 정렬의 기본전략은 삽입정렬 과정에서 원소를 뒤로 옮기는 횟수를 줄이는 것으로 속도를 향상시키는데 있다. 하지만, 삽입정렬 횟수가 너무 많거나, 적게 된다면, 이러한 효과가 떨어진다. 때문에 원소간 거리에 대한 최적화된 수열을 사용한다면 속도를 더욱 향상시킬 수 있게된다.

정렬 알고리즘(Sort Algorithm) (4) - 삽입 정렬(Insertion Sort)

상위 글 : 정렬 알고리즘(Sort Algorithm)
1. 삽입 정렬(Insertion Sort)?
삽입 정렬은 원소들을 정렬된 영역에서 원소가 들어갈 위치를 찾아서 삽입하는 과정을 반복하여 정렬을 행하는 알고리즘입니다.

2. 예시

데이터를 가지고 직접 삽입 정렬을 해봅시다.

1. 삽입할 원소를 기억해둔다.

삽입할 원소 : 1
2. 정렬된 구간(삽입된 원소의 앞쪽 구간)에서 원소가 삽입될 위치를 찾으면서, 삽입될 공간을 확보하기 위해 원소들을 뒤로 옮겨준다.

삽입할 원소 : 1

3. 삽입될 위치를 찾았으면, 기억해둔 원소를 넣는다.

삽입할 원소 :

4. 1~3을 반복한다.

삽입할 원소 : 3

삽입할 원소 :

삽입할 원소 : 8

삽입할 원소 :

삽입할 원소 : 7

삽입할 원소 :

3. 특징
삽입정렬은 원소를 정렬된 영역에 추가로 삽입하는 동작을 반복하기 때문에, 이미 정렬된 배열은 매우 짧은 시간에 정렬작업이 완료된다. 또한, 정렬된 배열에 이미 원소가 추가되는 형태의 경우, 추가된 원소에 대해서만 정렬을 수행하게 되는 특징이 있다. 하지만, 반대로 정렬된 배열의 경우 모든 원소들에 대해 비교 연산을 수행하게 되어 최악수행시간이 된다. 최악의 경우 이미 정렬된 배열에 대해 비교연산을 전부 수행하므로 1+2+3+...+N이 되어 O(N^2)이 된다.

4. C를 이용한 구현

삽입될 원소가 이미 정렬된 원소들보다 작은 경우 배열의 밖을 참조하려고 하는 일이 발생할 수 있으므로, 예외처리가 필요하다. 이를 하지 않고 맨앞에 매우 작은 값으로 '보초'를 넣는 기법도 생각해 볼 수 있으나, 상황에 따라 이것이 불가능 할 수 있으므로, 주의가 필요하다.