1. 알고리즘 공부
저번 주차는 스택과 큐까지 정리 했다. 이번 주차에 공부한 내용을 정리하려한다.
정렬
정렬은 데이터를 정해진 기준에 따라 기준에 따라 배치해 의미있는 구조로 재설정하는 것을 말한다.
버블 정렬
버블 정렬은 두 인접한 데이터의 크기를 비교해 정렬하는 방법이다. 시간복잡도는 O(n^2)으로 다른 정렬 알고리즘보다 속도가 느린 편이다. 루프를 돌면서 인접한 데이터 간의 swap연산으로 정렬한다.
버블 정렬 과정
- 1. 비교연산이 필요한 루프 범위를 설정한다.
- 2. 인접한 데이터 값을 비교한다.
- 3. swap 조건에 부합하면 swap 연산을 진행한다.
- 4. 루프 범위가 끝날 때까지 2 ~ 3을 반복한다.
- 5. 정렬 영역을 설정한다. 다음 루프를 실행할 때는 이 영역을 제외한다.
- 6. 비교 대상이 없을 때까지 1 ~ 5를 반복한다.
만약 특정한 루프의 전체 영역에서 swap이 한 번도 일어나지 않았다는 것은 그 영역의 데이터가 모두 정렬됐다는 뜻이므로 프로세스를 종료해도 된다.
선택 정렬
선택 정렬은 대상 데이터에서 최대나 최소 데이터를 데이터가 나열된 순으로 찾아가며 선택하는 방법이다. 선택 정렬은 구현 방법이 복잡하고 시간 복잡도도 O(n^2)의 효율적이지 않아 코딩 테스트에서는 많이 사용하지 않는다.
선택 정렬 과정
- 1. 남은 정렬 부분에서 최솟값 또는 최댓값을 찾는다.
- 2. 남은 정렬 부분에서 가장 앞에 있는 데이터와 선택된 데이터를 swap한다.
- 3. 가장 앞에 있는 데이터의 위치를 변경해 (index++) 남은 정렬 부분의 범위를 축소한다.
- 4. 전체 데이터의 크기만큼 index가 커질 때까지, 즉 남은 정렬 부분이 없을 때까지 반복한다.
삽입 정렬
삽입 정렬은 이미 정렬된 데이터 범위에 정렬되지 않은 데이터를 적절한 위치에 삽입시켜 정렬하는 방식이다. 평균 시간 복잡도는 O(n^2)으로 느린 편이지만 구현하기가 쉽다. 적절한 삽입 위치를 탑색하는 부분에서 이진 탐색 등과 같은 탐색 알고리즘을 사용하면 시간 복잡도를 줄일 수 있다.
삽입 정렬 과정
- 1. 현재 index에 있는 데이터 값을 선택한다.
- 2. 현재 선택한 데이터가 정렬된 데이터 범위에 삽입될 위치를 탐색한다.
- 3. 삽입 위치부터 index에 있는 위치까지 shift 연산을 수행한다.
- 4. 삽입 위치에 현재 선택한 데이터를 삽입하고 index++ 연산을 수행한다.
- 5. 전체 데이터의 크기만큼 index가 커질 때까지, 즉 선택할 데이터가 없을 때까지 반복한다.
퀵 정렬
퀵 정렬은 기준값을 선정해 해당 값보다 작은 데이터와 큰 데이터로 분류하는 것을 반복해 정렬하는 알고리즘이다. 기준 값이 어떻게 선정되는지가 시간 복잡도에 많은 영향을 미치고, 평균적인 시간 복잡도는 O(nlogn)이다. 퀵 정렬의 시간 복잡도는 비교적 준수하므로 코딩 테스트에서도 종종 응용한다.
퀵 정렬 과정
- 1. 데이터를 분할하는 pivot을 설정한다.
- 2. pivot을 기준으로 다음 a~e 과정을 거쳐 데이터를 2대의 집합으로 분리한다.
- a. start가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면 start를 오른쪽으로 1칸 이동한다.
- b. end가 가리키는 데이터가 pivot이 가리키는 데이터보다 크면 end를 왼쪽으로 1칸 이동한다.
- c. start가 가리키는 데이터가 pivot이 가리키는 데이터보다 크고 end가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면 start, end가 가리키는 데이터를 swap하고 start는 오른쪽, end는 왼쪽으로 1칸씩 이동한다.
- d. start와 end가 만날 때까지 a~c를 반복한다.
- e. start와 End가 만나면 만난 지점에서 가리키는 데이터와 pivot이 가리키는 데이터를 비교하여 pivot이 가리키는 데이터가 크면 만난 지점의 오른쪽에, 작으면 만난 지점의 왼쪽에 pivot이 가리키는 데이터를 삽입한다.
- 3. 분리 집합에서 각각 다시 pivot을 산정한다.
- 4. 분리 집합이 1개 이하가 될때까지 과정 1~3을 반복한다.
병합 정렬
병합 정렬은 분할 정복 방식을 사용해 데이터를 분할하고 분할한 집합을 정렬하며 합치는 알고리즘이다. 병합 정렬의 시간 복잡도 평균값은 O(nlogn)이다.
-> 2개의 그룹을 병합하는 원리를 외워야한다.
투 포인터 개념을 사용하여 왼쪽, 오른쪽 그룹을 병합한다. 왼쪽 포인터와 오른쪽 포인터의 값을 비교하여 작은 값을 결과 배열에 추가하고 포인터를 오른쪽으로 한 칸 이동시킨다. 반드시 숙지할 것
기수 정렬
값을 비교하지 않는 대신 값을 놓고 비교할 자릿수를 정한 다음 해당 자릿수만 비교한다. 기수 정렬의 시간 복잡도는 O(kn)으로 k는 데이터의 자릿수를 말한다.
-> 일의 자릿수 기준으로 배열 원소를 큐에 집어넣고 0번째 큐부터 9번째 큐까지 pop을 진행한다. 이를 십의 자릿수 기준으로 다시 진행하여 마지막 자릿수를 기준으로 정렬할 때까지 앞의 과정을 반복한다.
탐색
탐색은 주어진 데이터에서 자신이 원하는 데이터를 찾아내는 알고리즘을 말한다. 주어진 데이터의 성질(정렬 데이터 또는 비정렬 데이터)에 따라 적절한 탐색 알고리즘을 선택하는 것이 중요하고, 실제 모든 코딩 테스트 문제의 기본이 되는 알고리즘이므로 직접 구현해 원리를 완벽히 이해하는 것이 중요하다.
깊이 우선 탐색(DFS)
깊이 우선 탐색은 그래프 완전 탐색 기법 중 하나다. 기핑 우선탐색은 그래프의 시작 노드에서 출발하여 탐색할 한 쪽 분기를 정하여 최대 깊이까지 탐색을 마친 후 다른 쪽 분기로 이동하여 다시 탐색을 수행하는 알고리즘이다. DFS는 그래프 완전 탐색 알고리즘으로서 재귀함수로 구현하거나 혹은 스택 자료구조를 이용해서 구현한다. 시간 복잡도는 노드 수: V, 엣지 수: E를 합쳐 O(V + E)이다.
깊이 우선 탐색은 실재 구현 시 재귀함수를 이용하기 때문에 스택 오버플로에 유의해야한다. 깊이 우선 탐색을 응용하여 풀 수 있는 문제는 단절점 찾기, 단절선 찾기, 사이클 찾기, 위상정렬 등이 있다.
DFS는 한 번 방문한 노드를 다시 방문해선 안되므로 노드 방문 여부를 체크할 배열이 필요하며 그래프는 인접리스트로 표현한다. DFS의 탐색 방식은 후입 선출 특성을 가진다.
깊이 우선 탐색 과정
- 1. 시작할 노드를 정한 후 사용할 그래프와 방문 배열을 초기화한다.
- 2. 노드에 접근한 뒤 방문 배열에 체크를 하고 인접 리스트에 존재하는 노드를 재귀함수를 통해 접근한다.
- 3. 재귀함수에 끝나는 조건에 접근할 때까지 1~ 2를 반복한다.
너비 우선 탐색(BFS)
너비 우선 탐색도 그래프를 완전 탐색하는 방법 중 하나로 시작 노드에서 출발해 시작 노드를 기준으로 가까룬 노드를 먼저 방문하면서 탐색하는 알고리즘이다. 너비 우선 탐색은 선입 선출 방식으로 탐색하므로 큐를 이용해 구현한다. 또한 너비 우선 탐색은 탐색 시작 노드와 가까운 노드를 우선하여 탐색하므로 목표 노드에 도착하는 경로가 여러 개일 떄 최단 경로를 보장한다.
깊이 우선 탐색 과정
- 1. 시작할 노드를 정한 후 사용할 그래프와 방문 배열, 큐를 초기화한다.
- 2. 큐에서 노드를 꺼내면서 인접 노드를 큐에 삽입한다. 이 때 방문 배열을 체크하여 이미 방문한 노드는 큐에 삽입하지 않는다. 또한 큐에서 꺼낸 노드는 탐색 순서에 기록한다.
- 3. 큐에 노드가 없을 때까지 1~ 2를 반복한다.