일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 힙
- 데코레이터
- 다대다
- 비관적락
- fetch
- 지연로딩
- 연결리스트
- 다대일
- BOJ
- SQL프로그래밍
- eager
- execute
- exclusive lock
- 낙관적락
- CHECK OPTION
- 즉시로딩
- 일대다
- dfs
- FetchType
- 백트래킹
- JPQL
- querydsl
- 동적sql
- shared lock
- 이진탐색
- 유니크제약조건
- 연관관계
- 스프링 폼
- 스토어드 프로시저
- PS
- Today
- Total
흰 스타렉스에서 내가 내리지
최단 경로 찾기 본문
- 최단 경로 알고리즘 유형에는 다양한 종류가 있는데, 상황에 맞는 효율적인 알고리즘이 이미 정립되어 있다.
- 다익스트라 최단 경로 알고리즘 ✅
- 플로이드 워셜 알고리즘 ✅
- 벨만 포드 알고리즘
# 다익스트라 최단 경로 알고리즘
- 그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘
- '음의 간선'이 없을 때 정상적으로 동작한다.
- 실제로 GPS 소프트웨어의 기본 알고리즘이다.
- 기본적으로 그리디 알고리즘으로 분류된다. 매번 '가장 비용이 적은 노드'를 선택해서 임의의 과정을 반복하기 때문
- 출발 노드를 설정한다.
- 최단 거리 테이블을 초기화한다
- 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택한다.
- 해당 노드를 거쳐 다른 노드로 가는 비용을 게산하여 최단 거리 테이블을 갱신한다.
- 위 과정에서 3과 4번을 반복한다.
- 다익스트라 알고리즘은 최단 경로를 구하는 과정에서, '각 노드에 대한 현재까지의 최단 거리' 정보를 항상 1차원 리스트에 저장하며 리스트를 계속 갱신한다.
- 다익스트라 알고리즘은 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 것으로 이해할 수 있다.
- 다익스트라 알고리즘은 정확히 이해하고, 코드에 숙달되어 있어야 한다!
# 방법 1. 간단한 다익스트라 알고리즘
- O(V^2)의 시간복잡도를 가지며, V는 노드의 개수를 의미한다.
- 단계마다 '방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택'하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차 탐색)한다.
- 총 O(V)번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색해야 하고, 현재 노드와 연결된 노드를 매번 일일이 확인하기 때문에, 시간 복잡도는 O(V^2)이다.
- 문제에서 전체 노드의 개수가 5,000개 이하라면 아래 코드로 가능하지만, 10,000개를 넘어가면 힘들다.
import sys
input = sys.stdin.readline
INF = int(1e9)
# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n+1)]
# 방문한 적이 있는지 체크하는 목적의 리스트를 만들기
visited = [False] * (n+1)
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)
# 모든 간선 정보를 입력받기
for _ in range(m):
a, b, c = map(int, input().split()) # a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b, c))
# 방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
def get_smallest_node():
min_value = INF
index = 0 # 가장 최단 거리가 짧은 노드(인덱스)
for i in range(1, n+1):
if distance[i] < min_value and not visited[i]:
min_value = distance[i]
index = i
return index
def dijkstra(start):
# 시작 노드에 대해서 초기화
distance[start] = 0
visited[start] = True
for j in graph[start]:
distance[j[0]] = j[1]
# 시작 노드를 제외한 전체 n-1 개의 노드에 대해 반복
for i in range(n-1):
# 현재 최단 거리가 가장 짧은 노드를 꺼내서, 방문 처리
now = get_smallest_node()
visited[now] = True
# 현재 노드와 연결된 다른 노드를 확인
for j in graph[now]:
cost = distance[now] + j[1]
# 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[j[0]]:
distance[j[0]] = cost
# 다익스트라 알고리즘 수행
dijkstra(start)
# 모든 노드로 가기 위한 최단 거리를 출력
for i in range(1, n+1):
# 도달할 수 없는 경우, 무한(INF)라고 출력
if distance[i] == INF:
print("INFINITY")
# 도달할 수 있는 경우 거리를 출력
else:
print(distance[i], end=' ')
# 방법 2. 개선된 다익스트라 알고리즘
- 이 방법은 최악의 경우에도 시간복잡도 O(E log V) 를 보장한다. 이때 V는 노드의 개수이고, E는 간선의 개수를 의미한다.
- 간단한 다익스트라 알고리즘은 '최단 거리가 가장 짧은 노드'를 찾기 위해서, 매번 최단 거리 테이블을 선형적으로(모든 원소를 앞에서부터 하나씩) 탐색해야 했다.
- 이 과정에서만 O(V)의 시간이 걸렸다.
- 이 방법에서는 최단거리가 가장 짧은 노드를 단순히 선형적으로 찾는 것이 아니라 더욱더 빠르게 찾을 수 있게 한다.
→ 힙 자료구조를 사용한다.
- 최단 거리에 대한 정보를 힙에 저장하면, 선형시간이 아닌 로그 시간이 걸린다.
* 힙
- 우선순위 큐 : 우선순위가 가장 높은 데이터를 가장 먼저 삭제
- 파이썬에서는 우선순위 큐가 필요할 때 PriorityQueue 혹은 heapq를 사용할 수 있는데, 이 두 라이브러리는 모두 우선순위 큐 기능을 지원한다.
- 데이터가 (가치, 물건)으로 구성되어 있을 때, 첫 번째 원소인 '가치' 값이 우선순위 값이 된다.
- 우선순위 큐를 구현할 때는 내부적으로 최소 힙 혹은 최대 힙 을 이용한다.
- 최소 힙은 값이 낮은 데이터가 먼저 삭제되며, 최대 힙을 이용하는 경우 값이 큰 데이터가 먼저 삭제된다.
- 파이썬에서는 최소 힙 구조를 사용하며, 다익스트라 알고리즘에서는 비용이 적은 노드를 우선으로 방문하므로 최소 힙 구조를 기반으로 하는 파이썬의 우선순위 큐 라이브러리를 그대로 사용하면 적합하다.
- 최소 힙을 최대 힙처럼 사용하기 위해서 일부러 우선순위에 해당하는 값에 음수 부호(-)를 붙여서 넣었다가, 나중에 우선순위 큐에서 꺼낸 다음에 다시 음수 부호(-)를 붙여서 원래의 값으로 돌리는 방식을 사용할 수 있다.
- 힙 자료구조는 삽입과 삭제에 모두 O(logN)의 시간복잡도를 가진다.
- 힙 자료구조에 N개의 데이터르 모두 넣으면 O(NlogN)이다.
- 최소 힙을 이용하는 경우 힙에서 원소를 꺼내면 '가장 값이 작은 원소'가 추출되는 특징이 있다.
* 힙 적용
- 파이썬의 heapq 라이브러리는 원소로 튜플을 입력받으면 튜플의 첫 번째 원소를 기준으로 우선순위 큐를 구성한다.
- 따라서 (거리, 노드) 순서대로 튜플 데이터를 구성해 우선순위 큐에 넣으면 거리순으로 정렬된다.
- 방법 1과 비교했을 때, get_smallest_node()라는 함수를 작성할 필요가 없다.
- '최단 경로가 가장 짧은 노드'를 선택하는 과정을 다익스트라 최단 경로 함수 안에서 우선순위 큐를 이용하는 방식으로 대체할 수 있기 때문이다.
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)
# 노드의 개수, 간선의 개수를 입력받기
n, m = map(int, input().split())
# 시작 노드 번호를 입력 받기
start = int(input())
# 각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트를 만들기
graph = [[] for i in range(n+1)]
# 최단 거리 테이블을 모두 무한으로 초기화
distance = [INF] * (n+1)
# 모든 간선 정보를 입력받기
for _ in range(m):
a, b, c = map(int, input().split())
# a번 노드에서 b번 노드로 가는 비용이 c라는 의미
graph[a].append((b, c))
def dijkstra(start):
q = []
# 시작 노드로 가기 위한 최단 경로는 0으로 설정하여, 큐에 삽입
heapq.heappush(q, (0, start))
distance[start] = 0
while q: # 큐가 비어있지 않다면
# 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
dist, now = heapq.heappop(q)
# 현재 노드가 이미 처리된 적이 있는 노드라면 무시
if distance[now] < dist:
continue
# 현재 노드와 연결된 다른 인접한 노드들을 확인
for i in graph[now]:
cost = dist + i[1]
# 현재 노드를 거쳐서, 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
dijkstra(start)
for i in range(1, n+1):
# 도달할 수 없는 경우, 무한(INF)라고 출력
if distance[i] == INF:
print("INF")
else:
print(distance[i], end=' ')
* 결론: 수행과정
- 시작 노드 번호 입력 받기, 각 노드에 연결되어 있는 노드 정보를 리스트에 저장
- 최단 거리 테이블을 모두 무한으로 초기화
- q 라는 리스트를 만들고, (거리, 노드) 즉 (0, start) 점 heappush
- distance[start] = 0
- 이제 whilq q: 로 계속 반복문 돌아
- heappop을 하고, 거기에 있던 거리 값이 저장되어 있는 거리 값보다 크면 무시. 이미 앞에서 처리했다는 뜻이므로
- for i in graph[now] 로, 꺼낸 노드에 연결된 모든 노드에 대하여,
- 새로운 거리 값을 만들고, 그거랑 비교해서 더 작다면, 교체하고, heappush
# 2. 플로이드 워셜 알고리즘
'모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우'
- 다익스트라처럼 단계마다 '거쳐 가는 노드' 를 기준으로 알고리즘을 수행한다.
- 하지만 매번 방문하지 않은 노드 중에서 최단 거리를 갖는 노드를 찾을 필요가 없다.
- 노드의 개수가 N개일 때, 알고리즘상으로 N번의 단계를 수행하며, 단계마다 O(N^2)의 연산을 통해 '현재 노드를 거쳐 가는' 모든 경로를 고려한다.
- 따라서 플로이드 워셜 알고리즘의 총 시간 복잡도는 O(N^3)이다.
- 다익스트라 알고리즘은 그리디 알고리즘인데 반해, 플로이드 워셜 알고리즘은 다이나믹 프로그래밍이라는 특징이 있다.
- N번 만큼의 단계를 반복하며 '점화식에 맞게' 2차원 리스트를 갱신하기 때문에 다이나믹 프로그래밍이라고 볼 수 있다.
" 'A에서 B로 가는 최소 비용'과 'A에서 K를 거쳐 B로 가는 비용' 을 비교하여 더 작은 값으로 갱신한다. "
-
INF = int(1e9)
# 노드의 개수 및 간선의 개수를 입력받기
n, m = map(int, input().split())
graph = [[INF]*(n+1) for _ in range(n+1)]
# 자기 자신에서 자기 자신으로 가는 비용은 0으로 초기화
for i, j in zip(range(1, n+1), range(1, n+1)):
graph[i][j] = 0
# 각 간선에 대한 정보를 입력받아, 그 값으로 초기화
for _ in range(m):
# A에서 B로 가는 비용은 C라고 설정
a, b, c = map(int, input().split())
graph[a][b] = c
# 점화식에 따라 플로이드 워셜 알고리즘을 수행
for k in range(1, n+1):
for a in range(1, n+1):
for b in range(1, n+1):
graph[a][b] = min(graph[a][b], graph[a][k]+graph[k][b])
# 수행된 결과를 출력
for a in range(1, n+1):
for b in range(1, n+1):
# 도달할 수 없는 경우, 무한이라고 출력
if graph[a][b] == INF:
print('INF', end=" ")
else:
print(graph[a][b], end=" ")
print()
* 결론: 수행과정
- 2차원 배열인 graph 생성
- 자기 자신은 0으로
- 주어진 각 간선들 그대로 넣기
- graph[a][b] = min(graph[a][b], graph[a][k]+graph[k][b])
# 다익스트라 vs 플로이드-워셜
- 다익스트라는 인접 리스트를 사용하고, 플로이드-워셜은 인접 행렬을 사용한다.
- 어떤 문제를 만나든, 메모리와 시간을 염두에 두고 알고리즘을 선택해서 구현하자.
- 예를 들어 최단 경로를 찾아야 하는 문제가 출제되었을 때,
- 노드의 개수가 적은 경우에는 플로이드 워셜 알고리즘을 이용할 수 있다.
- 노드와 간선의 개수가 모두 많으면 우선순위 큐를 이용하는 다익스트라 알고리즘을 이용하면 유리하다.
- 기타 그래프 알고리즘은 다음 포스트에서!
'Problem Solving' 카테고리의 다른 글
[노트]deque에서, 원소를 계속 pop하면서 순회할 경우 (0) | 2024.01.16 |
---|---|
(가설..) BFS - deque 일 경우와 heapq 일 경우 (1) | 2024.01.06 |
다이나믹 프로그래밍과 메모이제이션 (0) | 2023.12.27 |
Parametric Search의 전형적인 문제 - BOJ2805 (1) | 2023.12.26 |
파이썬 언어에서, 입력 데이터를 빠르게 입력 받기 (0) | 2023.12.26 |