본문 바로가기
코딩 테스트/그래프

[개념] 그래프 이론

by 서영선 2023. 8. 13.

 

그래프란 노드와 노드 사이에 연결된 간선의 정보를 가지고 있는 자료구조를 의미한다.

 

알고리즘 문제를 접했을 때, '서로 다른 개체가 연결되어 있다' 는 이야기를 들으면 가장 먼저 그래프 알고리즘을 떠올려야 한다. 예를 들어 '여러 개의 도시가 연결되어 있다' 와 같은 내용이 등장하면 그래프 알고리즘을 의심해보자

 

 

더불어 그래프 자료구조 중 트리 자료구조는 다양한 알고리즘에서 사용되므로 꼭 기억해두자

  그래프 트리
방향성 방향 그래프 혹은 무방향 그래프 방향 그래프
순환성 순환 및 비순환 비순환
루트 노드 존재 여부  루트 노드가 없음 루트 노드가 존재
노드간 관계성 부모와 자식 관계 없음 부모와 자식 관계
모델의 종류 네트워크 모델 계층 모델

 

 

또한 그래프의 구현 방법은 2가지 방식이 존재한다. 

1. 인접 행렬 : 2차원 배열을 사용하는 방식

0: (6) [0, 0, 0, 0, 0, 0]
1: (6) [0, 0, 1, 1, 1, 0]
2: (6) [0, 1, 0, 1, 0, 1]
3: (6) [0, 0, 0, 0, 1, 0]
4: (6) [0, 0, 1, 0, 0, 1]
5: (6) [0, 0, 0, 0, 0, 0] 

 

2. 인접 리스트: 리스트를 사용하는 방식

0: []
1: [2, 3, 4]
2: [1, 3, 5]
3: [4]
4: [2, 5]
5: []

 

2가지 모두 그래프 알고리즘에서 매우 많이 사용된다. 두 방식은 메모리와 속도 측면에서 구별되는 특징을 가진다. 

 

노드의 개수가 V, 간선의 개수가 E인 그래프를 생각해보자. 인접 행렬을 이용하는 방식은 간선 정보를 저장하기 위해 O(V^2) 만큼 메모리의 공간이 필요하다. 반면에 인접 리스트를 이용할 때는 간선의 개수 만큼인 O(E) 만큼만 메모리 공간이 필요하다.

 

인접행렬은 특정한 노드 A에서 다른 특정한 노드 B로 이어진 간선의 비용을 O(1)의 시간으로 즉시 알 수 있다는 장점이 있으며, 반면에 인접 리스트를 이용할 때는 O(V)만큼의 시간이 소요된다.

 

플로이드 워셜 알고리즘은 인접 행렬을 이용하는 방식이다. 

노드의 개수가 적은 경우에는 플로이드 워셜 알고리즘을, 노드와 간선의 개수가 모두 많으면 우선순위 큐를 이용하는 다익스트라 알고리즘을 이용하면 유리하다.

 

 

 


📌기타 그래프 알고리즘

 

 

 

1. 서로소 집합

: 공통 원소가 없는 두 집합을 의미하는 서로소 집합은 서로소 집합 자료구조에 필요한 개념이다. 서로소 집합 자료구조란 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조라고 할 수 있다. 서로소 집합 자료구조는 unionfind 이 2개의 연산의로 조작할 수 있다.

 

union 연산은 2개의 원소가 포함된 집합을 하나의 집합으로 합치는 연산이다.

find 연산은 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산이다.

 

서로소 집합 자료구조를 구현할 때는 트리 자료구조를 이용하여 집합을 표현하는데, 서로소 집합 정보가 주어졌을 때 트리 자료구조를 이용해서 집합을 표현하는 서로소 집합 계산 알고리즘은 다음과 같다.

 

1. union(합집합) 연산을 확인하여, 서로 연결된 두 노드 A, B를 확인한다.

     ▶  A와 B의 루트 노드 A', B'를 각각 찾는다.

     ▶  A' 를 B' 의 부모 노드로 설정한다.

2. 모든 union(합집합) 연산을 처리할 때까지 1번 과정을 반복한다.

 

이것을 트리를 이용해 서로소 집합을 계산하는 알고리즘이다. 또한 실제로 구현할 때는 A' 와 B'  중에서 더 번호가 작은 원소가 부모 노드가 되도록 구현하는 경우가 많으므로, 이 책에서도 그러한 구현 방식을 따르도록 하겠다. 

 

union 1, 4 :  1과 4는 각각 같은 집합 

 

따라서, union 1,4    union 2,3   union 2,4   union5,6  이 4개의 연산이 있으면,  6개의 노드에 4개의 간선이 있다는 의미이다.

 

 

 

 

기본적인 서로소 집합 알고리즘 소스 코드

# 기본적인 서로소 집합 알고리즘 소스코드
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        return find_parent(parent, parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


# 노드의 개수와 간선의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v+1)  # 부모 테이블 초기화

# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end=' ')
for i in range(1, v+1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력
print('부모 테이블: ', end=' ')
for i in range(1, v+1):
    print(parent[i], end=' ')
입력 출력
6 4
1 4
2 3 
2 4
5 6
각 원소가 속한 집합:  1 1 1 1 5 5 
부모 테이블:  1 1 2 1 5 5 

 

이렇게 구현하면 답을 구할 수는 있지만, find 함수가 비효율적으로 동작한다. 최악의 경우 find 함수가 모든 노드를 다 확인하는 터라 시간 복잡도가 O(V)라는 점이다.

 

경로 압축 기법을 활용하면 find 함수를 최적화할 수 있다.

경로 압축은 find 함수를 재귀적으로 호출한 뒤 부모 테이블 값을 갱신하는 기법이다.

 

 

 

 

경로 압축 기법 소스 코드

def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

이렇게 함수를 수정하면 각 노드에 대하여 find 함수를 호출한 이후에, 해당 노드의 루트 노드가 바로 부모 노드가 된다. 

 

 

 

 

 

 

 

개선된 서로소 집합 알고리즘 소스 코드

# 기본적인 서로소 집합 알고리즘 소스코드
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합을 합치기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


# 노드의 개수와 간선의 개수 입력받기
v, e = map(int, input().split())
parent = [0] * (v+1)  # 부모 테이블 초기화

# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

# union 연산을 각각 수행
for i in range(e):
    a, b = map(int, input().split())
    union_parent(parent, a, b)

# 각 원소가 속한 집합 출력
print('각 원소가 속한 집합: ', end=' ')
for i in range(1, v+1):
    print(find_parent(parent, i), end=' ')

print()

# 부모 테이블 내용 출력
print('부모 테이블: ', end=' ')
for i in range(1, v+1):
    print(parent[i], end=' ')

 

입력 출력
6 4
1 4
2 3 
2 4
5 6
각 원소가 속한 집합:  1 1 1 1 5 5 
부모 테이블:  1 1 2 1 5 5 

 

 

 

서로소 집합을 활용한 사이클 판별 소스 코드

# 특정 원소가 속한 집합 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합 찾기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


# 노드의 개수와 간선의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v+1)  # 부모 테이블 초기화

# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

cycle = False   # 사이클 발생 여부

for i in range(e):
    a, b = map(int, input().split())
    # 사이클이 발생한 경우 종료
    if find_parent(parent, a) == find_parent(parent, b):
        cycle = True
        break
    else:
        union_parent(parent, a, b)

if cycle:
    print("사이클이 발생했습니다.")
else:
    print("사이클이 발생하지 않았습니다.")

 

입력 출력
3 3
1 2
1 3
2 3
사이클이 발생했습니다.

 

 

 

 

 

 

 

2. 신장 트리

신장 트리란  하나의 그래프가 있을 때 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미한다.

이때 모든 노드가 포함되어 서로 연결하면서 사이클이 존재하지 않는다는 조건은 트리의 성립 조건이기도 하다.

 

 

 

 

 

 

 

 

3. 크루스칼 알고리즘

우리는 다양한 문제 상황에서 가능한 한 최소한의 비용으로 신장트리를 찾아야 할 때가 있다.

예를 들어, N 개의 도시가 존재하는 상황에서 두 도시 사이에 도로를 놓아 전체 도시가 서로 연결될 수 있게 도로를 설치하는 경우를 생각해보자.

 

이처럼 최소 신장 트리 중에서 최소 비용으로 만들 수 있는 신장 트리를 찾는 알고리즘을 '최소 신장 트리 알고리즘' 이라고 한다. 대표적인 최소 신장 트리 알고리즘으로 '크루스칼 알고리즘' 이 있다.

 

 

모든 간선에 대하여 정렬을 수행한 뒤에 가장 거리가 짧은 간선부터 집합에 포함시키면 된다.

이때, 사이클을 발생시킬 수 있는 간선의 경우, 집합에 포함시키지 않는다.

 

< 알고리즘 단계 >

1. 간선 데이터를 비용에 따라 오름차순으로 정렬한다.

2. 간선을 하나씩 확인하며 현재의 간선이 사이클을 발생시키는지 확인한다.

    -  사이클이 발생하지 않는 경우 최소 신장 트리에 포함시킨다.

    -  사이클이 발생하는 경우 최소 신장 트리에 포함시키지 않는다.

3. 모든 간선에 대하여 2번의 과정을 반복한다.

 

 

최종적으로 신장 트리에 포함되는 간선의 개수는 '노드의 개수 - 1'과 같다.

따라서, 크루스칼 알고리즘의 핵심 원리는 사이클을 발생시키는 간선을 제외한 간선들 중 가장 거리가 짧은 간선부터 차례대로 집합에 추가하면 된다는 것이다.

 

 

 

 

 

< 크루스칼 알고리즘 소스 코드 >

# 특정 원소가 속한 집합 찾기
def find_parent(parent, x):
    # 루트 노드가 아니라면, 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] != x:
        parent[x] = find_parent(parent, parent[x])
    return parent[x]

# 두 원소가 속한 집합 찾기
def union_parent(parent, a, b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a < b:
        parent[b] = a
    else:
        parent[a] = b


# 노드의 개수와 간선의 개수 입력 받기
v, e = map(int, input().split())
parent = [0] * (v+1)  # 부모 테이블 초기화

# 모든 간선을 담을 리스트와 최종 비용을 담을 변수
edges = []
result = 0


# 부모 테이블 상에서, 부모를 자기 자신으로 초기화
for i in range(1, v+1):
    parent[i] = i

# 모든 간선에 대한 정보를 입력 받기
for _ in range(e):
    a, b, cost = map(int, input().split())
    # 비용순으로 정렬하기 위해서 튜플의 첫번째 원소를 비용으로 설정
    edges.append((cost, a, b))

# 간선을 비용 순으로 정렬
edges.sort()

# 간선을 하나씩 확인하며
for edge in edges:
    cost, a, b = edge
    # 사이클이 발생하지 않는 경우에만 집합에 포함
    if find_parent(parent, a) != find_parent(parent, b):
        union_parent(parent, a, b)
        result += cost

print(result)
입력 출력
7 9
1 2 29
1 5 75
2 3 35
2 6 34
3 4 7
4 6 23
4 7 13
5 6 53
6 7 25
159

 

 

 

 

 

 

 

4. 위상 정렬 

위상 정렬이란 '방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것'이다.

예를 들어, 선수 과목을 고려한 학습 순서 설정 등이 있다.

 

위상 정렬 알고리즘을 알기 위해서는 '진입 차수'를 이해해야 한다.

진입 차수란 특정한 노드로 들어오는 간선의 개수를 의미한다.

 

위상 정렬 알고리즘은 다음과 같다.

1. 진입 차수가 0인 노드를 큐에 넣는다. 

2. 큐가 빌때 까지 다음 과정을 반복한다.

    -   큐에서 원소를 꺼내 해당 노드에서 출발하는 간선을 그래프에서 제거한다.

    -   새롭게 진입 차수가 0이 된 노드를 큐에 넣는다.

 

 

이 알고리즘을 이용해 간단하게 위상 정렬을 수행할 수 있다. 알고리즘에서 확인할 수 있듯이 큐가 빌 때까지 큐에서 원소를 꺼내 처리하는 과정을 반복한다. 이때 모든 원소를 방문

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

댓글