개발자는 기록이 답이다

혼공 컴퓨터구조 + 운영체제 11. CPU스케줄링 본문

CS/운영체제

혼공 컴퓨터구조 + 운영체제 11. CPU스케줄링

slow-walker 2024. 1. 28. 22:48

1. CPU스케줄링 개요

 

모든 프로세스는 CPU를 필요로 하고 모든 프로세스는 먼저 CPU를 사용하고 싶어한다.

이러한 프로세스들에게 공정하고 합리적으로 CPU 자원을 할당하기 위해 운영체제는 어떤 프로세스에 CPU를 할당할지, 어떤 프로세스를 기다리게 할지를 결정한다.

  • CPU 스케줄링(CPU scheduling): 운영체제가 프로세스들에게 공정하고 합리적으로 CPU 자원을 배분하는 것

CPU 스케줄링은 컴퓨터 성능과도 직결되는 대단히 중요한 문제다. 프로세스들에게 현명하게 CPU를 배분하지 못하면 반드시 실행되어야 할 프로세스들이 실행되 지 못하거나, 당장 급하지 않은 프로세스들만 주로 실행되는 등 무질서한 상태가 발생할 수도 있기 때문이다.

 

프로세스 우선 순위

 

우선순위가 높은 프로세스란? 빨리 처리해야 하는 프로세스

 

우선순위가 높은 프로세스에는 대표적으로 입출력 작업이 많은 프로세스가 있다.

입출력 작업이 많은 프로세스를 먼저 실행하는 것이 왜 더 효율적일까?


대부분의 프로세스들은 CPU와 입출력장치를 모두 사용하며 실행된다.

즉, 프로세스는 실행 상태와 대기 상태를 반복하며 실행된다.

 

▶ 예시

 

워드 프로세서는 CPU를 사용하여 명령어를 실행하고, 사용자로부터 입력받은 내용을 보조기억장치에 저장하고, CPU를 사용하여 명령어를 실 행하고, 사용자가 입력한 내용을 화면에 출력하는 과정을 반복하며 실행된다.

 

그런데 프로세스 종류마다 입출력장치를 이용하는 시간과 CPU를 이용하는 시간의 양에는 차이가 있다.

 

  • 입출력 집중 프로세스(I/O bound process): 비디오 재생이나 디스크 백업 작업을 담당하는 프로세스와 같이 입출력 작업이 많은 프로세스
    • 실행 상태보다는 입출력을 위한 대기 상태에 더 많이 머무른다
  • CPU 집중 프로세스(CPU bround process) : 복잡한 수학 연산, 컴파일, 그래픽 처리 작업을 담당하는 프로세스와 같이 CPU 작업이 많은 프로세스
    • 대기 상태보다는 실행상태에 더 많이 머무른다.

CPU 집중 프로세스는 CPU를 많이 사용해야 하는 프로세스이고, 입출력 집중 프로세스는 그렇지 않은 프로세스인데, CPU 집중 프로세스와 입출력 집중 프로세스가 모두 동일한 빈도로 CPU를 사 용하는 것은 비합리적이다.

 

입출력 집중 프로세스를 가능한 빨리 실행시킨 후 CPU 집중 프로세스에 집중적으로 CPU를 할당하는게 더 효율적이다.
입출력장치가 입출력 작업을 완료하기 전까지는 입출력 집중 프로세스는 어차피 대기 상태가 될 예정이기 때문에 입출력 집중 프로세스를 얼른 먼저 처리해 버리면 다른 프로세스가 CPU를 사용할 수 있기 때문이다.

CPU 버스트와 입출력 버스트

 

  • CPU 버스트(CPU burst) : CPU를 이용하는 작업
  • 입출력 버스트(I/O burst) : 입출력장치를 기다리는 작업

 

즉, 프로세스는 일반적으로 CPU 버스트와 입출력 버스트를 반복하며 실행된다고 볼 수 있다. 그래서 입출력 집중 프로세스는 입출력 버스트가 많은 프로세스, CPU 집중 프로세스는 CPU 버스트가 많은 프로세스라고 정의할 수있다.

 

상황에 맞게 프로세스가 CPU를 이용할 수 있도록 하기 위해 운 영체제는 프로세스마다 우선순위 (priority)를 부여한다. 운영체제는 각 프로세스의 PCB에 우선순위를 명시하고, PCB에 적힌 우선순위를 기준으로 먼저 처리할 프로세스를 결정한다. 그렇게 자연스레 우선순위가 높은 프로세스는 더 빨리, 더 자주 실행된다.

 

프로세스 우선순위 직접 확인하기


우선순위가 높은 대표적인 프로세스는 입출력 작업이 많은 프로세스이지만, 이외에도 우선순위가 높은 프로세스로는 실시 간 프로세스, 일부 백그라운드 프로세스 등 다양하다. 어떤 프로세스의 우선순위가 높고, 어떤 프로세스의 우선순위가 낮은지 직접 확인해보자.

유닉스, 리눅스, macOS 등의 유닉스 체계 운영체제에서는 ps -el 명령을 통해 확인이 가능하다. nice 명령을 통해 일부 프로세스의 우선순위를 변경할 수도 있지요.

 

스케줄링 큐

 

PCB에 우선순위가 적혀 있다고는 하지만, CPU를 사용할 다음 프로세스를 찾기 위해 운영체제가 일일이 모든 프로세스의 PCB를 뒤적거리는 것은 비효율적이다. CPU를 원하는 프로세스들은 한 두 개가 아니고, CPU를 요구하는 새로운 프로세스는 언제든 생길 수 있으니까.


이는 비단 CPU 자원에만 국한된 상황이 아니다. 메모리에 적재되고 싶어 하는 프로세스도 얼마든 지 있을 수 있고, 특정 입출력장치와 보조기억장치를 사용하길 원하는 프로세스도 여러 개가 있을 수 있다. 운영체제가 매번 일일이 모든 PCB를 검사하여 먼저 자원을 이용할 프로세스를 결정하는 일은 매우 번거로울뿐더러 오랜 시간이 걸리는 일이다.

 

그래서 운영체제는 프로세스들에 '줄을 서서 기다릴 것'을 요구한다. CPU를 사용하고 싶은 프로세 스들, 메모리에 적재되고 싶은 프로세스들, 특정 입출력장치를 사용하고 싶은 프로세스들을 모두 줄 세우는 것이죠. 그리고 운영체제는 이 줄을 스케줄링 큐(scheduling queue)로 구현하고 관리합니다.

 

※ 큐는 자료 구조 관점에서 보았을 때는 먼저 삽입된 데이터가 먼저 나가는 선입선출(First In First Out) 자료 구조이지만, 스케줄링에서 이야기하는 큐는 반드시 선입선출 방식일 필요는 없다.


즉, 운영체제는 메모리로 적재되고 싶은 (새로 생성되는) 프로세스들을 큐에 삽입하여 줄을 세우고, CPU를 이용하고 싶은 프로세스들 또한 큐에 삽입하여 줄을 세우고, 특정 입출력장치를 이용하고 싶은 프로세스들 역시 큐에 삽입하여 줄을 세운다.

 

운영체제가 관리하는 대부분의 자원은 이렇듯 큐로 관리된다. 그래서 운영체제가 관리하는 줄, 즉 큐에는 다양한 종류가 있다. 대표적인 큐로 준비 큐와 대기 큐가 있다.

  • 준비 큐(ready quese) : CPU를 이용하고 싶은 프로세스들이 서는 줄
  • 대기 큐(waiting queue) : 입출력장치를 이용하 기 위해 대기 상태에 접어든 프로세스들이 서는 줄

 

준비 상태에 있는 프로세스들의 PCB는 준비 큐의 마지막에 삽입되어 CPU를 사용할 차례를 기다린다. 운영체제는 PCB들이 큐에 삽입된 순서대로 프로세스를 하나씩 꺼내어 실행하되, 그중 우선순위가 높은 프로세스를 먼저 실행한다.


우선순위가 낮은 프로세스들이 먼저 큐에 삽입되어 줄을 섰다고 할지라도 우선순위가 높은 프로세스는 그들보다 먼저 처리될 수 있다. 이런 점에서 봤을 때 높은 우선순위를 가진 프로세스는 마치 VIP와도 같다. 


대기 상태에 있는 프로세스도 마찬가지다. 같은 장치를 요구한 프로세스들은 같은 대기 큐에서 기다린다. 예를 들어 하드 디스크 사용을 요구한 프로세스는 하드 디스크 대기 큐에서 입출력 작업 이 완료되기를 기다리고, 프린터 사용을 요구한 프로세스는 프린터 대기 큐에서 입출력 작업이 완료 되기를 기다린다.

입출력이 완료되어 완료 인터럽트가 발생하면 운영체제는 대기 큐에서 작업이 완료된 PCB를 찾고, 이 PCB를 준비 상태로 변경한 뒤 대기 큐에서 제거한다. 당연히 해당 PCB는 준비 큐로 이동한다.

 

10장에서 배운 프로세스 상태 다이어그램을 방그므 배운 운영체제가 유지하는 여러 큐에 대해 배웠으니 더 세밀하게 완성할 수 있다.

 

선점형과 비선점형 스케줄링

 

특정 프로세스는 CPU를 잘 사용하고 있는데, 갑자기 다른 급한 프로세스가 CPU를 지금 당장 사용하길 요청한다면 어떻게 할까?

 

  • 선점형 스케줄링(preemptive scheduling) : 지금 CPU를 사용 중인 프로세스로부터 CPU 자원을 빼앗아 다른 프로세스에 할당
    • 프로세스가 CPU 를 비롯한 자원을 사용하고 있더라도 운영체제가 프로세스로부터 자원을 강제로 빼앗아 다른 프로세스에 할당할 수 있는 스케줄링 방식
      어느 하나의 프로세스가 자원 사용을 독점할 수 없는 스케줄링 방식
    • 프로세스마다 정해진 시간만큼 CPU를 사용하고, 정해진 시간을 모두 소비하여 타이머 인터럽트가 발생하면 운영체제가 해당 프로세스로부터 CPU 자원을 빼앗아 다음 프로세스에 할당하는 방식은 선점형 스케줄링의 일종이다

  • 비선점형 스케줄링(non-preemptive scheduling) : CPU를 사용 중인 프로세스의 작업이 끝날 때까지 다른 급한 프로세스를 기다리게 한다.
    • 하나의 프로세스가 자원을 사용하고 있다면 그 프로 세스가 종료되거나 스스로 대기 상태에 접어들기 전까진 다른 프로세스가 끼어들 수 없는 스케줄링 방식
    • 하나의 프로세스가 자원 사용을 독점할 수 있는 스케줄링 방식

 

현재 대부분의 운영체제는 선점형 스케줄링 방식을 차용하고 있지만, 선점형 스케줄링과 비선점형 스케줄링은 각기 장단점을 가지고 있다.

 

스케줄링 방식 선점형 스케줄링 비선점형 스케줄링
장점 - 더 급한 프로세스가 언제든 끼어들어 사용할 수 있는 방식
- 어느 한 프로세스의 자원 독점을 막고 프로세스들에 골고루 자 원을 배분할 수 있다
- 문맥 교환 과정에서 오버헤드가 발생할 수 있다
단점 - 문맥 교환의 횟수가 선점형 스케줄링보다 적기 때문에 문맥 교환에서 발생 하는 오버헤드는 선점형 스케줄링보다 적다

- 하나의 프로세스가 자원을 사용 중이라면 당장 자원 을 사용해야 하는 상황에서도 무작정 기다리는 수밖에 없다
- 모든 프로세스가 골고루 자원을 사용할 수 없다

 

2. CPU 스케줄링 알고리즘

 

스케줄링 알고리즘들을 하나하나 암기하기 위해 노력하지 않아도 괜찮다. CPU 스케줄링 알고리즘의 종류는 매우 다양하고 운영체제 저마다 서로 다른 스케줄링 알고리즘을 사용하고 있다. 중요한 것은 각 스케줄링 알고리즘에서 사용된 '아이디어'이지, '용어'가 아니다. 그러므로 각 스케줄링 알고리즘들의 작동 방식과 장단점을 이해하는 데에만 집중하자.

 

스케줄링 알고리즘의 종류



1) 선입 선처리 스케줄링


선입 선처리 스케줄링FCFS 스케줄링(First Come First Served Scheduling) 로 불린다.

  • 단순히 준비 큐에 삽입된 순서대로 프로세스들을 처리하는 비선형 스케줄링 방식이다.
  • 즉, 선입 선처리 스케줄링은 CPU를 먼저 요청한 프로세스부터 CPU를 할당하는 스케줄링 방식이다.
  • 언뜻 보기에는 가장 공정해 보이지만, 때때로 프로세스들이 기다리는 시간이 매우 길어질 수 있다는 점에서 부작용이 있다.


가령 CPU를 오래 사용하는 프로세스가 먼저 도착하면 다른 프로세스는 그 프로세스가 CPU를 사용 하는 동안 무작정 기다리는 수밖에 없다.

 

예를 들어 17ms 동안 CPU를 이용하는 프로세스 A, 5ms 동안 CPU를 이용하는 프로세스 B, 2ms 동안 CPU를 이용하는 프로세스 C가 차례로 준비 큐삽입된다면 프로세스 C는 고작 2ms를 실행하기 위해 22ms (17ms+5ms)라는 긴 시간을 기다려야만 한다. 이런 현상을 호위 효과(convoy effect)라고 한다.

 

2) 최단 작업 우선 스케줄링


호위 효과를 방지하려면 어떻게 해야 할까? 

 

단순하게 생각해 보면 CPU 사용 시간이 긴 프로세스는 나중에 실행하고, CPU 사용 시간이 짧은 간단한 프로세스를 먼저 실행하면 된다.
앞서 보여준 예시에서는 프로세스 A의 CPU 사용 시간이 매우 길기 때문에 B와 C는 무작정 오래 기 다릴 수밖에 없었다. 만약 CPU 사용 시간이 짧은 C와 B부터 실행한다면 C는 더 이상 기다릴 필요가 없고, B는 2ms. A는 7ms만 기다리면 된다.

 

최단 작업 우선 스케줄링 SJF 스케줄링(Shortest Job First Scheduling)로 불린다

  • 준비 큐에 삽입된 프로세스들 중 CPU 이용 시간의 길이가 가장 짧은 프로세스부터 실행하는 스케줄링 방식
  • 기본적으로 비선형 스케줄링 알고리즘으로 분류되지만, 선점형으로 구현될 수도 있다.
  • 선점형 최단 작업 우선 스케줄링이 뒤에 언급할 최소 잔여 시간우선 스케줄링이다.

3) 라운드 로빈 스케줄링

 

라운드 로빈 스케줄링(round robin scheduling)

  • 선입 선처리 스케줄링 + 타임 슬라이스라는 개념이 더해진 스케줄링 방식
  • 타임 슬라이스란 각 프로세스가 CPU를 사용할 수 있는 정해진 시간을 의미한다.
  • 즉, 라운드 로빈 스케줄링은 정해진 타임 슬라이스만큼의 시간 동안 돌아가며 CPU를 이용하는 선점형 스케줄링이다

 

큐에 삽입된 프로세스들은 삽입된 순서대로 CPU를 이용하되 정해진 시간만큼만 CPU를 이용하고, 정해진 시간을 모두 사용하였음에도 아직 프로세스가 완료되지 않았다면 다시 큐의 맨 뒤에 삽입된다. 이때 문맥 교환이 발생한다.
만약 CPU 사용 시간이 11ms, 3ms, 7ms인 프로세스 A, B, C를 타임 슬라이스가 4ms인 라운드 로빈 스케줄링을 한다면 아래 그림과 같이 수행된다.

 

라운드 로빈 스케줄링에서는 타임 슬라이스 크기가 매우 중요하다. 타임 슬라이스가 지나치게 크면 사실상 선입 선처리 스케줄링과 다를 바 없어 호위 효과가 생길 여지가 있고, 타임 슬라이스가 지 나치게 작으면 문맥 교환에 발생하는 비용이 커 CPU는 프로세스를 처리하는 일보다 프로세스를 전환하는 데에 온 힘을 다 쓸 여지가 있기 때문이다.

 

4) 최소 잔여 시간 우선 스케줄링


최소 잔여 시간우선 스케줄링SRT(Shortest Remaining Time) 스케줄링 로 불린다.

  • 최단 작업 우선 스케줄링 알고리즘과 + 라운드 로빈 알고리즘을 합친 스케줄링 방식
  • 최단 작업 우선 스케줄링은 작업 시간이 짧은 프로세스부터 처리하는 스케줄링 알고리즘이고, 라운드 로빈 알고리즘은 정해진 타임 슬라이스 만큼 돌아가며 CPU를 사용하는 선점형 스케줄링 알고리즘이다.
  • 최소 잔여 시간우선 스케줄링 하 에서 프로세스들은 정해진 타임 슬라이스만큼 CPU를 사용하되, CPU를 사용할 다음 프로세스로는 남아있는 작업 시간이 가장 적은 프로세스가 선택된다.

 

5) 우선순위 스케줄링

 

우선순위 스케줄링 (priority scheduling)

  • 프로세스들에 우선순위를 부여하고, 가장 높은 우선순위를 가진 프로세스부터 실행하는 스케줄링 알고리즘
    (우선순위가 같은 프로세스들은 선입 선처리로 스케줄링된다)


앞서 설명한 최단 작업 우선 스케줄링, 최소 잔여 시간 우선 스케줄링 알고리즘은 넓은 의미에서 우선순위 스케줄링의 일종으로 볼 수 있다. 최단 작업 우선 스케줄링은 작업 시간이 짧은 프로세스에 높은 우선순위를 부여하는 방식이고, 최소 잔여 시간우선 스케줄링은 남은 시간이 짧은 프로세스에 높은 우선순위를 부여하는 방식이라 볼 수 있기 때문이다.


다만, 우선순위 스케줄링은 근본적인 문제를 내포하고 있다. 우선순위가 높은 프로세스를 우선 하여 처리하는 방식이기에 우선순위가 낮은 프로세스는 준비 큐에 먼저 삽입되었음에도 불구하고) 우선순위가 높은 프로세스들에 의해 실행이 계속해서 연기될 수 있다. 이를 기아(starvation) 현상이 라고 한다. 우선순위가 높은 프로세스만 계속 먼저 실행되니 우선순위가 낮은 프로세스의 실행은 계속 뒤로 밀리는 것이다.

 

 

이를 방지하기 위한 대표적인 기법 에이징(aging)이 있다.

  • 오랫동안 대기한 프로세스의 우선순위를 점차 높이는 방식이다.
  • 말하자면 대기 중인 프로세스의 우선순위를 마치 나이 먹듯 점차 증가시키는 방법이다.
  • 에이징 기법을 적용하면 우선순위가 낮아 마냥 기다리기만 하는 프로세스가 없어진다. 
  • 우선순위가 낮더라도 언젠가는 높은 우선순위가 되기 때문이다.

6) 다단계 큐 스케줄링

 

다단계 큐 스케줄링(multilevel queue scheduling)

  • 앞서 설명한 우선순위 스케줄링의 발전된 형태이다. 
  • 우선순위별로 준비 큐를 여러 개 사용하는 스케줄링 방식이다.
  • 다단계 큐 스케줄링 하에서는 우선순위가 가장 높은 큐에 있는 프로세스들을 먼저 처리하고, 우선순위가 가장 높은 큐가 비어 있으면 그다음 우선순위 큐에 있는 프로세스들을 처리한다.


아래 그림을 살펴보면 우선순위 0에 삽입된 프로세스들, 우선순위 1 에 삽입된 프로세스들, 우선순위 2에 삽입된 프로세스들 순서대로 CPU를 할당받아 실행된다.

 

 

이렇게 큐를 여러 개 두면 프로세스 유형별로 우선순위를 구분하여 실행하는 것이 편리하다.

  • 가령 어떤 큐에는 우선순위가 비교적 높아야 하는 CPU 집중 프로세스가 삽입될 수 있고, 어떤 큐에는 우선순위가 비교적 낮아도 상관없는 입출력 집중 프로세스가 삽입될 수 있다.
  • 또 어떤 큐에는 (우선순위가 비교적 높아야 하는 )백그라운드 프로세스들을 삽입할 수 있고, 어떤 큐에는 (우선순위가 비교적 낮아도 무방한) 사용자와의 상호작용이 잦은 프로세스들을 삽입할 수 있다.
  • 또한 큐별로 타임 슬라이스를 여러 개 지정할 수도 있고, 큐마다 다른 스케줄링 알고리즘을 사용할 수도 있다.
    • 예를 들어 어떤 큐에서의 타임 슬라이스는 크게, 어떤 큐에서의 타임 슬라이스는 작 게 사용하고, 어떤 큐에서는 선입 선처리 스케줄링을 사용하고, 어떤 큐에서는 라운드 로빈 스케줄링을 사용할 수 있다.

7) 다단계 피드백 큐 스케줄링

다단계 피드백 큐 스케줄링 (multilevel feedback queue scheduling)

  • 다단계 피드백 큐 스케줄링은 다단계 큐 스케줄링를 보완한 형태이다. 
    • 앞서 설명한 다단계 큐 스케줄링에서는 프로세스들이 큐 사이를 이동할 수 없다.
    • 그러나 이런 방식대로라면 우선순위가 낮으 프로세스는 계속 연기될 여지가 있다.
    • 즉, 다시 한번 기아 현상이 발생할 수 있다.
    • 언제 높은 우선순위의 프로세스가 들어올지 모르는데, 우선순위가 낮은 프로세스 입장에서는 매우 불리하다.

다단계 피드백 큐 스케줄링은 다단계 큐 스케줄링과 비슷하게 작동하지만, 한 가지가 다르다.

바로 프로세스들이 큐 사이를 이동할 수 있다는 점입니다. 다단계 피드백 큐 스케줄링에서 새로 준비 상태가 된 프로세스가 있다면 우선 우선순위가 가장 높은 우선순위 큐에 삽입되고 일정 시간(타임 슬라이스) 동안 실행된다.

 

그리고 만약 프로세스가 해당 큐에서 실행이 끝나지 않는다면 다음 우선순위 큐에 삽입되어 실행된다. 그리고 또 해당 큐에서 실행이 끝나지 않는다면 프로세스는 또 다음 우선순위 큐에 삽입되고, 결국 CPU를 오래 사용해야 하는 프로세스는 점차 우선순위가 낮아진다

 

즉, 다단계 피드백 큐 스케줄링 알고리즘은 어떤 프로세스의 CPU 이용 시간이 길면 낮은 우선순위 큐로 이동시키고, 어떤 프로세스가 낮은 우선순위 큐에서 너무 오래 기다린다면 높은 우선순위 큐로이동시킬 수 있는 알고리즘이다.

다단계 피드백 큐 스케줄링은 구현이 복잡하지만, 가장 일반적인 CPU 스케줄링 알고리즘으로 알려져있다