C

C - 컴파일 과정(전처리, 컴파일, 어셈블, 링크)

gcc를 통해 c 언어로 작성된 코드가 컴파일되는 과정을 알아보자.

 

대략 우리가 코드를 짰다고 하자. 그럼 그게 소스파일이다.

Source.cpp (이름.cpp)이렇게 저장되는 파일!

소스파일은 C언어나 java 등, 프로그래머들이 이해하기 쉽게 고급언어로 작성된 파일을 말한다.

 

[빌드 방법]

 

빌드를 하는 방법은 다음과 같다.

 

gcc 소스파일

또는

gcc 소스파일 -o 실행파일명

 

ex)

gcc hello.c

또는

gcc hello.c -o [옵션] hello

 

첫 번째는 실행 파일명을 따로 지정해준 것이 아니라서 a.exe라는 실행파일이 만들어진다.
두 번째는 hello.exe라는 실행파일이 만들어진다.

 

실행은)
./a(.exe)
또는
./hello(.exe)


단 한 줄의 명령어로 실행파일이 뚝딱 만들어졌지만, 실제로는 아래와 같은 과정을 거쳐서 만들어진다.

[간단히]

[자세히]

빌드 - 컴파일 과정

[좀 더 자세히]

컴파일 과정

이러한 과정(컴파일 후 링킹 과정)을 거치면서, 결과물은 컴퓨터가 이해할 수 있는 바이너리 파일(Binary file)로 만들어진다.

이 파일을 실행하면 주기억장치(RAM)로 적재되어 시스템에서 동작하게 되는 것이다.

 


 

빌드 과정은 여러 중간 단계를 거친다. gcc 명령어에 옵션을 추가하여 각 단계별로 결과를 확인할 수 있다.

컴파일러인 gcc는 다음과 같이 각 단계에 적합한 툴을 호출한다.

전처리(Preprocess): cpp

컴파일 (Compile) : ccl

어셈블 (Assemble) : as

링크 (Link) : ld

 


1. 전처리 (Preprocess)

전처리 단계

헤더 파일을 포함하고 매크로 확장을 하는 단계이다.

  • #include 구문을 만나면 헤더파일을 찾아 그 내용을 순차적으로 삽입)
  • 매크로 치환 및 적용(#define, #ifdef와 같은 전처리기 매크로 치환 및 처리)

매크로 확장은 매크로 생성이라고도 한다. 즉, 다음과 같은 구문을 처리하는 것이다.

#include <stdio.h> //해더파일

#define MAX_NUM = 100 //매크로

gcc는 cpp라는 전처리기를 사용한다. 전처리 단계까지만 진행하는 방법은 다음과 같다.

gcc -E hello -o hello.i

이때 결과물은 포함된 헤더 파일에 정의된 변수와 함수를 포함하는 hello.i이다.


2. 컴파일(Compile)

컴파일 단계

컴파일 단계에서 C언어 코드가 ccl에 의해 어셈블리어로 변환된다.

  • 전단부(Front-end) : 언어 종속적인 부분 처리 - 어휘, 구문, 의미 분석
  • 중단부(Middle-end) : SSA 기반으로 최적화 수행 - 프로그램 수행 속도 향상으로 성능 높이기 위함
  • 후단부(Back-end): RTS로 아키텍처 최적화 수행 - 더 효율적인 명령어로 대체해서 성능 높이기 위함

이 단계까지 진행하려면 다음과 같은 옵션을 사용하면 된다.

 

gcc -S hello.c

 

이때 결과물은 어셈블리어의 형태의 데이터와 코드를 포함하고 있는 hello.s이다.


3. 어셈블(Assemble)

컴파일이 끝나면 어셈블리 코드가 됨, 이 코드는 어셈블러에 의해 기계어가 된다.

어셈블 단계

어셈블 단계에서는 c코드를 컴파일하고 그것을 모은다.

  • 어셈블러로 생성되는 파일은 '명령어'와 '데이터'가 들어있는 'ELF 바이너리 포맷' 구조를 가짐
    (링커가 여러 바이너리 파일을 하나의 실행 파일로 효과적으로 묶기 위해 '명령어와 데이터 범위'를
    일정한 규칙을 갖고 형식화해놓음)

gcc는 as라는 어셈블러를 사용한다.

이 단계까지 진행하기 위해서는 다음과 같은 옵션을 사용한다.

 

gcc -c hello.c

 

결과는 각 소스에 대한 binary파일(=object파일)인 hello.o이다.

바이너리 파일(binary file)은 데이터와 기계어를 포함한다.


4. 링크 (Link)

오브젝트 파일들과 프로그램에서 사용된 표준 C 라이브러리, 사용자 라이브러리를 링크한다.
해당 링킹 과정을 거치면 실행파일이 드디어 만들어진다.

링크 단계

링크 단계에서 바이너리 파일(binary file)들이 서로 연결되고, 만약 (Static) libraries (.a)가 있으면 libraries도 연결된다.

cf)

printf() 함수나 scanf() 등의 표준 C 라이브러리 함수들은 직접 구현하지 않아도 미리 컴파일이 되어 있기 때문에 링크하는 과정만 거치면 사용할 수 있습니다.(표준 C 라이브러리는 별도로 명시하지 않아도 자동으로 링크된다.)

이 단계를 진행하는 방법은 다음과 같다.

 

gcc hello.c -o hello

 

결과물은 코드와 데이터를 포함하는 실행 가능한 바이너리파일(binary file)인 hello.exe이다.


[간단히 정리]

실행 파일이 만들어 지기까지의 과정

1. 전처리 단계 - 전처리기 (cpp)

: #include, #define 등 #으로 시작하는 문법 사항이 적절히 전처리된 C 언어 '소스파일' 생성

 

2. 컴파일 단계 - 컴파일러 (cc1)

: C 언어 소스파일은 컴파일 과정을 거쳐 '어셈블리 소스 파일'이 됨

 

3. 어셈블 단계 - 어셈블러 (as)

:어셈블리 소스 파일은 어셈블 과정을 거쳐 '목적 파일'이 됨

 

4. 링크 단계 - 링커 (ld)

: 목적 코드는 라이브러리와 링크되어 '실행 가능한 파일'이 됨

 

 

. c(소스파일) -> 전처리기 => .i -> 컴파일러 => .s -> 어셈블러 => .o(목적코드) or .a(라이브러리 파일) -> 링커 => .exe(실행파일)

 


[출처 및 참고]

링크1 : brunch.co.kr/@mystoryg/57'

링크2 : coding-lks.tistory.com/105

'C' 카테고리의 다른 글

구조체(Struct)  (0) 2020.10.20