기본 콘텐츠로 건너뛰기

C언어 register 변수의 함정카드


C언어를 하다보면 register 라는 CPU의 레지스터에 자료를 저장하는 변수를 알수있다.
대신에 한 프로그램에서 최대 2개 정도까지만 사용이 가능하고 지역변수만 가능 및 32bit CPU는 32bit 크기의 변수만 사용 가능하다.

장점만 보면 기본적으로 메모리쪽에 저장되는 일반 변수들보다 더 빠르게 접근이 가능할 것 같은데...인라인 어셈이랑 메모리랑 레지스터랑 비교하면 어떤게 가장 빠른지 궁금해서 한번 테스트 해보게 되었다.

우선 테스트 해볼 코드는 다음과 같다.

거의 동일한 연산을 하고 다른 점이 있다면 인라인 어셈은 전부 다 레지스터를 이용해서 연산한다는 정도...?

위의 코드를 컴파일 해서 실제로 돌려보면 실행 결과는 다음과 같이 나온다.

!?
그냥 아무런 형식도 지정해주지 않은 auto와 똑같은 결과가 나온다.
# C언어는 기본적으로 아무런 형식을 지정해주지 않으면 auto로 해준다.
# int a => auto int a

그래서 어째서 저런 결과가 나왔는지 컴파일에 옵션을 줘서 어셈파일을 분석해 보았다.


인라인 어셈 auto for
register for
push ebp
mov ebp, esp
mov ecx, 0
jmp SHORT $INLoop$3

$INLoop$3:
cmp ecx, 10000000
jae SHORT $EXIT$4
mov eax, ecx
shl eax, 2
inc ecx
jmp SHORT $INLoop$3

$EXIT$4:
cmp ebp, esp
call __RTC_CheckEsp
popebp
ret,0
push ebp
mov ebp, esp
sub esp, 8
mov DWORD PTR [ebp-8], -858993460
mov DWORD PTR [ebp-4], -858993460
mov DWORD PTR _i$2[ebp], 0
jmp SHORT $LN4@For

$LN2@For:
mov eax, DWORD PTR _i$2[ebp]
add eax, 1
mov DWORD PTR _i$2[ebp], eax

$LN4@For:
cmp DWORD PTR _i$2[ebp], 10000000
jae SHORT $LN1@For
mov ecx, DWORD PTR _i$2[ebp]
shl ecx, 2
mov DWORD PTR _a$1[ebp], ecx
jmp SHORT $LN2@For

$LN1@For:
mov esp, ebp
pop ebp
ret 0
push ebp
mov ebp, esp
sub esp, 8
mov DWORD PTR [ebp-8], -858993460
mov DWORD PTR [ebp-4], -858993460
mov DWORD PTR _i$2[ebp], 0
jmp SHORT $LN4@registeFor

$LN2@registeFor:
mov eax, DWORD PTR _i$2[ebp]
add eax, 1,
mov DWORD PTR _i$2[ebp], eax

$LN4@registeFor:
cmp DWORD PTR _i$2[ebp], 10000000
jae SHORT $LN1@registeFor
mov ecx, DWORD PTR _i$2[ebp]
shl ecx, 2
mov DWORD PTR _a$1[ebp], ecx
jmp SHORT $LN2@registeFor

$LN1@registeFor:
mov esp, ebp
pop ebp
ret 0

함수부분만 잘라서 보면 위와 같은 어셈코드로 변환됐는데, 기본값이랑 register로 한 코드가 차이가 없다. 그리고 register을 적용을 하엿음에도 불구하고 어셈 코드를 보면 메모리를 사용한다. 이게 어찌된 일인걸까?
혹시 64bit가 아니여서 그런가 해서 컴파일을 x64로 바꾸고 long, long long으로도 해보앗지만 동일한 결과가 나왔다.

컴파일러의 문제인지...문제점이 어떤 것인지는 모르지만 적어도 내가 쓰는 Visual studio 2015에서는 저런 결과가 나온다...

얻은 결론)

  • VS 2015에서는 register로 선언해도 실제로는 선언이 않된다.
  • 어려운 작업이 아니고, 굳이 빨리 처리해야된다면 인라인 어셈을 쓰자


Ps. 만약 저랑 같은 VS2015에서 되는분이 있으면 좀 알려주세요... 저만 그런지 궁금하네요;

댓글

이 블로그의 인기 게시물

C의 volatile

가장 쓰이지 않는 C/C++ 언어의 volatile 이라는 키워드가 있다. 이 키워드는 대부분의 참고 서적들이 컴파일러의 최적화를 막아준다고만 적어둘 정도로 사용 빈도수가 적기도하고 중요도 까지도 낮은 그런 키워드인 셈이다. 하지만 이 키워드가 임베디드 소프트웨어 에서는 중요한 키워드중 하나가 된다. 거의 하드웨어가 사용하는 메모리 선언 시에 사용되고 다음과 같은 경우에 사용되는 편이다. 메모리 맵 입출력(MMIO)을 제어 인터럽트 서비스 루틴 사용 멀티 쓰레드 환경 이렇게 3가지에 사용되는데 임베디드에서는 주로 아래와 같은 예시들과 같은 경우에 주로 사용된다. 예시 1) unsigned int* test; test = (unsigned int*) 0x1020; test = (unsigned int*) 0x1028; 예를 들어서 다음과 같은 코드가 있을때 컴파일러는 중간 문장은 필요 없는 것으로 판단하고 제거한뒤 컴파일 할것이다. unsigned int* test; test = (unsigned int*) 0x1028; 결과 적으로는 위 문장만 실행되는데 volatile 키워드를 사용하면 이것들이 전부 컴파일 되서 전부의미를 가지게 된다 volatile unsigned int* test; test = ( volatile unsigned int*) 0x1020; test = ( volatile unsigned int*) 0x1028; 예시 2)  예를 들어 0x1234에 8비트의 status 레지스터가 있고, 이 레지스터가 0이 아닌 값을 가질때까지 폴딩하기 위해서 아래와 같은 코드를 작성했다. (루시퍼님 블로그의 예시가 적당해서 가져왔다) INT8U *ptr = (INT8U *)0x1234; while (*ptr == 0) 만약 옵티마이징을 키게 된다면 이것은 move ptr, #0x1234 move a, @ptr loop bz loop 이렇게 다시는 0x1234값을 받아오지 않게 어셈블...

HomeNews Alpha Final!

그런데 인성인증인데 왜 기술적인걸로 프로젝트를 햇더라 파싱은 제리코 라이브러리를 사용해서 완성시켰다. 이제 PPT짜러...! 거의 다완성되간다!