C언어를 하다보면 register 라는 CPU의 레지스터에 자료를 저장하는 변수를 알수있다.
대신에 한 프로그램에서 최대 2개 정도까지만 사용이 가능하고 지역변수만 가능 및 32bit CPU는 32bit 크기의 변수만 사용 가능하다.
장점만 보면 기본적으로 메모리쪽에 저장되는 일반 변수들보다 더 빠르게 접근이 가능할 것 같은데...인라인 어셈이랑 메모리랑 레지스터랑 비교하면 어떤게 가장 빠른지 궁금해서 한번 테스트 해보게 되었다.
우선 테스트 해볼 코드는 다음과 같다.
위의 코드를 컴파일 해서 실제로 돌려보면 실행 결과는 다음과 같이 나온다.
!?
그냥 아무런 형식도 지정해주지 않은 auto와 똑같은 결과가 나온다.
# C언어는 기본적으로 아무런 형식을 지정해주지 않으면 auto로 해준다.
# int a => auto int a
그래서 어째서 저런 결과가 나왔는지 컴파일에 옵션을 줘서 어셈파일을 분석해 보았다.
| 인라인 어셈 | auto for | |
|---|---|---|
| push ebp mov ebp, esp mov ecx, 0 jmp SHORT $INLoop$3 $INLoop$3: cmp ecx, 10000000 jae SHORT $EXIT$4 mov eax, ecx shl eax, 2 inc ecx jmp SHORT $INLoop$3 $EXIT$4: cmp ebp, esp call __RTC_CheckEsp popebp ret,0 |
push ebp mov ebp, esp sub esp, 8 mov DWORD PTR [ebp-8], -858993460 mov DWORD PTR [ebp-4], -858993460 mov DWORD PTR _i$2[ebp], 0 jmp SHORT $LN4@For $LN2@For: mov eax, DWORD PTR _i$2[ebp] add eax, 1 mov DWORD PTR _i$2[ebp], eax $LN4@For: cmp DWORD PTR _i$2[ebp], 10000000 jae SHORT $LN1@For mov ecx, DWORD PTR _i$2[ebp] shl ecx, 2 mov DWORD PTR _a$1[ebp], ecx jmp SHORT $LN2@For $LN1@For: mov esp, ebp pop ebp ret 0 |
push ebp mov ebp, esp sub esp, 8 mov DWORD PTR [ebp-8], -858993460 mov DWORD PTR [ebp-4], -858993460 mov DWORD PTR _i$2[ebp], 0 jmp SHORT $LN4@registeFor $LN2@registeFor: mov eax, DWORD PTR _i$2[ebp] add eax, 1, mov DWORD PTR _i$2[ebp], eax $LN4@registeFor: cmp DWORD PTR _i$2[ebp], 10000000 jae SHORT $LN1@registeFor mov ecx, DWORD PTR _i$2[ebp] shl ecx, 2 mov DWORD PTR _a$1[ebp], ecx jmp SHORT $LN2@registeFor $LN1@registeFor: mov esp, ebp pop ebp ret 0 |
함수부분만 잘라서 보면 위와 같은 어셈코드로 변환됐는데, 기본값이랑 register로 한 코드가 차이가 없다. 그리고 register을 적용을 하엿음에도 불구하고 어셈 코드를 보면 메모리를 사용한다. 이게 어찌된 일인걸까?
혹시 64bit가 아니여서 그런가 해서 컴파일을 x64로 바꾸고 long, long long으로도 해보앗지만 동일한 결과가 나왔다.
컴파일러의 문제인지...문제점이 어떤 것인지는 모르지만 적어도 내가 쓰는 Visual studio 2015에서는 저런 결과가 나온다...
얻은 결론)
- VS 2015에서는 register로 선언해도 실제로는 선언이 않된다.
- 어려운 작업이 아니고, 굳이 빨리 처리해야된다면 인라인 어셈을 쓰자
Ps. 만약 저랑 같은 VS2015에서 되는분이 있으면 좀 알려주세요... 저만 그런지 궁금하네요;
댓글
댓글 쓰기