# #assembly #gcc #x86
Вопрос:
Исходный код на языке C, и я скомпилировал его с помощью gcc 11.1 с отключенной оптимизацией (-O0). Ссылка на сборку находится здесь, чтобы вы могли увидеть ее сами.
Я прокомментировал сборку тем, что, по моему мнению, происходит, и «??» для строк, в которых я не слишком уверен.
На данный момент меня интересует только main()
и someAlgebra()
, и поэтому я отметил только эти биты в списке сборок.
C источник
#include <stdio.h>
const char *MY_LIST[] = {
"of",
"the",
"four",
"green",
"houses",
"one",
"hides",
"five",
"amazing",
"secrets"
};
int someAlgebra(int x, int y)
{
int a = 4;
int b = 3;
return 2*x 3*y a - b;
}
void printAll(const char *the_list[], unsigned length)
{
for(unsigned i = 0; i < length; i ) {
puts(the_list[i]);
}
}
int main(int argc, char *argv[])
{
int k = someAlgebra(3, 5);
// printf("Size of [int] (bytes): %un", sizeof(int));
// printf("Size of [int *] (bytes): %un", sizeof(int *));
return 0;
}
Собрание
.LC0:
.string "of"
.LC1:
.string "the"
.LC2:
.string "four"
.LC3:
.string "green"
.LC4:
.string "houses"
.LC5:
.string "one"
.LC6:
.string "hides"
.LC7:
.string "five"
.LC8:
.string "amazing"
.LC9:
.string "secrets"
MY_LIST:
.quad .LC0
.quad .LC1
.quad .LC2
.quad .LC3
.quad .LC4
.quad .LC5
.quad .LC6
.quad .LC7
.quad .LC8
.quad .LC9
someAlgebra:
push rbp ;save caller frame pointer
mov rbp, rsp ;set frame pointer for this procedure
mov DWORD PTR [rbp-20], edi ;store param #1 (3)
mov DWORD PTR [rbp-24], esi ;store param #2 (5)
mov DWORD PTR [rbp-4], 4 ;store int a (local var)
mov DWORD PTR [rbp-8], 3 ;store int b (local var)
mov eax, DWORD PTR [rbp-20] ;Math in function body
lea ecx, [rax rax] ;Math in function body
mov edx, DWORD PTR [rbp-24] ;Math in function body
mov eax, edx ;Math in function body
add eax, eax ;Math in function body
add eax, edx ;Math in function body
lea edx, [rcx rax] ;Math in function body
mov eax, DWORD PTR [rbp-4] ;Math in function body
add eax, edx ;Math in function body
sub eax, DWORD PTR [rbp-8] ;Math in function body
pop rbp ;restore caller frame pointer
ret ;pop return address into the PC
printAll:
push rbp
mov rbp, rsp
sub rsp, 32
mov QWORD PTR [rbp-24], rdi
mov DWORD PTR [rbp-28], esi
mov DWORD PTR [rbp-4], 0
jmp .L4
.L5:
mov eax, DWORD PTR [rbp-4]
lea rdx, [0 rax*8]
mov rax, QWORD PTR [rbp-24]
add rax, rdx
mov rax, QWORD PTR [rax]
mov rdi, rax
call puts
add DWORD PTR [rbp-4], 1
.L4:
mov eax, DWORD PTR [rbp-4]
cmp eax, DWORD PTR [rbp-28]
jb .L5
nop
nop
leave
ret
main:
push rbp ;save contents of rbp to stack
mov rbp, rsp ;set frame pointer
sub rsp, 32 ;reserve 32 bytes for local vars ??
mov DWORD PTR [rbp-20], edi ;??
mov QWORD PTR [rbp-32], rsi ;??
mov esi, 5 ;param #2 for someAlgebra()
mov edi, 3 ;param #1 for someAlgebra()
call someAlgebra ;push return address to stack
mov DWORD PTR [rbp-4], eax ;get return value from someAlgebra()
mov eax, 0
leave
ret
Ответ №1:
Что касается ваших действий, когда оптимизация отключена, gcc гарантирует, что каждая локальная переменная будет храниться в памяти, включая параметры функций. Таким образом , параметры argc, argv
, несмотря на то, что они передаются main
в регистрах edi, rsi
, должны храниться в памяти в соответствующем месте стека.
Конечно, это совершенно бесполезно для выполнения кода, так как эти значения никогда не загружаются обратно, и эти параметры вообще не используются. Таким образом, компилятор мог бы удалить этот код — но угадайте, что это было бы оптимизацией, и вы сказали компилятору не делать ничего из этого.
Хотя вы, возможно, и не думаете об этом, в большинстве случаев чтение оптимизированного кода более познавательно и менее запутанно, чем неоптимизированное.
Комментарии:
1. @Mode77: Да, насколько это возможно.
2. Стандарт позволяет компиляторам расширять семантику языка, действуя в соответствии с «ассемблером высокого уровня», независимо от того, потребует ли Стандарт, чтобы они это делали; было бы полезно, если бы существовал термин для описания оптимизаций, которые предназначены для получения кода, соответствующего такой семантике, по сравнению с теми, которые предназначены для получения кода, который ведет себя осмысленно только в случаях, предусмотренных Стандартом.