Правильно ли я понимаю эту сборку?

# #assembly #gcc #x86

Вопрос:

Исходный код на языке C, и я скомпилировал его с помощью gcc 11.1 с отключенной оптимизацией (-O0). Ссылка на сборку находится здесь, чтобы вы могли увидеть ее сами.

Я прокомментировал сборку тем, что, по моему мнению, происходит, и «??» для строк, в которых я не слишком уверен.

На данный момент меня интересует только main() и someAlgebra() , и поэтому я отметил только эти биты в списке сборок.

C источник

 #include <stdio.h>

const char *MY_LIST[] = {
    "of",
    "the",
    "four",
    "green",
    "houses",
    "one",
    "hides",
    "five",
    "amazing",
    "secrets"
};


int someAlgebra(int x, int y)
{
    int a = 4;
    int b = 3;
    return 2*x   3*y   a - b;
}


void printAll(const char *the_list[], unsigned length)
{
    for(unsigned i = 0; i < length; i  ) {
        puts(the_list[i]);
    }
}




int main(int argc, char *argv[])
{
    int k = someAlgebra(3, 5);
    // printf("Size of [int] (bytes): %un", sizeof(int));
    // printf("Size of [int *] (bytes): %un", sizeof(int *));
    return 0;
}
 

Собрание

 .LC0:
        .string "of"
.LC1:
        .string "the"
.LC2:
        .string "four"
.LC3:
        .string "green"
.LC4:
        .string "houses"
.LC5:
        .string "one"
.LC6:
        .string "hides"
.LC7:
        .string "five"
.LC8:
        .string "amazing"
.LC9:
        .string "secrets"
MY_LIST:
        .quad   .LC0
        .quad   .LC1
        .quad   .LC2
        .quad   .LC3
        .quad   .LC4
        .quad   .LC5
        .quad   .LC6
        .quad   .LC7
        .quad   .LC8
        .quad   .LC9
someAlgebra:
        push    rbp                     ;save caller frame pointer
        mov     rbp, rsp                ;set frame pointer for this procedure
        mov     DWORD PTR [rbp-20], edi ;store param #1 (3)
        mov     DWORD PTR [rbp-24], esi ;store param #2 (5)
        mov     DWORD PTR [rbp-4], 4    ;store int a (local var)
        mov     DWORD PTR [rbp-8], 3    ;store int b (local var)
        mov     eax, DWORD PTR [rbp-20] ;Math in function body
        lea     ecx, [rax rax]          ;Math in function body
        mov     edx, DWORD PTR [rbp-24] ;Math in function body
        mov     eax, edx                ;Math in function body
        add     eax, eax                ;Math in function body
        add     eax, edx                ;Math in function body
        lea     edx, [rcx rax]          ;Math in function body
        mov     eax, DWORD PTR [rbp-4]  ;Math in function body
        add     eax, edx                ;Math in function body
        sub     eax, DWORD PTR [rbp-8]  ;Math in function body
        pop     rbp                     ;restore caller frame pointer
        ret                             ;pop return address into the PC
printAll:
        push    rbp
        mov     rbp, rsp
        sub     rsp, 32
        mov     QWORD PTR [rbp-24], rdi
        mov     DWORD PTR [rbp-28], esi
        mov     DWORD PTR [rbp-4], 0
        jmp     .L4
.L5:
        mov     eax, DWORD PTR [rbp-4]
        lea     rdx, [0 rax*8]
        mov     rax, QWORD PTR [rbp-24]
        add     rax, rdx
        mov     rax, QWORD PTR [rax]
        mov     rdi, rax
        call    puts
        add     DWORD PTR [rbp-4], 1
.L4:
        mov     eax, DWORD PTR [rbp-4]
        cmp     eax, DWORD PTR [rbp-28]
        jb      .L5
        nop
        nop
        leave
        ret
main:
        push    rbp                     ;save contents of rbp to stack
        mov     rbp, rsp                ;set frame pointer
        sub     rsp, 32                 ;reserve 32 bytes for local vars ??
        mov     DWORD PTR [rbp-20], edi ;??
        mov     QWORD PTR [rbp-32], rsi ;??
        mov     esi, 5                  ;param #2 for someAlgebra()
        mov     edi, 3                  ;param #1 for someAlgebra()
        call    someAlgebra             ;push return address to stack
        mov     DWORD PTR [rbp-4], eax  ;get return value from someAlgebra()
        mov     eax, 0
        leave
        ret
 

Ответ №1:

Что касается ваших действий, когда оптимизация отключена, gcc гарантирует, что каждая локальная переменная будет храниться в памяти, включая параметры функций. Таким образом , параметры argc, argv , несмотря на то, что они передаются main в регистрах edi, rsi , должны храниться в памяти в соответствующем месте стека.

Конечно, это совершенно бесполезно для выполнения кода, так как эти значения никогда не загружаются обратно, и эти параметры вообще не используются. Таким образом, компилятор мог бы удалить этот код — но угадайте, что это было бы оптимизацией, и вы сказали компилятору не делать ничего из этого.

Хотя вы, возможно, и не думаете об этом, в большинстве случаев чтение оптимизированного кода более познавательно и менее запутанно, чем неоптимизированное.

Комментарии:

1. @Mode77: Да, насколько это возможно.

2. Стандарт позволяет компиляторам расширять семантику языка, действуя в соответствии с «ассемблером высокого уровня», независимо от того, потребует ли Стандарт, чтобы они это делали; было бы полезно, если бы существовал термин для описания оптимизаций, которые предназначены для получения кода, соответствующего такой семантике, по сравнению с теми, которые предназначены для получения кода, который ведет себя осмысленно только в случаях, предусмотренных Стандартом.