Как вычислить теоретическую пиковую производительность процессора

#performance #cpu #cpu-speed

#Производительность #процессор #скорость процессора

Вопрос:

Вот мой cat /proc/cpuinfo вывод:

 ...

processor           : 15
vendor_id           : GenuineIntel
cpu family          : 6
model               : 26
model name          : Intel(R) Xeon(R) CPU           E5520  @ 2.27GHz
stepping            : 5
cpu MHz             : 1600.000
cache size          : 8192 KB
physical id         : 1
siblings            : 8
core id             : 3
cpu cores           : 4
apicid              : 23
fpu                 : yes
fpu_exception       : yes
cpuid level         : 11
wp                  : yes
flags               : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips            : 4533.56
clflush size        : 64
cache_alignment     : 64
address sizes       : 40 bits physical, 48 bits virtual
power management    :
  

На этом компьютере установлено два процессора, каждый с 4 ядрами с возможностью гиперпоточности, поэтому общее количество процессоров равно 16 (2 процессора * 4 ядра * 2 гиперпоточности). Эти процессоры имеют одинаковый вывод, чтобы сохранить чистоту, я просто показываю информацию о последнем и опускаю часть флагов в строке flags.

Итак, как мне вычислить пиковую производительность этой машины в терминах GFlops? Дайте мне знать, если необходимо предоставить дополнительную информацию.

Спасибо.

Комментарии:

1. Извините, но очень странно, Hi, не может быть показано.

2. Приветствия автоматически удаляются.

Ответ №1:

Вы можете проверить спецификацию экспорта Intel. GFLOP на графике обычно обозначается как пик одного чипа. Он показывает 36,256 Gflop / s для E5520.

Этот единственный чип имеет 4 физических ядра с поддержкой SSE. Таким образом, этот GFLOP также может быть вычислен как: 2,26 ГГц * 2 (mul, add) * 2 (двойная точность SIMD) * 4 (физическое ядро) = 36,2.

В вашей системе два процессора, поэтому ваш пик равен 36,2 * 2 = 72,4 GFLOP / S.

Комментарии:

1. Может ли кто-нибудь, пожалуйста, объяснить «(mul, add)»?

2. mul: умножение с плавающей запятой, add: сложение с плавающей запятой. Это инструкции, выполняемые на ядре процессора, мы предполагаем, что эти две инструкции могут выполняться одновременно, поскольку ядро процессора разделило множитель и сумматор.

Ответ №2:

вы можете найти формулу на этом веб-сайте:

http://www.novatte.com/our-blog/197-how-to-calculate-peak-theoretical-performance-of-a-cpu-based-hpc-system

здесь формула:

производительность в GFlops = (скорость процессора в ГГц) x (количество ядер процессора) x (инструкция процессора за цикл) x (количество процессоров на узел).

итак, в вашем случае: 2.27x4x4x2 = 72,64 GFLOP / s конфигурацию вашего процессора смотрите здесьhttp://ark.intel.com/products/40200