#performance #cpu #cpu-speed
#Производительность #процессор #скорость процессора
Вопрос:
Вот мой cat /proc/cpuinfo
вывод:
...
processor : 15
vendor_id : GenuineIntel
cpu family : 6
model : 26
model name : Intel(R) Xeon(R) CPU E5520 @ 2.27GHz
stepping : 5
cpu MHz : 1600.000
cache size : 8192 KB
physical id : 1
siblings : 8
core id : 3
cpu cores : 4
apicid : 23
fpu : yes
fpu_exception : yes
cpuid level : 11
wp : yes
flags : fpu vme de pse tsc msr pae mce cx8 apic ...
bogomips : 4533.56
clflush size : 64
cache_alignment : 64
address sizes : 40 bits physical, 48 bits virtual
power management :
На этом компьютере установлено два процессора, каждый с 4 ядрами с возможностью гиперпоточности, поэтому общее количество процессоров равно 16 (2 процессора * 4 ядра * 2 гиперпоточности). Эти процессоры имеют одинаковый вывод, чтобы сохранить чистоту, я просто показываю информацию о последнем и опускаю часть флагов в строке flags.
Итак, как мне вычислить пиковую производительность этой машины в терминах GFlops? Дайте мне знать, если необходимо предоставить дополнительную информацию.
Спасибо.
Комментарии:
1. Извините, но очень странно,
Hi,
не может быть показано.2. Приветствия автоматически удаляются.
Ответ №1:
Вы можете проверить спецификацию экспорта Intel. GFLOP на графике обычно обозначается как пик одного чипа. Он показывает 36,256 Gflop / s для E5520.
Этот единственный чип имеет 4 физических ядра с поддержкой SSE. Таким образом, этот GFLOP также может быть вычислен как: 2,26 ГГц * 2 (mul, add) * 2 (двойная точность SIMD) * 4 (физическое ядро) = 36,2.
В вашей системе два процессора, поэтому ваш пик равен 36,2 * 2 = 72,4 GFLOP / S.
Комментарии:
1. Может ли кто-нибудь, пожалуйста, объяснить «(mul, add)»?
2. mul: умножение с плавающей запятой, add: сложение с плавающей запятой. Это инструкции, выполняемые на ядре процессора, мы предполагаем, что эти две инструкции могут выполняться одновременно, поскольку ядро процессора разделило множитель и сумматор.
Ответ №2:
вы можете найти формулу на этом веб-сайте:
здесь формула:
производительность в GFlops = (скорость процессора в ГГц) x (количество ядер процессора) x (инструкция процессора за цикл) x (количество процессоров на узел).
итак, в вашем случае: 2.27x4x4x2 = 72,64 GFLOP / s конфигурацию вашего процессора смотрите здесьhttp://ark.intel.com/products/40200