#python #memory #memory-management #cpu #cpu-registers
Вопрос:
Чтобы ознакомиться с документацией intel об эффективности слотов конвейера профилирования https://software.intel.com/content/www/us/en/develop/documentation/vtune-help/top/analyze-performance/microarchitecture-analysis-group/general-exploration-analysis/microarchitecture-pipe.html
Если слот трубопровода не удаляется, это считается остановкой. Доля удаленных слотов конвейера отражает эффективность микроархитектуры процессора. Если на всех циклах процессора не было остановок, это считается 100% эффективным выполнением процессора. Обычно существует несколько причин для остановки прорезей трубопровода
Это привязка к памяти, привязка к ядру, обработка с привязкой к интерфейсу или плохие предположения.
Привязка к памяти измеряет долю слотов, в которых конвейер может быть остановлен из-за нагрузки по требованию или инструкций по хранению. Это в основном объясняется неполными нагрузками на память в полете, которые совпадают с нехваткой времени выполнения, в дополнение к менее распространенным случаям, когда хранилища могут создавать обратное давление на конвейер.
Не могли бы вы проиллюстрировать две части: неполные нагрузки на память в полете и хранилища, подразумевающие обратное давление на трубопровод ?
Во-вторых, я могу себе представить, что это относится к одновременному хранению «результатов выполнения» в иерархии памяти, требующей слишком большого количества данных, перемещающихся вверх по стеку кэш память, верно ли предположение и не могли бы вы более точно описать, что происходит ?