Банковская группа ANZ сократила использование процессора на своих двух мэйнфреймах Z13, сократив расходы на эксплуатацию машин на миллионы долларов в год.
Дэвид Макферсон, архитектор группы, рассказал сегодня о сбережениях в Splunk.Conf 18 в Орландо, штат Флорида.
Макферсон провел сеанс под названием “Открой свое скрытое сокровище мэйнфреймов на миллион долларов! – Контролируйте и уменьшайте пики процессора”, в которой он объяснил, что банк использовал Splunk для мониторинга своих Unix-и Windows-приложений, но до недавнего времени не мог понять производительность мэйнфреймов.
Сделка ANZ с IBM предполагает, что она может потреблять 3100 MSU [миллион сервисных единиц], подразделение IBM для выставления счетов за использование процессоров мэйнфреймов. Машины могут поставлять больше энергии, но если АНЗ использует эти дополнительные ресурсы, он должен платить больше за привилегию.
Макферсон сказал, что поэтому он взял на себя работу по управлению расходами на Z13s как “хобби”. Встречи с пользователями Splunk в других командах привели его к рассмотрению его применения к мэйнфреймам, и ранние эксперименты быстро дали данные, которые показали использование процессора.
IBM не взимает плату в каждом случае, когда согласованная емкость превышена, но Макферсон быстро обнаружил, что были времена, когда ANZ регулярно переходил.
Эти случаи были вполне предсказуемы: банк имеет ночной пик, когда выполняются пакетные задания, а затем еще один пик в течение рабочего дня.
Измерение загрузки процессора осложнялось тем, что мэйнфреймы ANZ работают с “логическими разделами” (LPARS) — фактически виртуальными машинами, каждая из которых потребляет свои собственные ресурсы и выполняет выделенные рабочие нагрузки.
Поэтому Макферсон, необходимые для оценки поведения каждый логический раздел, а не весь сервер.
Его анализ физической производительности показали, что превышает прикладное мощности процессора.
Первым шагом было некоторое исправление ресурсоемких приложений. Макферсон сказал, что его команда улучшила код, убедилась, что они сжимают данные и не выполняют избыточные задания. Одним из них, по иронии судьбы, был собственный отчет IBM об использовании процессора, который был продублирован в Splunk.
Затем последовало исследование того, какие рабочие нагрузки берут группу на себя и когда.
Визуализация данных об использовании процессора в четырехчасовых блоках. Прямая черная линия-это предел использования по фиксированной цене, в то время как шаткая линия-это скользящее четырехчасовое среднее фактическое потребление.
Существенным виновником оказались пакетные задания, которые не обязательно должны были выполняться в пиковое время или могли быть отложены.
“Самая большая экономия была получена за счет динамических задержек партий”, — сказал Макферсон. “Я бы нашел работу, которая работает в моем пике 4:00 УТРА, но пользователи читают отчет, который он генерирует, только в 9:00 утра.”
Теперь он выполняет такие работы в нерабочее время, около 7:00 утра, что оставляет время для ручного вмешательства, если что-то пойдет не так.
Он также использовал автоматизацию для определения того, превышают ли процессоры пороговые значения использования, а затем переназначал пакетные задания на время, когда они могут выполняться, не стоя ANZ больше денег.
“У меня было десять разных вершин, чтобы управлять ими, поэтому у меня было десять разных возможностей сэкономить деньги”, — сказал он.
25-летний ветеран мэйнфреймов, Макферсон, казалось, был немного смущен своими достижениями и сказал присутствующим, что его подвиги легко могут быть воспроизведены.
Он рекомендовал другим пользователям Z-серии, стремящимся сэкономить деньги, начать с визуализации данных о потреблении процессора, а затем рассмотреть бизнес-проблему, которую можно решить; “в противном случае это цветные линии на экране.”