Не удается сохранить аварийный дамп с помощью kdump

#amazon-web-services #centos #dump #amazon-lightsail

#amazon-web-services #centos #дамп #amazon-lightsail

Вопрос:

У меня есть VPS-сервер в сервисе Amazon AWS Lightsail. Я тестировал kdump, используя следующие две команды (для запуска автоматического сбоя ядра):

 # echo 1 > /proc/sys/kernel/sysrq
# echo c > /proc/sysrq-trigger
  

Проблема в том, что система разбилась и перезагрузилась, но дамп не сохранен.

Вот список проверок, которые я выполнил:

 [centos@server crash]$ systemctl status kdump
● kdump.service - Crash recovery kernel arming    
  Loaded: loaded (/usr/lib/systemd/system/kdump.service; enabled; vendor preset: enabled)    
  Active: active (exited) since Mon 2019-03-18 07:43:34 UTC; 5 days ago   
 Process: 4119 ExecStart=/usr/bin/kdumpctl start (code=exited, status=0/SUCCESS)  
Main PID: 4119 (code=exited, status=0/SUCCESS)    
  CGroup: /system.slice/kdump.service

Mar 18 07:43:32 ip-.ap-northeast-1.compute.internal systemd[1]: Starting Crash recovery kernel arming...
Mar 18 07:43:34 ip-.ap-northeast-1.compute.internal kdumpctl[4119]: kexec: loaded kdump kernel
Mar 18 07:43:34 ip-.ap-northeast-1.compute.internal kdumpctl[4119]: Starting kdump: [OK]
Mar 18 07:43:34 ip-.ap-northeast-1.compute.internal systemd[1]: Started Crash recovery kernel arming.


[centos@server crash]$ dmesg | grep Reserving
[    0.000000] Reserving 256MB of memory at 368MB for crashkernel (System RAM: 2047MB)


[centos@server crash]$ cat /proc/cmdline
BOOT_IMAGE=/boot/vmlinuz-3.10.0-957.1.3.el7.x86_64 root=UUID=f41e390f-835b-4223-a9bb-9b45984ddf8d ro console=tty0 crashkernel=256M console=ttyS0,115200

[centos@server crash]$ grep -v ^# /etc/kdump.conf
path /var/crash
core_collector makedumpfile -l --message-level 1 -d 31
default reboot
  

В /var/log/messages журнале сбоев нет записей, указывающих на какую-либо возможную ошибку. Итак, мне интересно, что я, возможно, пропустил. Или AWS Lightsail VPS вообще не способен сохранять kdump …?

Комментарии:

1. Я не могу придумать очевидную причину, по которой экземпляры Lightsail не смогли бы сохранить аварийный дамп. В PV-среде, afaik, это невозможно сделать, но Lightsail — это не PV — это HVM. Поскольку Lightsail является «ec2-lite», у вас не так много доступных инструментов, таких как скриншоты консоли и загрузка текста вывода журнала консоли , как в EC2. Если вы склонны подробно устранять неполадки, создайте реальный экземпляр EC2 t2 с той же ОС и посмотрите, работает ли там ваша настройка. Если нет, возможно, инструменты EC2 будут полезны.