Ubuntu Server 20.04 выходит из строя из-за IRQ, и я не знаю, что это вызывает

#logging #server #crash #crash-reports #ubuntu-server

#регистрация #сервер #авария #отчеты о сбоях #ubuntu-сервер

Вопрос:

Мой сервер Ubuntu 20.04 время от времени выходил из строя, и я, наконец, решил это исправить. Я зашел в /var/log/kern.log и обнаружил, что в момент смерти сервера произошло следующее:

 Dec 9 07:19:33 ares kernel: [58762.297365] irq 18: nobody cared (try booting with the "irqpoll" option) Dec 9 07:19:33 ares kernel: [58762.297378] CPU: 0 PID: 0 Comm: swapper/0 Not tainted 5.4.0-91-generic #102-Ubuntu Dec 9 07:19:33 ares kernel: [58762.297379] Hardware name: MEDIONPC MS-7501/MS-7501, BIOS A7501MLN.10E 04/10/2008 Dec 9 07:19:33 ares kernel: [58762.297380] Call Trace: Dec 9 07:19:33 ares kernel: [58762.297383] lt;IRQgt; Dec 9 07:19:33 ares kernel: [58762.297391] dump_stack 0x6d/0x8b Dec 9 07:19:33 ares kernel: [58762.297394] __report_bad_irq 0x3a/0xaf Dec 9 07:19:33 ares kernel: [58762.297396] note_interrupt.cold 0xb/0x60 Dec 9 07:19:33 ares kernel: [58762.297400] handle_irq_event_percpu 0x73/0x80 Dec 9 07:19:33 ares kernel: [58762.297402] handle_irq_event 0x3b/0x60 Dec 9 07:19:33 ares kernel: [58762.297404] handle_fasteoi_irq 0x9c/0x150 Dec 9 07:19:33 ares kernel: [58762.297407] do_IRQ 0x55/0xf0 Dec 9 07:19:33 ares kernel: [58762.297409] common_interrupt 0xf/0xf Dec 9 07:19:33 ares kernel: [58762.297410] lt;/IRQgt; Dec 9 07:19:33 ares kernel: [58762.297412] RIP: 0010:native_safe_halt 0xe/0x10 Dec 9 07:19:33 ares kernel: [58762.297415] Code: 7b ff ff ff eb bd 90 90 90 90 90 90 e9 07 00 00 00 0f 00 2d 56 73 52 00 f4 c3 66 90 e9 07 00 00 00 0f 00 2d 46 73 52 00 fb f4 lt;c3gt; 90 0f 1f 44 00 00 55 48 89 e5 41 55 41 54 53 e8 ad 6f 63 ff 65 Dec 9 07:19:33 ares kernel: [58762.297416] RSP: 0018:ffffffffad003e08 EFLAGS: 00000246 ORIG_RAX: ffffffffffffffdd Dec 9 07:19:33 ares kernel: [58762.297419] RAX: 0001a54800000000 RBX: 0000000000000000 RCX: 0000000000000001 Dec 9 07:19:33 ares kernel: [58762.297420] RDX: 00000000009a2b4a RSI: 00003594439044d0 RDI: 0000000000000082 Dec 9 07:19:33 ares kernel: [58762.297421] RBP: ffffffffad003e28 R08: 00000066a17254b3 R09: 00003594619ab2d0 Dec 9 07:19:33 ares kernel: [58762.297422] R10: ffff88f329a17848 R11: 0000000000000000 R12: 0000000000000000 Dec 9 07:19:33 ares kernel: [58762.297422] R13: ffffffffad013780 R14: 0000000000000000 R15: 0000000000000000 Dec 9 07:19:33 ares kernel: [58762.297425] ? default_idle 0x20/0x140 Dec 9 07:19:33 ares kernel: [58762.297429] amd_e400_idle 0x42/0x50 Dec 9 07:19:33 ares kernel: [58762.297430] arch_cpu_idle 0x15/0x20 Dec 9 07:19:33 ares kernel: [58762.297432] default_idle_call 0x23/0x30 Dec 9 07:19:33 ares kernel: [58762.297434] do_idle 0x1fb/0x270 Dec 9 07:19:33 ares kernel: [58762.297436] cpu_startup_entry 0x20/0x30 Dec 9 07:19:33 ares kernel: [58762.297438] rest_init 0xae/0xb0 Dec 9 07:19:33 ares kernel: [58762.297441] arch_call_rest_init 0xe/0x1b Dec 9 07:19:33 ares kernel: [58762.297443] start_kernel 0x549/0x56a Dec 9 07:19:33 ares kernel: [58762.297445] x86_64_start_reservations 0x24/0x26 Dec 9 07:19:33 ares kernel: [58762.297446] x86_64_start_kernel 0x75/0x79 Dec 9 07:19:33 ares kernel: [58762.297449] secondary_startup_64 0xa4/0xb0 Dec 9 07:19:33 ares kernel: [58762.297451] handlers: Dec 9 07:19:33 ares kernel: [58762.297456] [lt;00000000eb4dce22gt;] usb_hcd_irq Dec 9 07:19:33 ares kernel: [58762.297459] [lt;00000000eb4dce22gt;] usb_hcd_irq Dec 9 07:19:33 ares kernel: [58762.297462] [lt;00000000eb4dce22gt;] usb_hcd_irq Dec 9 07:19:33 ares kernel: [58762.297470] [lt;00000000385c9198gt;] irq_handler [firewire_ohci] Dec 9 07:19:33 ares kernel: [58762.297472] Disabling IRQ #18  

К сожалению, я действительно не знаю, что здесь происходит. Мне это кажется аппаратным сбоем, но я не уверен, и использование Google мне тоже не помогло. Может быть, кто-то здесь знает, в чем дело.