it-swarm.com.de

Gelegentliches dmesg-Protokoll "NOHZ: local_softirq_pending 08"

Ich habe einen Ubuntu 14.04-Server, der gelegentlich "NOHZ: local_softirq_pending 08" -Fehler im dmesg-Protokoll ausgibt. Dies begann nach dem Upgrade auf Kernel 4.4. zuvor lief es ohne Probleme auf einem 3.16-Kernel. Hier ist ein Auszug aus dem Ende des Protokolls:

[    7.805258] audit: type=1400 audit(1484883362.092:11): apparmor="STATUS" operation="profile_replace" profile="unconfined" name="/sbin/dhclient" pid=1636 comm="apparmor_parser"
[   10.605443] igb 0000:c1:00.0 eth0: igb: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: RX
[   10.605545] IPv6: ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
[   19.219187] ixgbe 0000:02:00.1 p4p2: NIC Link is Up 10 Gbps, Flow Control: None
[   19.219368] IPv6: ADDRCONF(NETDEV_CHANGE): p4p2: link becomes ready
[   52.010390] ip_tables: (C) 2000-2006 Netfilter Core Team
[   52.089283] init: plymouth-upstart-bridge main process ended, respawning
[ 2857.027773] perf interrupt took too long (2542 > 2500), lowering kernel.perf_event_max_sample_rate to 50000
[ 7195.391731] perf interrupt took too long (5012 > 5000), lowering kernel.perf_event_max_sample_rate to 25000
[37277.461862] perf interrupt took too long (10050 > 10000), lowering kernel.perf_event_max_sample_rate to 12500
[239795.500056] NOHZ: local_softirq_pending 08
[579047.644110] NOHZ: local_softirq_pending 08
[837865.916051] NOHZ: local_softirq_pending 08

Es handelt sich um einen Produktionsdatenbank-Host mit 32 Kernen und angemessener Auslastung.

Ich frage mich, ob ich über diese Meldungen besorgt sein sollte und wie ich das Problem beheben könnte.

Kernel Details hier:

[    0.000000] Linux version 4.4.0-59-generic ([email protected]) (gcc version 4.8.4 (Ubuntu 4.8.4-2ubuntu1~14.04.3) ) #80~14.04.1-Ubuntu SMP Fri Jan 6 18:02:02 UTC 2017 (Ubuntu 4.4.0-59.80~14.04.1-generic 4.4.35)
[    0.000000] Command line: BOOT_IMAGE=/vmlinuz-4.4.0-59-generic root=UUID=5db4a2c8-24f4-409b-b437-6120682cc518 ro noautogroup transparent_hugepage=never nomdmonddf nomdmonisw
5
Brian Y

Fügen Sie den Kernel-Parametern während des Bootens nohz=off hinzu, um es zu deaktivieren.

Diese Option bewirkt, dass die RCU versucht, die Kulanzfristen zu beschleunigen, damit die CPUs schneller in den Dynticks-Ruhezustand wechseln können. Andererseits erhöht diese Option den Overhead der Dynticks-Leerlaufprüfung, insbesondere auf Systemen mit einer großen Anzahl von CPUs.

Sie scheinen von dem kühnen Teil betroffen zu sein.

Mehr lesen ...

1
Rinzwind