it-swarm.com.de

Ubuntu 18.04 Fehler beim Aufwachen aus dem Ruhezustand: Lesefehler auf dem Swap-Gerät

Nachdem sich der Laptop einige Stunden im Energiesparmodus befunden hat, wird beim Versuch, die Sitzung fortzusetzen, die folgende Fehlermeldung angezeigt:

Lesefehler auf dem Swap-Gerät

Es dauert ungefähr 30 Sekunden, bis der Anmeldebildschirm geladen ist, nachdem dies geschehen ist. Sobald ich mich anmelde, wird der Bildschirm ein- oder zweimal für eine Sekunde ausgeblendet und keines meiner Programme ist mehr geöffnet. Ich erhalte die Meldung "Systemproblem erkannt". Wenn ich auf "Bericht senden" klicke, wird eine weitere Benachrichtigung angezeigt:

Entschuldigung, das Programm "Xorg" wurde unerwartet geschlossen. Ihr Computer verfügt nicht über genügend freien Speicher, um das Problem automatisch zu analysieren und einen Bericht an die Entwickler zu senden.

Bisher habe ich versucht, den verfügbaren Swap-Speicherplatz zu vergrößern. Anfangs waren es ungefähr 2 GB, und ich habe eine weitere Auslagerungsdatei mit 9 GB erstellt. Das hat nicht geholfen. Der nach dem Absturz belegte Auslagerungsspeicherplatz (gemäß dem Befehl swapon) beträgt immer etwa 170 MB.

Das DMESG für das Fortsetzen meiner Sitzung bis zum Lesefehler auf dem Swap-Gerät lautet wie folgt:

    
 [64046.474054] ACPI: Wiederaufnahme auf niedriger Ebene abgeschlossen 
 [64046.474162] ACPI: EC: EC gestartet 
 [64046.474162] PM: Wiederherstellung des NVS-Arbeitsspeichers der Plattform 
 [64046.475139 ] Aktivieren von Nicht-Boot-CPUs ... 
 [64046.475196] x86: Booten der SMP-Konfiguration: 
 [64046.475196] smpboot: Booten von Node 0 Prozessor 1 APIC 0x2 
 [64046.475663] Cache: Eltern-CPU1 sollte nicht schlafen 
 [64046.475859] CPU1 läuft 
 [64046.475910] smpboot: Booten von Node 0 Prozessor 2 APIC 0x4 
 [64046.476330] Cache: Eltern-CPU2 sollte nicht schlafen 
 [64046.476506] CPU2 läuft 
 [64046.476539] smpboot: Booten von Node 0 Prozessor 3 APIC 0x6 
 [64046.477071] Cache: Eltern-CPU3 sollte nicht schlafen 
 [64046.477255] CPU3 läuft 
 [64046.477274] smpboot: Booten von Node 0 Prozessor 4 APIC 0x1 
 [64046.477721] Cache: Eltern-CPU4 sollte nicht schlafen 
 [64046.477922] CPU4 läuft 
 [64046.477947] smpboot: Booting Node 0 Process oder 5 APIC 0x3 
 [64046.478371] Cache: Übergeordnete CPU5 sollte nicht inaktiv sein 
 [64046.478571] CPU5 ist inaktiv 
 [64046.478591] smpboot: Booting Node 0 Prozessor 6 APIC 0x5 
 [64046.479018] Cache: Übergeordnete CPU6 sollte nicht inaktiv sein 
 [64046.479229] CPU6 ist inaktiv 
 [64046.479247] smpboot: Booting Node 0 Prozessor 7 APIC 0x7 
 [64046.479675] Cache: Übergeordnete CPU7 sollte nicht inaktiv sein 
 [64046.479899] CPU7 ist inaktiv 
 [64046.485913] ACPI: Aufwachen aus dem System-Ruhezustand S3 
 [64046.639206] ACPI: EC: Ereignis nicht blockiert 
 [64046.639711] sd 2: 0: 0: 0: [sda] Startdisk 
 [64046.873289] usb 1-11: Reset full- Geschwindigkeit USB-Gerät Nummer 2 mit xhci_hcd 
 [64046.976869] ata4: SATA-Verbindung unterbrochen (SStatus 4 SControl 300) 
 [64046.976892] ata2: SATA-Verbindung unterbrochen (SStatus 4 SControl 300) 
 [64047.149289] USB 1-6: Zurücksetzen des Hochgeschwindigkeits-USB-Geräts Nummer 40 mit xhci_hcd 
 [64047.437370] psmouse serio1: Synaptics: Abgefragte maximale Koordinaten: x [..5660], y [..4570] 
 [64047.476302] psmouse serio1: synaptics: abgefragte Minimalkoordinaten: x [1364 ..], y [1284 ..] 
 [64047.922603] OOM-Killer aktiviert. 
 [64047.922605] Neustart der Aufgaben ... erledigt. 
 [64047.928727] thermal thermal_zone1: Fehler beim Auslesen der thermischen Zone (-61) 
 [64047.930036] Bluetooth: hci0: Bootloader-Version 0.0 Build 2 Woche 52 2014 
 [64047.935036] Bluetooth: hci0: Geräteversion ist 5 
 [64047.935037] Bluetooth: hci0: Sicherer Start ist aktiviert 
 [64047.935038] Bluetooth: hci0: OTP-Sperre ist aktiviert 
 [64047.935038] Bluetooth: hci0: API-Sperre ist aktiviert 
 [64047.935039] Bluetooth: hci0: Debug-Sperre ist deaktiviert 
 [64047.935040] Bluetooth: hci0: Mindest-Firmware-Build 1 Woche 10 2014 
 [64047.935042] Bluetooth: hci0: Gefundene Geräte-Firmware: intel/ibt-11-5.sfi 
 [64047.944372] PM: Beenden 
 [64048.050329] Lesefehler auf Swap-Gerät (8: 0: 1543400288) 
 [64048.460888] [drm] RC6 auf 

Bitte lassen Sie mich wissen, wenn weitere Informationen benötigt werden.

11
Vedant

Dem aktuell verwendeten Ubuntu 18.04-Kernel fehlt eine wichtige Fehlerbehebung.

Das Update dafür ist bereits in der vorgelagerten Linux-Kernel-Version 4.16.8 vorhanden. (Der Suspend-Fehler trat ab Kernel-Version 4.15 auf.) Ubuntu muss nur diesen kleinen Patch aus dem Upstream auswählen. Der Fehler führt häufig dazu, dass Xorg unmittelbar nach dem Anhalten abstürzt, d. H., Dass die gesamte grafische Anmeldesitzung abstürzt.

Beachten Sie, dass dieser Fehler häufig auftritt , ohne dass Read-error on swap device angezeigt wird. Die meiste Zeit gab es keinen Fehler im Kernel-Log. (Einige Male wurden stattdessen EXT4-fs error und Buffer I/O error angezeigt). Diese Fehlermeldungen können auch durch einen Hardwarefehler verursacht werden. Konzentrieren Sie sich bei der Diagnose dieses Problems auf andere, klarere Details.

Ein Testkernel ist am Ende dieses Ubuntu-Fehlers verfügbar, d. H. In diesem Kommentar: https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1776887/comments/5

Bisher hat noch niemand die Ergebnisse einer Unterbrechung des Ubuntu-Testkerns gemeldet. Es kann sein, dass, wenn jemand einen Erfolg melden kann, der Ubuntu-Entwickler ermutigt wird, endlich die Fehlerbehebung einzubeziehen. Ich könnte mich jedoch irren, ich bin nicht zu 100% sicher, was das alles aufhält.

Es gibt auch eine bekannte Problemumgehung. Sie können den Absturz vermeiden, indem Sie die Kernel-Befehlszeile so konfigurieren, dass die Option scsi_mod.scan=sync enthalten ist.

https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1776887


Es wurde bestätigt, dass dieser Upstream-Fehler Ubuntu-Benutzer betrifft [1]. Gemäß dem Fix-Commit (siehe unten) ist das häufigste Symptom ein Absturz von Xorg/Xwayland, d. H. Das Beenden der gesamten GUI, wenn ein Laptop aus dem Ruhezustand des Systems geweckt wird. Die Häufigkeit des Fehlers wird als einmal alle paar Tage beschrieben [2].

[1] ZB Dieser Benutzer bestätigt den Fehler und die sehr spezifische Problemumgehung: https://bugs.launchpad.net/ubuntu/+source/xorg-server/+bug/1760450/comments/11

[2] ZB Dieses Protokoll der Abstürze: https://bugzilla.redhat.com/show_bug.cgi?id=1553979#c2

Dies ist ein Fehler in blk-core.c. Es ist nicht spezifisch für einen Hardwaretreiber. Technisch wird der Suspend-Bug vom SCSI-Core ausgelöst - der von allen SATA-Geräten verwendet wird .

Das Commit beinhaltet auch einen Test, der schnell und zuverlässig die Existenz eines schrecklichen Fehlers beweist.

Ich vermute, Sie könnten diesen Fehler nur vermeiden, wenn Sie root auf NVMe haben. Die andere Möglichkeit, Xorg nicht zum Absturz zu bringen, besteht darin, nicht den gesamten Arbeitsspeicher zu nutzen, sodass kein Druck entsteht, der dazu führt, dass kalte Seiten von Xorg ausgetauscht werden. Sie können den Xorg-Absturz auch nicht reproduzieren, wenn Sie sofort anhalten und fortsetzen. (Dies hat meine Tests an einem Punkt vereitelt und erst ausgelöst, nachdem das System während des Mittagessens angehalten wurde :).

Fix: "Block: verwende nirgends unterbrechbares Warten"

in Kernel 4.17: https://github.com/torvalds/linux/commit/1dc3039bc87ae7d19a990c3ee71cfd8a9068f428

in Kernel 4.16.8: https://git.kernel.org/pub/scm/linux/kernel/git/stable/linux-stable.git/commit/?h=linux-4.16.y&id=7859056bc73dea2c3714b00c83b253d4c22bf7b6

fehlende Korrektur in 4.15.0-24.26 (Ubuntu 18.04): https://git.launchpad.net/~ubuntu-kernel/ubuntu/+source/linux/+git/bionic/tree/block/blk -core.c? id = Ubuntu-4.15.0-24.26 # n856

Das heißt, dieser Fehler ist immer noch im Ubuntu-Quellpaket linux-4.15.0-24.26 (und 4.15.0-23.25) vorhanden. Ich hänge Hardwaredetails (lspci-vnvn.log) eines Systems an, auf dem dieser Fehler bekanntermaßen auftritt.

Grüße Alan

Abhilfe: Verwenden Sie den Kernel-Parameter: scsi_mod.scan = sync

10
sourcejedi