it-swarm.com.de

Was bedeutet diese /dead.letter-Datei, in der von einer SMART Warnung gesprochen wird?

Ich habe gerade diese dead.letter -Datei in meinem Stammverzeichnis vor zwei Monaten gefunden:

$ ll /dead.letter 
-rw------- 1 root root      638 Sep 23 02:44 /dead.letter

Das ist sein Inhalt:

Date: Fri, 23 Sep 2016 02:44:47 +0200
To: root
Subject: SMART error (FailedOpenDevice) detected on Host:
 BC-AlkaliMetal
User-Agent: s-nail v14.8.6

This message was generated by the smartd daemon running on:

   Host name:  BC-AlkaliMetal
   DNS domain: [Empty]

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], unable to open device

Device info:
WDC WD10JPVX-22JC3T0, S/N:WD-WXH1E65DXFLK, WWN:5-0014ee-65bab5da7, FW:01.01A01, 1.00 TB

For details see Host's SYSLOG.

You can also use the smartctl utility for further investigation.
Another message will be sent in 24 hours if the problem persists.

Da es nun fast zwei Monate alt ist, kann ich über die Umstände, unter denen diese Datei erstellt wurde, leider nichts mehr sagen. Mein Notebook ist jedoch weniger als ein Jahr alt und der aktuelle SMART Status, wie in gnome-disks angegeben, ist alle gut. Ein kurzer Selbsttest wurde ebenfalls erfolgreich ausgeführt.

Was bedeutet das alles? Warum habe ich diese Datei und muss ich mir wegen des Fehlers/der Warnung Sorgen machen?

3
Byte Commander
  • Ich habe heute gerade einen gesehen, so neugierig, was in diesem dead.letter steckt (stammt von einem Hacker?: D). Ähnliche Inhalte:

    Date: Thu, 08 Dec 2016 00:48:26 +0100
    To: root
    Subject: SMART error (FailedOpenDevice) detected on Host:
     user.dz-blueskies
    User-Agent: s-nail v14.8.6
    
    This message was generated by the smartd daemon running on:
    
       Host name:  user.dz-blueskies
       DNS domain: [Empty]
    
    The following warning/error was logged by the smartd daemon:
    
    Device: /dev/sdb [SAT], unable to open device
    
    Device info:
    WDC WD20NMVW-11W68S0, S/N:WD-WX51A82P0486, WWN:5-0014ee-25cb067e3, FW:01.01A01, 
    2.00 TB
    
    For details see Host's SYSLOG.
    
    You can also use the smartctl utility for further investigation.
    Another message will be sent in 24 hours if the problem persists.
    

    User-Agent: s-nail ist das Mail-Tool, das man s-nail | grep -n dead überprüft und gefunden wurde, wie Rinzwind sagte.

    2334:     DEAD    The name of the file to use for saving aborted messages if save is set; this defaults to dead.letter in the user's HOME directory.
    2507:               DEAD=+dead.mbox
    

    smartd ist so konfiguriert, dass E-Mails von /etc/smartd.conf an den Benutzer root gesendet werden:

    DEVICESCAN -d removable -n standby -m root -M exec /usr/share/smartmontools/smartd-runner
    

    Der Fehler betrifft smartd, der den erreichbaren Geräteknoten /dev/sdb finden konnte (in meinem Fall ein externes USB-Laufwerk). Möglicherweise konnte ich nach einem unsauberen Auswurf keinen Test durchführen, da ich 30 Minuten auf den nächsten Smartd-Scan warten muss.

    $ grep smartd  /var/log/syslog
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 117 to 109
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Sending warning via /usr/share/smartmontools/smartd-runner to root ...
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Warning via /usr/share/smartmontools/smartd-runner to root produced unexpected output (118 bytes) to STDOUT/STDERR:
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: /etc/smartmontools/run.d/10mail:
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Cannot start "/usr/sbin/sendmail": executable not found (adjust *sendmail* variable)
    Dec  8 00:48:26 user.dz-blueskies smartd[1086]: Warning via /usr/share/smartmontools/smartd-runner to root: successful
    Dec  8 01:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 109 to 107
    Dec  8 01:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 01:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 107 to 106
    Dec  8 01:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 02:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 02:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 03:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 03:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 04:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 106 to 107
    Dec  8 04:18:26 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 04:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 107 to 106
    Dec  8 04:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 05:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 05:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 06:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 106 to 108
    Dec  8 06:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 06:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 108 to 109
    Dec  8 06:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 07:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 07:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 08:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 08:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 09:18:26 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 09:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 109 to 110
    Dec  8 09:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 10:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 110 to 108
    Dec  8 10:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 10:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 108 to 109
    Dec  8 10:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 11:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 11:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 109 to 108
    Dec  8 11:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 12:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 108 to 109
    Dec  8 12:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 12:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 109 to 108
    Dec  8 12:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 13:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sda [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 108 to 109
    Dec  8 13:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 13:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 14:18:26 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open() failed: No such device
    Dec  8 14:48:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], open device worked again, warning condition reset after 1 email
    Dec  8 14:48:26 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 120 to 128
    Dec  8 15:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], SMART Prefailure Attribute: 3 Spin_Up_Time changed from 211 to 210
    Dec  8 15:18:25 user.dz-blueskies smartd[1086]: Device: /dev/sdb [SAT], SMART Usage Attribute: 194 Temperature_Celsius changed from 128 to 121
    

    Übrigens, diese Temperaturmessungen scheinen nicht richtig zu sein (Celsius), realer als Fahrenheit.

  • Ich könnte die gleiche Syslog-Nachricht auch bei sicherem Auswerfen erhalten. SmartD scannt die Geräte beim Start und überwacht sie auch nach dem Auswerfen.

    Ihre Nachricht ist 23.09.2016 alt, alle 3 Monate, keine Protokolle mehr vorhanden und das Problem wurde nicht wiederholt, auch keine ausstehenden E-Mails. Ich denke, wir brauchen eine Möglichkeit, es zu reproduzieren, durch Verringern des Smartd-Intervalls, bearbeiten Sie die Systemd-Service-Datei.

    $ Sudo vim /lib/systemd/system/smartd.service
    ExecStart=/usr/sbin/smartd -n -i 10 $smartd_opts
    

    -i 10 für ein Intervall von 10 Sekunden. Beachten Sie jedoch, dass smartd diesen Wert als strengen Wert für die Datenabfrage und nicht für die Berichterstellung verwendet (zwischen den Nachrichten treten einige Intervalle von 11 Sekunden bis 5 Minuten auf).

    Starten Sie den Dienst neu:

    Sudo systemctl daemon-reload
    Sudo systemctl restart smartd
    

    Um es in einem Terminal zu verfolgen, verwenden Sie:

    tail -f /var/log/syslog | grep smartd
    
1
user.dz