it-swarm.com.de

Wie kann der Festplattenstatus hinter Dell PERC H710 Raid Controller mit CentOS 6 überwacht werden?

Ich habe einen Dell-Server, auf dem CentOS 6 Mit PERC H710 Raid Controller-Karte mit Raid 5-Setup ausgeführt wird, und ich möchte den Festplattenfehler/Arbeitsstatus hinter dem Raid Controller überwachen.

Dann sollte ich in der Lage sein, ein Bash-Skript zu verwenden, um den Festplattenstatus zu überwachen und Alarm-E-Mails zu senden, wenn etwas schief geht.

Das Befehlstool LSI MegaRAID SAS(Über LSI MegaRAID SAS Linux Tools) für CentOS/Red Hat/Linux unterstützt PERC H710 und smartctl unterstützt es auch NICHT.

Basierend auf der Dell-Website wurde CentOS IS wird für diesen Server nicht unterstützt (NX3200 PowerVault) Und ich konnte kein Linux-Programm zur Überwachung der Festplatte herunterladen.

[[email protected] ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[[email protected] ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               Dell
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Weiß jemand, wie man den Festplattenstatus hinter Hardware-Raids auf Dell PERC H710 mit CentOS 6 überwacht?

26
Xianlin

S.M.A.R.T. ist nicht das letzte Wort in der Festplatten- oder Speicherüberwachung !! Es ist eine Komponente, aber moderne RAID-Controller verwenden sie zusammen mit anderen Methoden, um den Laufwerks- und Array-Zustand zu bestimmen.

Ich gehe davon aus, dass dies ein PERC-Controller in einem Dell PowerEdge-Server ist.

Der normale Linux-freundliche Ansatz zur Überwachung des Zustands der Dell-Hardware besteht darin, die Dell OMSA-Agenten für Linux über Yum - http://linux.Dell.com/wiki/index) zu installieren .php/Repository/OMSA # Yum_setup

yum install srvadmin-all installiert die gesamte Suite von Agenten. Nach der Installation können Sie den Befehl omreport verwenden, um Informationen abzurufen über Ihr Array.

Beispiele:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1
26
ewwhite

Sie können den Status SMART) der Festplatten mit dem Befehl smartctl anzeigen und es ist -d Streit. So zeigen Sie beispielsweise die erste Festplatte im Array an:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Dies ist unter Scientific Linux 6 (einem anderen RHEL6-basierten Betriebssystem) mit smartmontools-5.43-1.el6.x86_64 möglich.

26
Jonathan Barber

Die akzeptierte Antwort empfiehlt die Kühnheit yum install srvadmin-all. Blecch. Hier erfahren Sie, wie Sie es etwas weniger blecch-y machen (aber trotzdem blecch-y; Sie können auf der HP Plattform viel schlanker werden. Aber ich schweife ab ...) Damit meine ich, installieren Sie nur die Komponenten, die für die Verwaltung des Speichers auf Ihrem Computer erforderlich sind .

Übrigens, die direkte Antwort auf die Frage des Benutzers liegt im Punkt "Physische Festplatten auf vdisk 0 anzeigen" in der folgenden Liste.

wget -q -O - http://linux.Dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Zum .bashrc von root hinzufügen:

export PATH=$PATH:/opt/Dell/srvadmin/bin

Genießen:

RAID-Befehle

  • Alle physischen Festplatten auf Controller 0 anzeigen

    $ omreport storage pdisk controller=0
    
  • Alle logischen Datenträger auf Controller 0 anzeigen

    $ omreport storage vdisk controller=0
    
  • Alle physischen Festplatten auf vdisk 0 anzeigen

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Konfigurieren Sie eine vdisk neu, um raid1 von raid0 zu sein ( COOL !!!!)

    $ Sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Erstellen Sie eine vdisk auf einer neuen Festplatte:

    $ Sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ Sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Mehr Info

Übrigens, da dies IS nichts weiter als eine LSI MegaCLI-Karte der Marke Dell ist), finden Sie die Antwort von Han Solo möglicherweise noch besser! Ich muss sie jedoch noch ausprobieren.

Die Süße

Hier ist ein Beispiel für die Ausgabe von omreport, die über grep für ein köstliches Datenbündel geleitet wird:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : Dell(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : Dell(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D
10
Mike S

Ich hatte auch Probleme, es in CentOS zum Laufen zu bringen, und fand hier ein Arbeitspaket http://mirror.ndchost.com/software/lsi/

genannt " MegaCli-8.07.10-1.noarch.rpm "

Die Befehlsreferenz http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

Ich hoffe, es hilft.

7
Han Solo
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
3
user311347

Der Befehl perccli kann Ihnen auch viele Laufwerksinformationen anzeigen, wenn Sie ihn freundlich fragen:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Dies muss für jeden Enclosure-Steckplatz wiederholt werden, oder zumindest habe ich keine Möglichkeit gefunden, alles auf einmal mit einem einzigen perccli -Befehl zu drucken.

Es ist auch einfach zu installieren im Vergleich zu anderen, umfassenderen Optionen:

# curl -C - -O 'https://downloads.Dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccli is NOT eine umfassende Überwachungssuite wie Delll OMSA, aber es klingt so, als ob viele Leute nichts Umfassendes wollen und stattdessen einen anständigen brauchen , einfaches Werkzeug.

1
Steve Bonds