ALUA Rule for DataCore

When you are using DataCore or other Storage Devices / Vendor for your VMware Environment you should check this out here:

ESXi 6.7 hosts with active/passive or ALUA based storage devices may see premature APD events during storage controller fail-over scenarios (67006)
https://kb.vmware.com/s/article/67006

To Change the ALUA Rules on ESXi-Server running VMware ESXi 6.5 / 6.7 here the snippet

esxcli storage nmp satp rule list -s VMW_SATP_ALUA | grep DataCore
##REMOVE OLD RULE###
esxcli storage nmp satp rule remove -V DataCore -M "Virtual Disk" -s VMW_SATP_ALUA -c tpgs_on -P VMW_PSP_RR
### ADD NEW RULE###
esxcli storage nmp satp rule add -V DataCore -M "Virtual Disk" -s VMW_SATP_ALUA -c tpgs_on -P VMW_PSP_RR -O iops=10 -o disable_action_OnRetryErrors
esxcli storage nmp satp rule list -s VMW_SATP_ALUA | grep DataCore

But please check the actual DataCore FAQ 1556 before using this setting:
The Host Server – VMware ESXi Configuration Guide

Hope that Helps!

ESXi 6.7U3 qfle3 PSOD

You use Qlogic network card and the qfle driver maybe your ESXi-Host will run into a PSOD. In may case it was the qfle3f driver and the hosts ran serveral times into a PSOD. The version of the driver does not matter in this case. If you the FCoE adapters in hosts then the hosts will always send some communication over thes adapters. In some cases there happens a PSOD because nobody is answering.

If you install the driver you always install a driver package which includes 4 drivers.

-qfle3 => Network driver
-qfle3f => Fibre-Channel over Ethernet
-qfle3i => iSCSI
-qcnic => other network driver (don’t know the exact usage)

After a few cases with VMware I get the tip: “When you don’t use iSCSI/FCoE why don’t you remove it?”

If you remove the drivers and your storage is connected over iSCSI,FCoE you will lose storage connection! Always put your host into maintance mode before changes!
So if you don’t use the protocols/modules here how to remove them:

FCoE:
# esxcli software vib remove –vibname=qfle3f

iSCSI:
# esxcli software vib remove –vibname=qfle3i

Network drivers:

First check which drivers you are using because if you remove the you are using your ESXi-Host is disconnected from network after the reboot

Check network adapters and drivers:
# esxcli network nic list

# esxcli software vib remove –vibname=qcnic

# esxcli software vib remove –vibname=qfle3

After you have removed the modules reboot your hosts and you are done ūüôā

ESXi installation mit Lara auf Hetzner-Server

Wer wie ich noch einen Server bei Hetzner bestellt und nicht die 25‚ā¨ f√ľr das Einlegen eines ISOS m√∂chte kann auch den Backup-Space von Hetzner benutzen. Im Wiki von Hetzner gibt es eine Anleitung wie man vorgehen muss. http://wiki.hetzner.de/index.php/LARA#Nutzen_des_Backup_Space Denkt dran das bei einigen Hetzner Servern eine Realtek Netzwerkkarte eingebaut ist, diese wird im aktuellen … Continue reading “ESXi installation mit Lara auf Hetzner-Server”

Wer wie ich noch einen Server bei Hetzner bestellt und nicht die 25‚ā¨ f√ľr das Einlegen eines ISOS m√∂chte kann auch den Backup-Space von Hetzner benutzen.
Im Wiki von Hetzner gibt es eine Anleitung wie man vorgehen muss.
http://wiki.hetzner.de/index.php/LARA#Nutzen_des_Backup_Space
Denkt dran das bei einigen Hetzner Servern eine Realtek Netzwerkkarte eingebaut ist, diese wird im aktuellen ESXi Image nicht mehr Unterst√ľtzt und man muss den Treiber hinzuf√ľgen.
Hier eine Anleitung um den Treiber in das Iso zu bekommen, http://www.bussink.ch/?p=1228 oder http://www.vladan.fr/realtek-8169-nics-not-detected-under-esxi-5-5/
Viele Gr√ľ√üe
Sven
 

EX-Server mit VMware ESXi und LSI MegaRAID? Wöchentlich Kernel-Log checken!

Hetzner liefert die MegaRAIDs in den EX-Servern mit vorkonfiguriertem w√∂chentlichem Konsistenzcheck aus. Der Zeitpunkt kann variieren; bei meinen beiden Servern startet er in der Nacht von Freitag auf Samstag, um 3 Uhr UTC (4 Uhr aktuelle Deutschlandzeit). Er dauert √ľblicherweise bis 10:00-10:30, je nach sonstiger Festplattenlast. Der Check hinterl√§√üt seine Spuren im Kernel-Log. Ein Blick … Continue reading “EX-Server mit VMware ESXi und LSI MegaRAID? W√∂chentlich Kernel-Log checken!”

Hetzner liefert die MegaRAIDs in den EX-Servern mit vorkonfiguriertem w√∂chentlichem Konsistenzcheck aus. Der Zeitpunkt kann variieren; bei meinen beiden Servern startet er in der Nacht von Freitag auf Samstag, um 3 Uhr UTC (4 Uhr aktuelle Deutschlandzeit). Er dauert √ľblicherweise bis 10:00-10:30, je nach sonstiger Festplattenlast.
Der Check hinterläßt seine Spuren im Kernel-Log. Ein Blick in dieses Log kann also Рunabhängig von sonstigem Monitoring Рverraten, ob mit den Platten alles okay ist. Der Kernel-Log findet sich in /scratch/log/vmkernel.log auf dem ESXi-Host.
Der Ablauf sieht im Idealfall gek√ľrzt so aus:
[bash]
2013-03-23T03:03:14.749Z cpu1:2660)<6>megasas_hotplug_work[7]: aen event code 0x0027
2013-03-23T03:03:19.057Z cpu0:2657)<6>megasas_hotplug_work[7]: aen event code 0x0042
2013-03-23T03:03:19.111Z cpu5:2650)<6>megasas_hotplug_work[7]: aen event code 0x0023
2013-03-23T03:03:19.112Z cpu5:2654)<6>megasas_hotplug_work[7]: aen event code 0x0041
2013-03-23T03:04:24.358Z cpu0:2649)<6>megasas_hotplug_work[7]: aen event code 0x0041
2013-03-23T03:05:17.458Z cpu0:2649)<6>megasas_hotplug_work[7]: aen event code 0x0041
[…Jede Menge 0x0041…]
2013-03-23T09:10:13.970Z cpu0:2646)<6>megasas_hotplug_work[7]: aen event code 0x0041
2013-03-23T09:11:50.713Z cpu0:2657)<6>megasas_hotplug_work[7]: aen event code 0x0041
2013-03-23T09:13:19.215Z cpu0:2660)<6>megasas_hotplug_work[7]: aen event code 0x0041
2013-03-23T09:13:24.769Z cpu4:2652)<6>megasas_hotplug_work[7]: aen event code 0x003a[/bash]
Der exakte Wortlaut der Meldungen kann sich, je nach ESXi-Version, unterscheiden. √Ąltere Versionen f√ľgen z.B. zwischen die “aen event” Zeilen jeweils noch eine andere Zeile ein. Wichtig sind die Eventcodes. Diese bedeuten:
[bash]0x0027 – Partrol Read started
0x0042 – Consistency Check started
0x0023 – Patrol Read complete
0x0041 – Consistency Check progress
0x003a – Consistency Check done[/bash]
Zwischendurch k√∂nnen “Host Busy” Fehlermeldungen des Controllers erfolgen. Diese sehen oft dramatisch aus (Beispiel s.u.), haben aber erfahrungsgem√§√ü keine negativen Folgen.
Aus aktuellem Anlaß: Sollte der Strom von 0x0041-Events im Kernel-Log plötzlich abreißen oder Ihr feststellen, daß zu sonstigen Gelegenheiten nichts mehr in den Logs landet, kann dieses Kommando helfen:
[bash]esxcli system syslog reload[/bash]
Zusätzlich könnt Ihr, falls Ihr das MegaCLI installiert habt, mit folgendem Kommando den Fortschritt eines laufenden Checks, und den Status des Arrays, abfragen:
[bash]cd /opt/lsi/MegaCLI
./MegaCli -LDCC -showprog -LALL -AALL
./MegaCli -ldinfo -l0 -aall[/bash]
Ebenso kann man mit MegaCLI den Zeitpunkt des Checks konfigurieren, mit “MegaCli -AdpCcSched”; das habe ich aber noch nicht ausprobiert und m√∂chte daher keine verbindlichen Hinweise dazu geben.
Falls Ihr andere Statuscodes des Consistency Check im Kernel-Log vorfindet, könnt Ihr in der hier verlinkten PDF-Datei schauen. Dort steht drin, was sie zu bedeuten haben.
https://data.virtpro.eu/vmware/lsi-megaraid/A_Event_Info.pdf
[bash]2013-03-23T09:47:14.262Z cpu4:6362240)megasas: ABORT sn 651094276 cmd=0x2a retries=0 tmo=0
2013-03-23T09:47:14.262Z cpu4:6362240)<5>0 :: megasas: RESET -651094276 cmd=2a retries=0
2013-03-23T09:47:14.262Z cpu4:6362240)megaraid_sas: HBA reset handler invoked without an internal reset condition.
2013-03-23T09:47:16.733Z cpu6:2054)WARNING: LinScsi: SCSILinuxQueueCommand:1175:queuecommand failed with status = 0x1055 Host Busy vmhba1:2:0:0 (driver name: LSI Logic SAS based MegaRAID driver) – Message repeated 1218 times
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x41240071b200) 0x8a, CmdSN 0xeb from world 4836 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x41240079d2c0) 0x8a, CmdSN 0xf3 from world 4836 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x412400729e80) 0x2a, CmdSN 0xfffffadf9b655130 from world 4523 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x412400730100) 0x2a, CmdSN 0xfffffadf9b8d1830 from world 4523 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x41240078bac0) 0x2a, CmdSN 0xcd from world 4568 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:16.733Z cpu6:2054)ScsiDeviceIO: 2309: Cmd(0x412400708cc0) 0x2a, CmdSN 0xc7 from world 4568 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x0 D:0x8 P:0x0 Possible sense data: 0x0 0x0 0x0.
2013-03-23T09:47:17.297Z cpu6:6362240)<7>megaraid_sas: megasas_wait_for_outstanding: line 2131: AFTER HBA reset handler invoked without an internal reset condition: took 3 seconds. Max is 180.
2013-03-23T09:47:17.297Z cpu6:6362240)megaraid_sas: no more pending commands remain after reset handling.
2013-03-23T09:47:17.297Z cpu6:6362240)<5>megasas: reset successful
2013-03-23T09:47:17.307Z cpu7:416676)ScsiDeviceIO: 2291: Cmd(0x41240071b200) 0x8a, CmdSN 0xeb from world 4836 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x8 D:0x0 P:0x0
2013-03-23T09:47:17.307Z cpu7:416676)ScsiDeviceIO: 2291: Cmd(0x41240079d2c0) 0x8a, CmdSN 0xf3 from world 4836 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x8 D:0x0 P:0x0
2013-03-23T09:47:17.307Z cpu7:416676)ScsiDeviceIO: 2291: Cmd(0x41240075d980) 0x2a, CmdSN 0xca2a1e from world 2056 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x8 D:0x0 P:0x0
2013-03-23T09:47:17.307Z cpu7:416676)ScsiDeviceIO: 2291: Cmd(0x4124007c93c0) 0x2a, CmdSN 0xca2a1f from world 2056 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x8 D:0x0 P:0x0
2013-03-23T09:47:17.307Z cpu7:416676)ScsiDeviceIO: 2291: Cmd(0x412400775880) 0x2a, CmdSN 0xca2a22 from world 2056 to dev "naa.600605b00413718016b58fa5040e8e96" failed H:0x8 D:0x0 P:0x0
2013-03-23T09:47:17.307Z cpu4:5533)HBX: 2313: Waiting for timed out [HB state abcdef02 offset 4157440 gen 169 stampUS 8771157754484 uuid 50c7a484-d2cbdc06-4f03-5404a6a68f0e jrnl <FB 1794200> drv 14.54] on vol ‘Vega_Store’
2013-03-23T09:47:17.307Z cpu0:4059)HBX: 2313: Waiting for timed out [HB state abcdef02 offset 4157440 gen 169 stampUS 8771157754484 uuid 50c7a484-d2cbdc06-4f03-5404a6a68f0e jrnl <FB 1794200> drv 14.54] on vol ‘Vega_Store’
2013-03-23T09:47:17.398Z cpu7:2067)HBX: 231: Reclaimed heartbeat for volume 4f398b88-fbf1b358-ed03-5404a6a68f0e (Vega_Store): [Timeout] [HB state abcdef02 offset 4157440 gen 169 stampUS 8771170887971 uuid 50c7a484-d2cbdc06-4f03-5404a6a68f0e jrnl <FB 179$[/bash]

Software und Update Downloads

LSI Downloads:¬†http://www.lsi.com/products/storagecomponents/Pages/MegaRAIDSAS9260-4i.aspx MegaCLI – 5.5¬†http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/8.07.06_MegaCLI.zip VMWare SMIS Provider VIB – 5.5¬†http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/00_34_V0_01_SMIS_VMware_Installer.zip Firmware 4.9 ¬†http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/12.12.0-0139_SAS_2108_Fw_Image_APP2.130.373-2022.zip Die Aktuellen Patches gibt es bei VMware:¬†http://www.vmware.com/patchmgr/download.portal https://data.virtpro.eu/ f√ľr wget Bitte http://dl.virtpro.eu auf ESXi benutzen, da ESXi kein http(s) kann.

LSI Downloads: http://www.lsi.com/products/storagecomponents/Pages/MegaRAIDSAS9260-4i.aspx
MegaCLI Р5.5 http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/8.07.06_MegaCLI.zip
VMWare SMIS Provider VIB Р5.5 http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/00_34_V0_01_SMIS_VMware_Installer.zip
Firmware 4.9  http://www.lsi.com/downloads/Public/MegaRAID%20Common%20Files/12.12.0-0139_SAS_2108_Fw_Image_APP2.130.373-2022.zip
Die Aktuellen Patches gibt es bei VMware: http://www.vmware.com/patchmgr/download.portal
https://data.virtpro.eu/
f√ľr wget Bitte http://dl.virtpro.eu auf ESXi benutzen, da ESXi kein http(s) kann.

Informations Anzeige mit MegaCLI

[bash] /opt/lsi/MegaCLI # ./MegaCli -AdpAllInfo -aAll ============================================================================== Versions ================ Product Name : LSI MegaRAID SAS 9260-4i Serial No : SV22820638 FW Package Build: 12.12.0-0111 Mfg. Data ================ Mfg. Date : 07/12/12 Rework Date : 00/00/00 Revision No : 86B Battery FRU : N/A Image Versions in Flash: ================ FW Version : 2.130.353-1663 BIOS Version : … Continue reading “Informations Anzeige mit MegaCLI”

[bash]
/opt/lsi/MegaCLI # ./MegaCli -AdpAllInfo -aAll
==============================================================================
Versions
================
Product Name : LSI MegaRAID SAS 9260-4i
Serial No : SV22820638
FW Package Build: 12.12.0-0111
Mfg. Data
================
Mfg. Date : 07/12/12
Rework Date : 00/00/00
Revision No : 86B
Battery FRU : N/A
Image Versions in Flash:
================
FW Version : 2.130.353-1663
BIOS Version : 3.24.00_4.12.05.00_0x05160000
Preboot CLI Version: 04.04-020:#%00009
WebBIOS Version : 6.0-49-e_45-Rel
NVDATA Version : 2.09.03-0032
Boot Block Version : 2.02.00.00-0000
BOOT Version : 09.250.01.219
Pending Images in Flash
================
None
PCI Info
================
Controller Id : 0000
Vendor Id : 1000
Device Id : 0079
SubVendorId : 1000
SubDeviceId : 9260
Host Interface : PCIE
ChipRevision : B4
Number of Frontend Port: 0
Device Interface : PCIE
…[/bash]
 
[bash]
/opt/lsi/MegaCLI # ./MegaCli -LDInfo -L0 -a0
Adapter 0 — Virtual Drive Information:
Virtual Drive: 0 (Target Id: 0)
Name :
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0
Size : 2.728 TB
Is VD emulated : Yes
Mirror Data : 2.728 TB
State : Optimal
Strip Size : 64 KB
Number Of Drives : 2
Span Depth : 1
Default Cache Policy: WriteBack, ReadAhead, Cached, Write Cache OK if Bad BBU
Current Cache Policy: WriteBack, ReadAhead, Cached, Write Cache OK if Bad BBU
Default Access Policy: Read/Write
Current Access Policy: Read/Write
Disk Cache Policy : Disk’s Default
Encryption Type : None
Is VD Cached: No
Exit Code: 0x00[/bash]
 
[bash]
/opt/lsi/MegaCLI # ./MegaCli -PDList -Aall
Adapter #0
Enclosure Device ID: 252
Slot Number: 0
Drive’s postion: DiskGroup: 0, Span: 0, Arm: 1
Enclosure position: N/A
Device Id: 5
WWN: 5000c5004dfd1e39
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA
Raw Size: 2.728 TB [0x15d50a3b0 Sectors]
Non Coerced Size: 2.728 TB [0x15d40a3b0 Sectors]
Coerced Size: 2.728 TB [0x15d400000 Sectors]
Emulated Drive: Yes
Firmware state: Online, Spun Up
Commissioned Spare : No
Emergency Spare : No
Device Firmware Level: CC43
Shield Counter: 0
Successful diagnostics completion on : N/A
SAS Address(0): 0x4433221103000000
Connected Port Number: 1(path0)
Inquiry Data: Z1F0XS5MST3000DM001-1CH166 CC43
FDE Capable: Not Capable
FDE Enable: Disable
Secured: Unsecured
Locked: Unlocked
Needs EKM Attention: No
Foreign State: None
Device Speed: 6.0Gb/s
Link Speed: 6.0Gb/s
Media Type: Hard Disk Device
Drive Temperature :33C (91.40 F)
PI Eligibility: No
Drive is formatted for PI information: No
PI: No PI
Port-0 :
Port status: Active
Port’s Linkspeed: 6.0Gb/s
Drive has flagged a S.M.A.R.T alert : No
Enclosure Device ID: 252
Slot Number: 1
Drive’s postion: DiskGroup: 0, Span: 0, Arm: 0
Enclosure position: N/A
Device Id: 4
WWN: 5000c5004dfd1214
Sequence Number: 2
Media Error Count: 0
Other Error Count: 0
Predictive Failure Count: 0
Last Predictive Failure Event Seq Number: 0
PD Type: SATA
Raw Size: 2.728 TB [0x15d50a3b0 Sectors]
Non Coerced Size: 2.728 TB [0x15d40a3b0 Sectors]
Coerced Size: 2.728 TB [0x15d400000 Sectors]
Emulated Drive: Yes
Firmware state: Online, Spun Up
Commissioned Spare : No
Emergency Spare : No
Device Firmware Level: CC43
Shield Counter: 0
Successful diagnostics completion on : N/A
SAS Address(0): 0x4433221102000000
Connected Port Number: 0(path0)
Inquiry Data: Z1F0XRVMST3000DM001-1CH166 CC43
FDE Capable: Not Capable
FDE Enable: Disable
Secured: Unsecured
Locked: Unlocked
Needs EKM Attention: No
Foreign State: None
Device Speed: 6.0Gb/s
Link Speed: 6.0Gb/s
Media Type: Hard Disk Device
Drive Temperature :32C (89.60 F)
PI Eligibility: No
Drive is formatted for PI information: No
PI: No PI
Port-0 :
Port status: Active
Port’s Linkspeed: 6.0Gb/s
Drive has flagged a S.M.A.R.T alert : No
Exit Code: 0x00[/bash]
 
[bash]/opt/lsi/MegaCLI # ./MegaCli -PDList -Aall | egrep "Enclosure Device ID:|Slot Number:|Inquiry Data:|Error Count:|state"
Enclosure Device ID: 252
Slot Number: 0
Media Error Count: 0
Other Error Count: 0
Firmware state: Online, Spun Up
Inquiry Data: Z1F0XS5MST3000DM001-1CH166 CC43
Enclosure Device ID: 252
Slot Number: 1
Media Error Count: 0
Other Error Count: 0
Firmware state: Online, Spun Up
Inquiry Data: Z1F0XRVMST3000DM001-1CH166 CC43[/bash]

ESXi 5.x LSI MegaRAID SAS 9260-4i Raid-1 Rebuild

In diesem Abschnitt dokumentieren wir den Testlauf f√ľr einen Fall, den man als Serverbetreiber am liebsten nie haben m√∂chte: Ausfall einer Platte im RAID-1. Alle Aktionen in diesem Abschnitt f√ľhren wir mit dem MegaCli auf der Shell des Hosts durch. Erkennung eines Plattenausfalls Ein Plattenausfall √§u√üert sich darin, da√ü das Virtual Drive 0 nicht mehr … Continue reading “ESXi 5.x LSI MegaRAID SAS 9260-4i Raid-1 Rebuild”

In diesem Abschnitt dokumentieren wir den Testlauf f√ľr einen Fall, den man als Serverbetreiber am liebsten nie haben m√∂chte: Ausfall einer Platte im RAID-1.
Alle Aktionen in diesem Abschnitt f√ľhren wir mit dem MegaCli auf der Shell des Hosts durch.

Erkennung eines Plattenausfalls

Ein Plattenausfall √§u√üert sich darin, da√ü das Virtual Drive 0 nicht mehr als “Optimal” angezeigt wird. Ersichtlich wird dies im vSphere-Client unter¬†Configuration / Health Status:
Esxi-raid-degraded
Außerdem läßt es sich in der Host-Shell mittels MegaCli abfragen:
[bash]/opt/lsi/MegaCLI # ./MegaCli -ldinfo -lall -aall
Adapter 0 — Virtual Drive Information:
Virtual Drive: 0 (Target Id: 0)
Name :
RAID Level : Primary-1, Secondary-0, RAID Level Qualifier-0
Size : 2.728 TB
Is VD emulated : Yes
Mirror Data : 2.728 TB
State : Degraded
Strip Size : 64 KB
Number Of Drives : 2
[…]
Exit Code: 0x00[/bash]
Wir hoffen, da√ü dort “Degraded” steht und nicht “Failed”, was bedeuten w√ľrde, da√ü beide Platten ausgefallen sind. Allerdings w√ľrde der Server dann wohl nicht mehr booten.
Nat√ľrlich ist es unsch√∂n, manuell im vSphere-Client oder auf der Shell des Hosts nach RAID-Ausf√§llen schauen zu m√ľssen. Man m√∂chte wohl eher aktiv dar√ľber informiert werden. Daher ist – falls kein vCenter zur Verf√ľgung steht, das Email-Alarme unterst√ľtzt – eine Methode wie das –HIER– beschriebene Monitoring des RAID-Status mittels MegaCli, SCP und Zabbix empfehlenswert.
Zur Identifizierung der ausgefallenen Platte kann man ebenfalls im vSphere-Client nachschauen, oder wir holen wir uns die Info der physikalischen Platten im MegaCli. Interessant sind hier die Eintr√§ge “Enclosure Device ID”, “Slot Number” und “Firmware State”.
[bash]/opt/lsi/MegaCLI # ./MegaCli -pdlist -aall
Adapter #0
Enclosure Device ID: 252
Slot Number: 0
[…]
Firmware state: Online, Spun Up
Enclosure Device ID: 252
Slot Number: 1
Firmware state: Online, Spun Up[/bash]
Wenn dort etwas anderes als “Online” steht, z.B. “Failed”, “Unconfigured Bad”, “Missing” oder “Offline”, ist die Platte aus dem Array geflogen. Die Enclosure und Slot Nummer merken wir uns.

Forcierter Plattenausfall f√ľr den Test

Wir f√ľhren unseren Test durch, indem wir eine der Platten im RAID mit zwangs-offline setzen. Die Platte gilt dann als “ausgefallen”.
[bash]MegaCli -pdoffline -physdrv[252:1] -a0 # For test only, don’t do this on your server!!
Adapter: 0: EnclId-252 SlotId-1 state changed to OffLine.
Exit Code: 0x00[/bash]
Hieraufhin wird das Array als “Degraded” markiert, wie oben aufgelistet. In unserem Beispiel haben wir also die Enclosure ID 252, Slot Number 1 “bearbeitet”. Das physikalische Laufwerk f√ľrdie weiteren Kommandos ist damit die “252:1”.

Austausch der Platte

Zun√§chst markieren wir die ausgefallene Platte als “Missing”, falls dies nicht schon der Fall ist. Das Kommando¬†pdgetmissing¬†mu√ü die Platte melden.
[bash]/opt/lsi/MegaCLI # ./MegaCli -pdmarkmissing -physdrv[252:1] -a0
EnclId-252 SlotId-1 is marked Missing.
Exit Code: 0x00
/opt/lsi/MegaCLI # ./MegaCli -pdgetmissing -aall
Adapter 0 – Missing Physical drives
No. Array Row Size Expected
0 0 0 2861056 MB
Exit Code: 0x00[/bash]
Die “Array” und “Row” Nummern merken wir uns f√ľr sp√§ter.
Im Falle einer tats√§chlich defekten Platte w√ľrden wir diese jetzt zum Austausch durch den Support vorbereiten:
[bash] MegaCli -pdprprmv -physdrv[252:1] -a0[/bash]
Nach Austausch mu√ü die neue Platte u.U. mit Kommandos wie -pdmakegood oder -pdonline bereitgemacht werden. Der Status der Platte mu√ü jedenfalls “Unconfigured Good” sein. In unserem Testvorgang ist dies automatisch der Fall, da wir die Platte nicht tats√§chlich austauschen lassen.

Rebuild der neuen Platte

Die neue Platte wird als Ersatz f√ľr die ausgefallene bestimmt und der Rebuild gestartet. F√ľr “array” und “row” w√§hlen wir die Werte aus der Tabelle von eben:
[bash]/opt/lsi/MegaCLI # ./MegaCli -pdreplacemissing -physdrv[252:1] -array0 -row0 -a0
Adapter: 0: Missing PD at Array 0, Row 0 is replaced.
Exit Code: 0x00
/opt/lsi/MegaCLI # ./MegaCli -pdrbld -start -physdrv[252:1] -a0
Started rebuild progress on device(Encl-252 Slot-1)
Exit Code: 0x00[/bash]
Dann läuft der Rebuild. Über den Fortschritt können wir uns so informieren:
[bash]/opt/lsi/MegaCLI # ./MegaCli -pdrbld -showprog -physdrv[252:1] -a0
Rebuild Progress on Device at Enclosure 252, Slot 1 Completed 15% in 38 Minutes.
Exit Code: 0x00[/bash]
Nach Abschlu√ü des Rebuild ist die Platte dann wieder “Online” und das Array “Optimal”.

VMware ESXi 5.0 auf 5.1 Updaten ohne KVM Zugriff

Nach der Auslieferung des ESXi-Servers von Hetzner kann man √úberlegen, ob man die Updates f√ľr 5.0 Update 1 Updates einspielt, oder wie hier jetzt dargestellt das Update auf ESXi 5.1. Dabei ist zu bedenken, da√ü m√∂glicherweise noch nicht alle Drittanbieter-Software, die Verwendung finden soll, (vollst√§ndig) mit ESXi 5.1 kompatibel ist. Als Beispiel sei die Backup-Software … Continue reading “VMware ESXi 5.0 auf 5.1 Updaten ohne KVM Zugriff”

Nach der Auslieferung des ESXi-Servers von Hetzner kann man √úberlegen, ob man die Updates f√ľr 5.0 Update 1 Updates einspielt, oder wie hier jetzt dargestellt das Update auf ESXi 5.1.
Dabei ist zu bedenken, da√ü m√∂glicherweise noch nicht alle Drittanbieter-Software, die Verwendung finden soll, (vollst√§ndig) mit ESXi 5.1 kompatibel ist. Als Beispiel sei die Backup-Software “Veeam Backup & Replication” genannt, bei der noch nicht alle Funktionen unter 5.1 korrekt laufen.
Viele Dritthersteller erhalten offenbar von VMware erst sehr spät, quasi gleichzeitig mit der Allgemeinheit, Zugriff auf neue Major Releases, so daß einige Zeit vergeht, bis diese ihre Produkte angepaßt haben.
Wir empfehlen daher, mit dem Update auf 5.1 zu warten, bis Kompatibilit√§t hergestellt ist und die √ľblicherweise vorhandenen “Kinderkrankheiten” ausger√§umt sind.

Update auf ESXi 5.1

Wichtig:¬†Vor der Installation von Updates sollten alle VMs heruntergefahren und der Host √ľber den vSphere Client in den¬†Maintenance Mode¬†versetzt werden. Dies kann man nat√ľrlich auch mit Hilfe der CLI machen.
[bash]
# backup ESXi configuration to persist changes /sbin/auto-backup.sh
# enter maintenance mode
vim-cmd hostsvc/maintenance_mode_enter[/bash]

Herunterladen des Updates

Man kann hier das Offline Bundle Herunterladen: ESXi 5.1 Offline Bundle. Der Name der Datei: VMware-ESXi-5.1.0-799733-depot.zip.
Wenn man keinen Zugriff auf diese Datei hat, kann man auch Рwie weiter unten beschrieben Рeine andere Möglichkeit benutzen, um das Update einzuspielen.

Unterschiede zwischen Install und Update

Ein “Profil” im Sinne von VMware ist eine Zusammenstellung aller VIBs (√§hnlich wie .RPM oder .DEB Pakete einer Linux-Distribution), die auf dem ESXi installiert sein sollen. Einen Profilwechsel k√∂nnte man mit einem Distributions-Upgrade unter Linux vergleichen.
Zus√§tzlich ist zu beachten, da√ü im Gegensatz zu √ľblichen Linux-Systemen ein Gro√üteil des ESXi-Dateisystems beim Bootvorgang aus VIBs zusammengebaut wird. Der Inhalt von z.B.¬†/bin¬†oder¬†/sbin¬†ist nicht statisch auf der Platte abgelegt, sondern wird beim Booten aus VIBs ausgepackt.

  • Update: Hierbei werden alle existierenden Pakete durch neue Versionen im neuen Profil ausgetauscht. Pakete, die im neuen Profil nicht enthalten sind (z.B. das MegaCli oder die LSI-CIM-Provider), bleiben unangetastet.
  • Install: Hierbei werden zus√§tzlich zum Verhalten von “Update” alle Pakete gel√∂scht, die nicht im neuen Profil enthalten sind. Dies ist einer Neuinstallation unter Beibehaltung der Konfiguration gleichzusetzen.

Update mit Hilfe des Offline-Depots

[bash]
/vmfs/volumes/datastore1/ # esxcli software profile install -d /vmfs/volumes/datastore1/VMware-ESXi-5.1.0-799733-depot.zip -p ESXi-5.1.0-799733-standard
Installation Result
Message: The update completed successfully, but the system needs to be rebooted for the changes to be effective.
Reboot Required: true
VIBs Installed: VMware_bootbank_ata-pata-amd_0.3.10-3vmw.510.0.0.799733, VMware_bootbank_ata-pata-atiixp_0.4.6-4vmw.510.0.0.799733,
VMware_bootbank_ata-pata-cmd64x_0.2.5-3vmw.510.0.0.799733, VMware_bootbank_ata-pata-hpt3x2n_0.3.4-3vmw.510.0.0.799733,
VMware_bootbank_ata-pata-pdc2027x_1.0-3vmw.510.0.0.799733, VMware_bootbank_ata-pata-serverworks_0.4.3-3vmw.510.0.0.799733,
VMware_bootbank_ata-pata-sil680_0.4.8-3vmw.510.0.0.799733, VMware_bootbank_ata-pata-via_0.3.3-2vmw.510.0.0.799733,
VMware_bootbank_block-cciss_3.6.14-10vmw.510.0.0.799733, VMware_bootbank_ehci-ehci-hcd_1.0-3vmw.510.0.0.799733,
VMware_bootbank_esx-base_5.1.0-0.0.799733, VMware_bootbank_esx-dvfilter-generic-fastpath_5.1.0-0.0.799733, [
VMware_bootbank_esx-tboot_5.1.0-0.0.799733, VMware_bootbank_esx-xlibs_5.1.0-0.0.799733,

VIBs Removed: VMware_bootbank_ata-pata-amd_0.3.10-3vmw.500.0.0.469512, VMware_bootbank_ata-pata-atiixp_0.4.6-3vmw.500.0.0.469512,
VMware_bootbank_ata-pata-cmd64x_0.2.5-3vmw.500.0.0.469512, VMware_bootbank_ata-pata-hpt3x2n_0.3.4-3vmw.500.0.0.469512,
VMware_bootbank_ata-pata-pdc2027x_1.0-3vmw.500.0.0.469512, VMware_bootbank_ata-pata-serverworks_0.4.3-3vmw.500.0.0.469512,
VMware_bootbank_ata-pata-sil680_0.4.8-3vmw.500.0.0.469512, VMware_bootbank_ata-pata-via_0.3.3-2vmw.500.0.0.469512,

VIBs Skipped:[/bash]
Nach einem Neustart des System hat man die aktuellste Version vom ESXi.
Continue reading “VMware ESXi 5.0 auf 5.1 Updaten ohne KVM Zugriff”