Skip to content

Instantly share code, notes, and snippets.

@FlorianHeigl
Last active April 1, 2021 18:27
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save FlorianHeigl/56bf09654daaeced43191407688702ee to your computer and use it in GitHub Desktop.
Save FlorianHeigl/56bf09654daaeced43191407688702ee to your computer and use it in GitHub Desktop.
v3700 fixi

Anleitungen sind fuer 7.8.1 - marginal zu neu.

Reparatur / Backup

Config Backup

15 Min, vorab

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/svc_clusterconfmaintovr_1e4k2o.html

Diagnose

Procedure: Getting node canister and system information by using a USB flash drive

45 min, vorab.

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/tbrd_canclstrinfousb_7878io.html

  • Analyse der erstellten Datei(en)
  • An beiden Controllern versuchen (2 Sticks notwendig, vorher formatieren, vorher beschriften)

Procedure: Understanding the system status using the LEDs

30 min, vorab.

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/v3700_system_leds.html

  • LED Status komplex, viele Stati.
  • Schriftlich festhalten.

Reparatur / Abschaltung

Procedure: Fixing node errors

Dieser Schritt entfaellt.

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/tbrd_fixnodeerrors_1212df.html

Prozedur: auf der Seite ist keine Prozedur angegeben. Die anderen Resolution Prozeduren scheitern:

  • Node ist nicht mehr ueber Partner managebar
  • Node ist nicht per Service IP adressierbar.
  • Service IPs waren hoechstwahrscheinlich mehrfach im LAN vorhanden
  • Service IP config enthielt ein GW ausserhalb des subnets
  • Serieller Port ist nicht in den Handbuechern / Prozeduren erwaehnt

d.h kein LAN, kein Management.

Procedure: Powering off a node canister

Dieser Schritt entfaellt.

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/v3700_pwroff_node.html

nicht mgl.
wir wissen aber zumindest, dass der Node im Shutdown Status ist

Reparatur / Austausch

Servicing Storage Systems

Die Prozeduren immer vor dem Start der Aktion lesen und die mit Aus-/Umbauschritten mglst. ausdrucken.
Bei den Prozeduren auf Warnhinweise achten - teilweise steht klar STOP mit dort - das ist bindend.

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/svc_diskcontrservcontrtop_1dilom.html?pos=2

Replacing Parts

Uebersicht removable Parts

Preparing to remove and replace parts

Procedure: Removing a node canister

30 min, Risk Time / Downtime

https://www.ibm.com/support/knowledgecenter/STLM5A_7.8.1/com.ibm.storwize.v3700.781.doc/v3700_remove_nodecan.html

Aufgrund des schwerwiegenden Fehlers und unklaren Zustands (sollte so nicht auftreten) soll keine Re-seating Prozedur gemacht werden. D.h. wir entfernen / tauschen aus.

Entfernen ist straightforward:

  1. Node beschriften
  2. Kabel dieses Node markieren / nummerieren
  3. Kabel entfernen nach Prozedur
  4. Node entfernen nach Prozedur
  5. Systemzustand pruefen

Procedure: Replacing a node canister

30 min, Risk Time / Downtime fuer Umbau.
Reaktivierung lt. Dokumentation: >=25 Minuten wg. Multipath Failovers. Keine Aenderungen in dieser Zeit erlaubt.
Aus Erfahrung an der v7000 ist die Boot time bis zu 20 Min.

Replacing a node canister

Hier viel Augenmerk auf die Batterie richten:

  • im Normalfall wird sie aus dem alten Node Canister in den neuen Node Canister ummontiert.
  • neue Batterien muessen den richtigen Typ fuer Firmware der 7er Reihe haben.

In dem Bild markiert der Kreisel links die Lithium-BIOS-Batterie, und der lange Block rechts ist die Node Batterie.

Ausserdem sollte man auch auf das RAM Augenmerk richten - die Maschine(n) hat 4GB Ram in den Nodes, es sind aber 8GB supported und der Austausch scheint wirklich einfach nur das tauschen / erweitern eines DIMM zu sein. (DDR2 ECC?) Mit 8GB ist ein 'moderneres' Featureset/OS supported, ansonsten halt nicht.

Probleme und Infos dazu

Tote Batterie

Node incorrect placement

Liste aller Errorcodes

https://www.ibm.com/support/knowledgecenter/ST5Q4U_1.6.1/com.ibm.storwize.v7000.unified.161.doc/svc_error_code_reference.html

Memory capacity mismatch

OS Versionen

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment