Ankündigung Wartungsfenster auf trash.net am Sonntag 15.10.2006 ab 17:00
Grund: Einspielen Solaris Patch Cluster im Single User Mode
Auswirkung: Downtime von schätzungsweise weniger als einer Stunde
Risiken:
A) Wie immer beim Patchen könnten unerwartete Seiteneffekte auftreten. Bitte
allfällige Beobachtungen melden
B) Sollte ich die Konsole verlieren, wäre physischer Zugang nötig, was erst
ab Montag Morgen erfolgen könnte
Notfallkontakt über Email an truniger bei bluewin.ch
Othmar Truniger
URL http://www.truniger.ch/ Email mailto:Othmar@Truniger.ch
____________________________________________________
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1
Hallo zusammen
Diese Woche hatten wir wohl einer der laengsten Downtimes in der
Geschichte von trash.net. Leider war die Situation waehrend des Ausfalls
auch personell sehr schlecht (beinahe die komplette Techstaff war
abwesend oder nicht in der Naehe von Zuerich), deshalb dauerte die
Reparatur eine Weile.
Am 27.09. um ca. 13:00 wurde der Switchport von stinky deaktiviert, da
Storm-Control[0] aktiviert war und das Paketaufkommen am Interface von
stinky die gesetzten Limiten ueberschritt. Storm Control wurde
vermutlich von unserem Provider aktiviert nachdem andere Rechner im RZ
Opfer eine DDoS-Attacke wurden[1].
Da diese Ursache zu Beginn noch nicht bekannt war, wurde stinky per
Powerknopf rebooted. Leider stellte sich dabei heraus das aufgrund eines
Fehlers in einem Init-Skript des System nicht mehr korrekt bootete. Mit
sehr hoher Wahrscheinlichkeit wurde der Fehler beim Neukonfigurieren von
IPv6 anfangs Juni eingefuehrt und erst jetzt bemerkt, da
zwischenzeitlich kein Reboot stattfand.
Ab dem spaeteren Morgen des 28.09. war Zugriff per serieller Konsole
wieder moeglich und das defekte Initskript konnte repariert werden. Dies
war ab ca. 16:00 abgeschlossen.
Bis dann noch der abgeschaltete Switchport durch unseren Provider wieder
eingeschaltet wurde, dauerte es noch bis 17:30. Der Fehler sollte nicht
mehr vorkommen, da das Storm Control Feature nun abgeschaltet wurde.
Fuer den Ausfall moechten wir uns entschuldigen.
Gruss, Thomas.
[0]
http://www.cisco.com/univercd/cc/td/doc/product/lan/c3550/12225see/scg/swtr…
[1]
http://www.blogg.ch/index.php?/archives/527-Protokoll-einer-DDOS-Attacke.ht…
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.2.4 (Darwin)
iD8DBQFFICNheQV2j3WE9dgRAnozAJ9YOjEyeX0qBtFkGQ0gZC5RA2XRyACglaML
CS7mR5ESrhjpY/SKpOfOwdU=
=LCpN
-----END PGP SIGNATURE-----