Schlechtes Serverwetter …

Seit Sonntag ist irgendwie der Wurm drin…

Mein erster Server bei Hetzner crashte seit Sonntag immer mal wieder; am Dienstag wurde dann prophylaktisch der Hauptspeicher getauscht, später am Tag hing die Kiste leider schon wieder :(

ditaa-Grafik

Stand 4.02.16

Seit dem 10. Februar werden die VMs neu verteilt, leider bedeutet das, neben dem Akt des Kopierens, daß sich auch die IP-Adressen der VMs ändern: bei Hetzner gibt’s max. 6 IPs (zu je 1 €/Monat extra), diese IPs sind servergebunden und daher müssen die umgezogenen VMs neue Netzwerkkonfigurationen bekommen.

Beim verschieben der VMs fiel dann auch auf, daß der Host bei xirra.net offensichtlich die erste Festplatte verloren hat:

root@angua:~# dmesg | tail -10 ; cat /proc/mdstat
[15149277.330746] sd 4:0:0:0: [sda] CDB: 
[15149277.330746] Write(10): 2a 00 00 01 84 c0 00 00 10 00
[15149277.330750] Write-error on swap-device (8:0:99528)
[15149277.331185] Write-error on swap-device (8:0:99536)
[15149277.331618] sd 4:0:0:0: [sda]  
[15149277.331619] Result: hostbyte=DID_BAD_TARGET driverbyte=DRIVER_OK
[15149277.331621] sd 4:0:0:0: [sda] CDB: 
[15149277.331621] Write(10): 2a 00 00 01 84 d0 00 00 10 00
[15149277.331625] Write-error on swap-device (8:0:99544)
[15149277.332067] Write-error on swap-device (8:0:99552)
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md0 : active raid1 sda3[0](F) sdb3[1]
      9992064 blocks super 1.2 [2/1] [_U]
      
md1 : active raid1 sdb4[1] sda4[0](F)
      954596160 blocks super 1.2 [2/1] [_U]
      
unused devices: 

Screenshot

Monitoring …

Immerhin, seit Dienstag haben wir ein rudimentäres Monitoring: auf einer dafür bereit­gestellten VM hat Thomas ein Ichinga-System (Nagios-Nachfolger/-Fork) aufgesetzt. Was jetzt definitiv fehlt, sind serverseitige Tests: neben CPU, RAM oder Prozessen eben auch der Status des RAIDs (HW oder SW) …

… aber immerhin haben wir nun schon einmal ein Monitoring.

ditaa-Grafik

Stand 11.02.16

Dies bemerkte auch, daß am Mittwoch morgen die »stats«-VM wegbrach: Kernel-Panic.

Alles in allem scheinen derzeit keine guten Bedingungen für Server vorzuherrschen. Und so wird es ggf. auch noch ein bißchen dauern, bis wir das Netz nach den ganzen Änderungen wieder stabil bekommen. Vieles wäre einfacher, hätten wir auch bei Hetzner einfach ein Subnetz, aus denen unsere Server ihre IPs beziehen — aber »hätte, hätte, Fahrradkette«: wir müssen nehmen, was da ist.

Anbei noch ein paar Notizen bzgl. KVM-Migration mit virsh: Quell- und Zielserver müssen gleich benannte Netzwerkkonfigurationen haben, sonst fällt die Migration auf die Nase:

root@angua:~# virsh migrate --persistent --copy-storage-all --verbose --desturi qemu+ssh://root@dorfl.uu.org/system gw03
error: internal error: No  'bridge' attribute specified with 

Auch will man für beständige Verbindungen zur Shell sorgen, so eine Übertragung des FS dauert schon mal etwas länger …

root@carrot:~# virsh migrate --live --persistent --undefinesource --copy-storage-all --verbose --desturi qemu+ssh://root@dorfl.uu.org/system cl-slave-01
Migration: [100 %]
root@carrot:~# Write failed: Broken pipe

Ansonsten hat mich »virsh migrate« positiv überrascht; daß ich auch zwischen zwei Kisten ohne shared storage VMs hin- und herschubsen kann, hatte ich nicht erwartet ;)