[Freifunk-Bonn] Status Infrastruktur nach Hardwareausfall

Daniel Meißner daniel at 3st.mine.nu
Mi Mai 16 02:19:50 CEST 2012


Hallo,

hier in aller Kürze der aktuelle Stand. Vor knapp einer Woche ist
unserer Server im STW wegen defektem Netzteil ausgefallen. Wie sicher
einige bemerkt haben, war davon neben der Mailingliste, die
Internetseite, DNS und unser Tinc-Management inkl. interner
Infrastruktur wie DHCP und DNS betroffen.

Wir konnten die wichtigsten Baustellen (Wiki, direktes Mailing) auf
eine Instanz auf Paul aktivieren. DHCP und DNS für das interne Netz
haben wir komplett auf den Exit in Berlin (felicitas) verschoben. Das
sollte auch langfristig so bleiben.

Vor ein paar Tagen haben wir vom STW eine
neue VM bekommen (vielen Dank noch mal dafür), die den physikalischen
Server komplett ersetzen soll. Der aktuelle Stand sieht derzeit so aus:

Auf STW-VM (paula):
- Mailmann und Postfix wieder aktiviert
- OpenVZ Container für {mail,wiki,dns} und Felix (interne
Infrastruktur) erstellt
- Backup der Instanz und grundlegende Nagios Checks sind auch
wieder aktiv

Auf felicitas:
- Tinc-Management wieder aktiviert https://register.kbu.freifunk.net
- upload_cert.sh im lffenv angepasst und Image neu gebaut


Was bis Sonntag mindestens noch gemacht werden sollte:
- Image mit der neuen Tinc-MGT-URL testen
- automatisches Verschieben der tinc-pub-keys testen
- gucken ob alle, die was an den neuen oder alten Kisten machen wollen
auch rauf kommen (jan sollte eigentlich überall Zugriff haben)
- rDNS Records anfragen (212.201.69.55 -> paula.kbu.freifunk.net
195.54.164.204 -> paulina.kbu.freifunk.net)

--> Im Zweifel müssen die pub-keys die ihr am Sonntag erstellt,
händisch auf felicitas kopiert werden.


Derzeit ist alles etwas chaotisch, da wir für so einen Ausfall noch
nicht gewappnet waren. Folgende Baustellen sollten wir direkt nach der
Sigint angehen:

1. STW-VM soweit fertig machen, dass wir jails für {Wiki,Mail,DNS} und
FF-Netz (felix) machen können (soweit fast fertig)

2. Wiki,Mail,DNS wieder komplett konfigurieren (Ursprungszustand)
(noch nicht komplett)

3. Felix jail wieder komplett konfigurieren (aktuell komplett br0ken)

4. DNS umbauen (momentan komplett kaputt, der sec. DNS läuft derzeit
bei mit im primary-Mode) 
  a) zwei primär Server auf eigener Infrastruktur
  b) Record failover

5. DHCP- und DNS-Failover auf Felix und Felicitas für das
interne FF-Netz 

6. Ticket-System, Zertifikat Management, Firmware

7. Wiki und Webseiten Weiterentwicklung


Soweit erst mal der aktuelle Stand von mir. Wie gesagt, alles sehr
chaotisch. Ich hoffe das gibt sich bald alles wieder.

Viele Grüße,
Daniel.



Mehr Informationen über die Mailingliste Freifunk-Bonn