Netzwerkeffekte und Spezialisierung haben zu digitaler Monokultur geführt. Es ist an der Zeit, das IT-Rückgrat auf das Niveau zu bringen, das in einer vernetzten Welt nötig ist.
Nur langsam legt sich das Chaos. Flugzeuge heben wieder ab, Spitäler und Büros kehren zum Alltag zurück. Der Crowdstrike-Ausfall am Freitag könnte Hunderte Millionen bis ein, zwei Milliarden Franken an Schaden verursacht haben. Noch kann man das nicht sagen.
Auch zur Frage, was diesen Ausfall ausgelöst hat, dringen erst nach und nach Details durch. Es scheint eine Kombination von Schlamperei und unglücklichen Zufällen dazu geführt zu haben, dass ein einziger Fehler 8,5 Millionen Computer lahmlegen konnte. Es war zwar «nur» ein Prozent der Windows-Computer weltweit betroffen, allerdings gerade solche in kritischen Bereichen, ist doch Crowdstrike ein System, das wichtige Firmen vor Angriffen und Viren schützen soll.
Doch hinter den menschlichen und technischen Details dieses Einzelfalls steckt ein grösseres, systematisches Problem der heutigen digitalen Welt: Es herrscht digitale Monokultur. Und die macht verwundbar. Der Crowdstrike-Ausfall sollte als Alarmzeichen dafür ernst genommen werden, was auf dem Spiel steht, wenn wir weitermachen wie bisher.
Einige wenige Firmen beliefern die ganze Welt mit Software
Allein die Tatsache, dass jener von Crowdstrike wohl der grösste und schwerwiegendste IT-Ausfall der Geschichte ist, zeigt: Meistens geht alles gut. Eigentlich ist das allein fast ein Wunder, wenn man bedenkt, wie unsere IT-Welt aufgebaut ist.
Windows, Google, Apple: Grosse Teile der Software, die wir täglich benutzen, kommen von einigen wenigen Firmen. Die wiederum bauen zum Teil Codes aus Open-Source-Quellen ein, der nicht von bezahlten Mitarbeitern, sondern von Freiwilligen aktuell gehalten werden. Nur einige wenige Firmen beliefern die ganze Welt mit Software, um Netzwerke am Laufen zu halten und Cyberattacken abzuwehren.
Softwareprobleme sind komplex und gute Entwickler teuer. Zugleich kann eine Softwarelösung, einmal entwickelt, fast ohne Mehrkosten auf der ganzen Welt verbreitet werden. Es ist also logisch, dass sich IT-Firmen spezialisieren – und dass in der Folge sehr viele Abnehmer von sehr wenigen Anbietern abhängen.
Meist merken wir das gar nicht. Nur im Katastrophenfall lernen Laien die Namen der unseligen Firmen und Softwareschnipsel: Crowdstrike, Solarwinds, Log4j, Cloudflare. Ist der erste Schaden behoben, sind diese Namen bei den meisten auch wieder vergessen. Börsenkurse und Geschäftsbeziehungen erholen sich, die Welt dreht sich weiter. Bis zum nächsten Crash.
Jedes Spital hat ein Notstromaggregat, ebenso braucht es Notfall-Server
Dabei gäbe es durchaus Methoden, um Systeme krisensicherer zu machen.
Das erste Schlagwort ist Diversifizierung. Firmen mit kritischen Dienstleistungen sollten beispielsweise nicht nur auf einen, sondern auf mehrere Cloud-Anbieter setzen, um bei einem Ausfall zumindest teilweise weiter operieren zu können. In diesem Fall waren Macintosh- und Linux-Systeme nicht vom Ausfall betroffen: Diversifizierung hätte sich gelohnt.
Der zweite Punkt ist Redundanz: Jedes Spital hat ein Notstromaggregat für den Fall, dass der Strom ausfällt. Ebenso brauchen Firmen alternative Datenzentren und Back-up-Server. Dann kann bei Ausfällen zumindest ein Notbetrieb aufrechterhalten werden. Natürlich müssen Mitarbeitende für solche Fälle geschult werden.
Der dritte Punkt betrifft die Softwareanbieter selbst. Sie müssen stärker in Sicherheit investieren, noch genauer testen, Programmen möglichst wenig Zugriff auf das System geben und Updates wie das vom Freitag nach und nach ausrollen und nicht auf einen Schlag.
All diese Forderungen gehen auf Kosten der Effizienz. Deshalb wurden sie lange vernachlässigt. In den Anfängen der Digitalisierung war das vielleicht noch akzeptabel. Doch heute ist die Gesellschaft durchdigitalisiert. Computersysteme sind nicht mehr ein Teil unserer Infrastruktur – sie sind ihr Rückgrat.
Der Crowdstrike-Ausfall gibt einen Vorgeschmack darauf, wie dramatisch die Konsequenzen sein können, wenn in diesem zerbrechlichen System etwas schiefgeht. Nutzen wir den Schock als Alarmsignal, um es sicherer zu machen.