Ein chinesisches Startup erschüttert das Selbstverständnis von Amerikas Tech-Sektor. Im Silicon Valley jubeln die einen und verzweifeln die anderen.
Das Herz des amerikanischen KI-Booms ist hipster-chic. Hiphop dröhnt über den Marktplatz in Hayes Valley, wo Männer und Frauen Gewichte in einem Freiluft-Fitnessstudios stemmen. In einer «Juice Bar» daneben gibt es Selleriesaft und Algenkonzentrat, Luxusboutiquen auf der anderen Strassenseite verkaufen Schlabberpullis für 170 Dollar.
Seit ein paar Jahren trägt das Quartier in San Francisco den Spitznamen «Cerebral Valley». Künstliche Intelligenz ist allgegenwärtig in Amerikas Technologiemekka, doch speziell Hayes Valley hat sich zu einer Art Hauptstadt der KI-Revolution entwickelt. Neue KI-Startups siedeln sich gezielt hier an, ihre Gründer wohnen in «Hacker Houses», allabendlichen trifft sich die Community bei KI-Meet-ups, Hackathons und Demo Days.
Glaubensgrundsätze bröckeln im Silicon Valley
Doch Amerikas Tech-Sektor wurde gerade vorgeführt. Der neuste und beste Chatbot kommt nicht mehr aus Kalifornien. Plötzlich hat ein wenig bekanntes Startup aus China ein Modell vorgestellt, das einen Bruchteil der Gelder kostete, die Open AI, Anthropic und andere Silicon Valley-KI-Firmen für ihre Modelle veranschlagen. Über Nacht ist Deepseek auf Millionen von Smartphones weltweit eingezogen – ein Blitz-Feldzug, den man bisher nur von Chat GPT kannte.
Glaubensgrundsätze bröckeln: Dass grössere KI-Modelle grundsätzlich besser sind. Dass die Entwicklung eines solchen Modells zwischen 100 Millionen und 1 Milliarde Dollar kostet. Dass man zwingend die neuesten Hochleistungschips von Nvidia braucht. Und nicht zuletzt, dass Amerikas Tech-Konzerne die KI-Revolution anführen.
Wie denkt man hier im Cerebral Valley darüber? «Das neue Modell von Deepseek ist wirklich gut», sagt ein junger Mann, der gegenüber dem Marktplatz in einem Café arbeitet – so wie etwa zwei Dutzend Millennials an diesem Nachmittag. Der 36-Jährige möchte seinen Namen nicht nennen, er arbeite als App-Entwickler für ein KI-Startup. Auf seinem Laptop klebt ein Sticker der Firma Anthropic.
Deepseek habe er schon seit drei bis fünf Monaten auf dem Schirm gehabt, erzählt er, «hier in den Kreisen war das allen ein Begriff.» Wie gut das jüngste Modell von Deepseek ist, habe ihn trotzdem überrascht: Die Qualität der Ergebnisse und die niedrigen Entwicklungskosten seien bemerkenswert. Wird das die Arbeit hier verändern? Er nickt. «Der Druck auf Firmen wird enorm steigern – und auch die staatlichen Förderungen», glaubt er: Der globale Wettkampf um die KI-Führerschaft zwischen China und den USA werde nun richtig ausbrechen.
Big Tech gibt sich nach Aussen gelassen – und richtet «War Rooms» ein
Vor allem die Big Tech Konzerne müssen sich nun Grundsatzfragen stellen. Der Vorwurf steht im Raum, dass die Konzerne ineffizient vorgehen und Kapital verschwenden. Wenn Meta und Microsoft am Mittwoch ihre Quartalszahlen präsentieren, dürften die Analytiker einige Fragen haben.
Der Vorstoss von Deepseek wirkt besonders bizarr zu einem Zeitpunkt, an dem Amerikas Tech-Konzerne gerade Milliarden-Investitionen in KI angekündigt haben: Im Zuge des jüngst angekündigten «Project Stargate» wollen Open AI, Oracle und Softbank eine halbe Billion Dollar für KI-Infrastruktur ausgeben.
Auch der Meta-Konzern kündigte gerade an, allein dieses Jahr 65 Milliarden Dollar für KI ausgeben zu wollen. Man baue ein neues Datenzentrum «so gross, dass es weite Teile Manhattans abdecken würde», sagte der CEO Mark Zuckerberg am Freitag. Die Investoren dürften sich nun fragen, ob es nicht reichen würde, eine Garage in Manhattan zu mieten, um das weltbeste KI-Modell zu bauen.
Bei Meta scheint nun Panik ausgebrochen zu sein: In vier eigens eingerichteten «War rooms» sezierten KI-Forscher die Algorithmen von Deepseek, berichtet «The Information». Mit Hochdruck versuche man abzuleiten, wie Meta das eigene Llama-Modell billiger und effizienter machen können. Noch dieses Quartal will soll die nächste Version von Llama herauskommen.
Bei Microsoft, das etwa 14 Milliarden Dollar in Open AI investiert hat, bemüht man sich um demonstrative Gelassenheit. «Das Jevons-Paradoxon hat wieder zugeschlagen», schrieb der CEO Satya Nadella auf X – wenn man eine Ressource effizienter herstellen könne, würde sie langfristig dennoch mehr nachgefragt. Dass er den Beitrag spät am Sonntagabend postete, könnte darauf hindeuten, dass er die Entwicklung nicht ganz so entspannt sieht. Es sei genau die Antwort, die man von Microsofts CEO angesichts der Panikverkäufe von Investoren erwarte, urteilte ein Kommentator der «New York Times».
Jevons paradox strikes again! As AI gets more efficient and accessible, we will see its use skyrocket, turning it into a commodity we just can’t get enough of. https://t.co/omEcOPhdIz
— Satya Nadella (@satyanadella) January 27, 2025
Startups wechseln bereits zu Deepseek
Viele Startups wiederum geben sich pragmatisch: Er sei schon vergangenen Herbst von Anthropic zu Deepseek gewechselt, erzählte ein Fintech-Gründer dem «Wall Street Journal». Tests hätten gezeigt, dass die Ergebnisse der beiden Modelle vergleichbar gut seien, aber die Kosten von Deepseek würden nur ein Viertel der von Anthropic ausmachen.
Auch der Gründer Richard Socher hat Deepseek nun kurzerhand in sein kalifornisches Startup you.com integriert, das KI-Assistenten basierend auf mehreren Modellen anbietet. «Es ist ohnehin der bessere Ansatz, flexibel zu bleiben», sagte der gebürtige Deutsche gegenüber der NZZ.
Socher, der selbst zu den führenden KI-Forschern zählt, gibt sich auch kritisch zum Erfolg von Deepseek. «China nimmt seit Jahren Ideen aus dem Westen und skaliert diese zu günstigeren Kosten.» Auf den Punkt weisen auch andere amerikanische Experten hin: Der Erfolg von Deepseek sei in dieser Form nur möglich gewesen, weil das Startup auf die Forschung aufbauen konnte, in die amerikanische Konzerne Hunderte Milliarden von Dollar investiert hätten.
Socher sieht auch die Behauptung kritisch, dass das Modell nur 5,6 Millionen Dollar in der Entwicklung gekostet habe. Diese Zahl beinhalte nicht die Anschaffungskosten der GPUs, sagt er, und auch nicht die Experimente mit Hyperparametern. Dies sind Parameter, die zur Steuerung des Trainingsalgorithmus verwendet werden und deren Wert im Gegensatz zu anderen Parametern vor dem eigentlichen Training des Modells festgelegt werden muss. Gleichzeitig zeige der Fall Deepseek, dass Fortschritte bei den Algorithmen weiterhin wichtig sein werden. «Der grösste GPU-Cluster wird nicht zwingend gewinnen.»
Wagniskapitalgeber sind begeistert
Die Ansicht scheinen auch einige Wagniskapitalgeber zu teilen. Das Modell von Deepseek sei ein «Sputnik»-Moment, schrieb Marc Andreessen, einer der bekanntesten Silicon Valley-Investoren, auf X, und lobte das Modell ausgiebig.
Nach dem Sputnik-Moment im Kalten Krieg gingen die Investitionen in die Raumfahrt bekanntlich richtig los. Tatsächlich könnte Deepseek gute Nachrichten für Startups bedeuten, in die Investoren wie Andreessen investieren: Dank zunehmenden Effizienzgewinnen bei der KI können kleine Firmen mit geringem Budget zum Shootingstar der KI-Revolution werden.
Das betonte auch Zack Kass, ein amerikanischer KI-Experte und früherer Topmanager bei OpenAI, gegenüber dem «Wall Street Journal»: Deepseek zeige, dass knappe Ressourcen häufig die Kreativität beflügelten.
In Hacker Houses werden Gründer verwöhnt
Applications for next HF0 batch open today: https://t.co/m9EkGb3s84
It’s a twelve week residency for ten of the top engineer founders in the world. (1/5) pic.twitter.com/8mNJXnEsWn
— Dave Font (@davefontenot) December 19, 2022
Kass´ Aussage stimmt besonders nachdenklich, wenn man vom Marktplatz in Hayes Valley quer durch das «Cerebral Valley» spaziert, bis zum Hügel des Alamo Square Park. Hier zeigt sich San Francisco wie aus dem Bilderbuch, es war einst die Kulisse der Kultfernsehserie «Full House». Heute sind viele der viktorianischen Villen zu «Hacker Houses» umfunktioniert – hippe Wohngemeinschaften für KI-Gründer.
Eines der bekanntesten ist das HF0-House: In der Prunkvilla residierte vor hundert Jahren der Erzbischof von San Francisco, nun werden hier die Stipendiaten des «Hacker Fellowship Zero» zwölf Wochen lang gepampert. Kost, Logie, Wäscheservice und 250 000 Dollar in Startup-Finanzierung – um nichts sollten sich die Gründer sorgen müssen, lautet das Versprechen an die Fellows. Früher wurden einige der besten Startups bekanntlich in Garagen gegründet. Die Frage ist, ob diese Garagen noch im Silicon Valley stehen – oder zunehmend in China.