Mittwoch, Januar 29

Ein neuer Chatbot des chinesischen Startups DeepSeek versetzt den westlichen Technologiesektor in Aufregung. Das Wettrüsten im Bereich der künstlichen Intelligenz geht in die nächste Phase.

Die Tech-Welt ist in Aufruhr. DeepSeek, ein chinesisches Startup-Unternehmen auf dem Feld der künstlichen Intelligenz (KI), hat in den vergangenen Tagen die Twittersphäre zum Glühen gebracht. Ein von DeepSeek lanciertes grosses Sprachmodell (Large Language Model, LLM) soll mindestens so gut abschneiden wie ähnliche Produkte von amerikanischen Anbietern wie OpenAI oder Google, benötigt dabei aber nur einen Bruchteil an Rechenkapazität.

Optimieren Sie Ihre Browsereinstellungen

Themarket.ch benötigt JavaScript für wichtige Funktionen. Ihr Browser oder Adblocker verhindert dies momentan.

Bitte passen Sie die Einstellungen an.

Marc Andreessen, ein bekannter Risikokapital-Investor im Silicon Valley, nennt das Modell von DeepSeek auf X «eine der erstaunlichsten und beeindruckendsten Errungenschaften, die ich je gesehen habe». Es sei der «Sputnik-Moment» für KI, schreibt Andreessen in einer Reminiszenz an das Jahr 1957, als die Sowjetunion mit dem Sputnik-1 den weltweit ersten Satelliten in den Orbit brachte.

Die Aktienmärkte reagieren heute Montag mit erheblicher Verunsicherung auf die Nachrichten. Die Futures auf den Nasdaq 100 verlieren im Verlauf des Montagmorgens mehr als 4%, die Aktien des Chipdesigners Nvidia büssen im vorbörslichen Handel mehr als 12% ein.

Die Aktienkurse diverser Unternehmen, die in den vergangenen Wochen und Monaten vom Hype rund um das Thema KI profitiert haben, erleiden empfindliche Rückschläge: Zulieferer der Halbleiterindustrie wie ASML (–10%) in den Niederlanden, Toky Electron (–5%) und Advantest (–8,9%) in Japan oder auch VAT (–8%) und Comet (–9%) in der Schweiz geraten ebenso auf die Verkaufslisten wie Industrie- und Energiekonzerne wie Siemens Energy (–19%) oder Schneider Electric (–10%).

Plötzlich wird an den Finanzmärkten die bange Frage gestellt, ob die milliardenschweren Investitionen amerikanischer Tech-Konzerne wie Microsoft oder Meta Platforms – von denen unzählige Zulieferer von Nvidia bis zur schweizerischen Belimo profitieren – noch gerechtfertigt sind.

Was ist geschehen, und was ist DeepSeek?

Keine unbekannte Grösse in der Tech-Welt

DeepSeek ist ein 2023 erstmals in Erscheinung getretenes, auf die Entwicklung von KI-Modellen spezialisiertes Unternehmen aus Hangzhou, China. Es entstand aus einem Spin-off aus dem Hedge Fund High-Flyer, der umgerechnet rund 8 Mrd. $ an Vermögen verwaltet und seit 2021 allein basierend auf KI-Modellen investiert. Gründer von High-Flyer und DeepSeek ist der 40-jährige Liang Wenfeng.

DeepSeek ist keine unbekannte Grösse in der Tech-Welt. Bereits im Verlauf des vergangenen Jahres sorgte das Unternehmen für Aufsehen, als es mit den LLM-Versionen V2 und V3 KI-Anwendungen lancierte, die mit ihrer Leistung überraschten und deutlich günstiger waren als vergleichbare Angebote. Im November schlug DeepSeek abermals Wellen in der Tech-Welt mit einer Vorankündigung der neuen Version R1, einem auf V3 basierenden Chatbot.

Diese Plattform, R1, hat DeepSeek nun in der vergangenen Woche im Detail vorgestellt – just am 20. Januar zu dem Zeitpunkt, als in Washington Präsident Donald Trump in seinem Amt vereidigt wurde.

DeepSeek R1 – das, was Andreessen als Sputnik-Moment bezeichnete – hat es im App Store von Apple bereits auf die Spitzenposition geschafft, vor ChatGPT.

Das System artikuliert seine Gedanken, bevor es seine Antworten zu den vom Nutzer eingegebenen Fragen formuliert. Als bahnbrechend wird es in der Tech-Welt unter anderem deshalb betrachtet, weil es in einer «Mixture of Experts»-Architektur funktioniert, die je nach Abfrage andere Bereiche der KI als «Experten» konsultiert. Das neuronale Netz von DeepSeek verfügt zwar insgesamt über mehr als 670 Mrd. Parameter, aber je nach Abfrage müssen jeweils «nur» 37 Mrd. Parameter aktiv sein. Zudem wählt es je nach Abfrage, welches Niveau an Präzision für die Antwort erforderlich ist. Das alles verringert die benötigte Rechenleistung signifikant.

Für Aufsehen an den Finanzmärkten sorgte primär die Aussage von DeepSeek, der Lernprozess des Systems habe insgesamt bloss 2048 GPU-Prozessoren (Graphics Processing Unit) des Typs H800 von Nvidia benötigt und hätte dabei Kosten von nur 5,6 Mio. $ verursacht. Für vergleichbare Modelle von OpenAI, Anthropic, Meta und Google galt es bisher als normal, dass für ihr Training bis zu 100’000 Nvidia-Chips der neusten Generation sowie Investitionen von 100 Mio. $ und mehr notwendig sind.

DeepSeek pflegt den Open-Source-Ansatz und publiziert alle Informationen zur Architektur ihrer KI-Systeme. R1 sowie eine Reihe kleinerer, aus R1 «destillierte» Versionen sollen ab Februar in einem Lizenzsystem für Chatbot-Anwendungen zur Verfügung gestellt werden. Dabei werden sie um den Faktor 20 bis 40 günstiger angeboten als vergleichbare Systeme von OpenAI.

Für zusätzliche Verunsicherung sorgten die Ankündigungen von DeepSeek, weil die US-Regierung in den vergangenen Jahren zunehmend strikte Ausfuhrbeschränkungen für Halbleiter durchgesetzt hatte, mit dem erklärten Ziel, den Fortschritt Chinas auf dem Gebiet der KI zu bremsen. Trotzdem soll es DeepSeek nun geschafft haben, mit älteren Chip-Modellen zur Spitze aufzuschliessen.

DeepSeek besitzt viel Rechenleistung

Sind die KI-Investitionen der westlichen Tech-Konzerne nun obsolet, und waren die Exportboykotte der US-Regierung nutzlos?

Stacy Rasgon, Halbleiter-Analyst von Bernstein Research, mahnt in einer Kurzstudie, die genannten Kosten von 5,6 Mio. $ für das Training des Systems seien mit grosser Wahrscheinlichkeit aus dem Zusammenhang gerissen. Er schätzt die totalen Kosten für das Training von DeepSeek R1 höher ein, während er gleichwohl einräumt, dass es dem Unternehmen gelungen sei, die Aufwendungen für Rechenkapazität deutlich zu senken.

Jordan Schneider, Autor des Blogs China Talk, relativiert zudem die Aussage, wonach es DeepSeek gelungen sei, mit bloss einer Handvoll «schwacher» Nvidia-Chips die amerikanischen Rivalen zu schlagen. Der H800-Chip sei von Nvidia spezifisch entwickelt worden, um die ersten, im Oktober 2022 von der Biden-Regierung verhängten Restriktionen zu umgehen. So dürfte es dem chinesischen Unternehmen gelungen sein, sich genügend Kapazitäten zu sichern, bevor die US-Regierung ihre Restriktionen verschärfte. DeepSeek verfüge gerüchteweise über einen Cluster von 50’000 H800-Chips, einen Cluster von 10’000 A100-Chips und habe ungehinderten Zugang zu Cloud-Rechendiensten weltweit, schreibt Schneider.

Das Wettrüsten geht weiter

Insgesamt betrachtet zeigt DeepSeek nach Einschätzung von The Market primär, dass der Wettkampf auf dem Gebiet der KI zwischen den USA und China noch längst nicht zu Gunsten Amerikas entschieden ist. Vielmehr dürfte die Episode als Beispiel dienen, dass Knappheit – eine Folge der Exportrestriktionen Washingtons – als Ansporn für Innovation dienen kann.

Meta Platforms kündigte am vergangenen Freitag an, im laufenden Jahr 65 Mrd. $ in Rechenzentren und KI-Projekte zu investieren. OpenAI, Oracle und die japanische Softbank meldeten die Gründung des KI-Joint-Ventures Stargate samt Investitionen von 500 Mrd. $. Diese Beispiele zeigen: Das Wettrüsten geht ungehindert weiter. Nach Ansicht von Bernstein-Analyst Rasgon spricht diese Tatsache auch für fortgesetzt boomende Investitionen im Chipsektor. Er empfiehlt Nvidia und Broadcom zum Kauf.

Ob und wann sich die riesigen KI-Investitionen für «Hyperscaler» wie Microsoft, Amazon, Meta und Alphabet rechnen werden, steht derweil weiterhin in den Sternen. Der Auftritt von DeepSeek unterstreicht die von The Market formulierte These, dass 2025 zum Jahr der Entscheidung für KI wird.

Für die Anwender von KI sind die jüngsten Entwicklungen jedenfalls eine gute Nachricht: Die Kosten sinken, und die Qualität der Modelle steigt.

Exit mobile version