
China Tech. (Photo: greanvillepost.com)
Die geopolitischen Auswirkungen von DeepSeek
von HONGDA JIANG, 26. Januar 2025
Lenin wurde oft (möglicherweise falsch) mit den Worten zitiert: «Es gibt Jahrzehnte, in denen nichts passiert, und es gibt Wochen, in denen Jahrzehnte passieren.» Unabhängig davon, ob die Zuschreibung korrekt ist oder nicht, wird diese Woche eindeutig als Teil der zweiten Kategorie in die Geschichte eingehen. Anfang dieser Woche veröffentlichte DeepSeek Artificial Intelligence Co., Ltd. – eine Tochtergesellschaft des chinesischen Hedgefonds «High-Flyer Quant» – die neueste Version seines Large Language Model (LLM): DeepSeek R1.
Seit ChatGPT bei Konsumenten populär wurde, arbeiten führende Technologieriesen auf der ganzen Welt an ihrer eigenen Version von LLMs – sei es Llama von Meta, Grok von X, Claude von Anthropic oder 01.AI von Beijing Zero One. Was die Modelle von DeepSeek von den oben genannten Konkurrenten abhebt, ist, dass sie in allen Bewertungskategorien eine vergleichbare oder bessere Leistung erzielen können, während sie nur einen Bruchteil der Zeit und des Geldes kosten, die der nächstbeste Konkurrent benötigt. Als Referenz: Berichten zufolge hat DeepSeek etwa 6 Millionen US-Dollar ausgegeben, um sein Modell zu trainieren, wobei etwa 2,8 Millionen GPU-Stunden auf mehr als 2000 Nvidia H800 GPUs verwendet wurden (die mit etwa 1/6 der Geschwindigkeit der fortschrittlichsten H100-Serie von Nvidia arbeiten). Dieses Kunststück gelang in weniger als 2 Monaten, kostete weniger als 10 Prozent so viel wie das zweitgünstigste Modell – Lama 3 (das mindestens 70 Millionen US-Dollar kostete) – und verbrauchte weniger als 6 Prozent der GPU-Stunden, die der schnellste nichtchinesische Konkurrent – GPT-4 von OpenAI (ca. 50–60 Millionen GPU-Stunden) – benötigte, obwohl letzterer Zugang zu hochmodernen Nvidia-GPUs hatte, die die minderwertigen H800 von DeepSeek bei Weitem übertreffen. Besser noch: Viele der Funktionen und Eigenschaften von DeepSeek sind Open Source unter einer «MIT-Lizenz» – das bedeutet, dass jeder die zugehörige Software und Dokumentation kostenlos und ohne Einschränkung kopieren, ändern und verbreiten kann.
Das ist ein revolutionärer Durchbruch in der noch jungen LLM-Branche, mit ein paar offensichtlichen strategischen Implikationen:
- Die US-amerikanischen Halbleitersanktionen gegen China sind gescheitert. Seit den ersten Exportkontrollen des Trump-Regimes gegen ZTE Ende 2017 (und später gegen Huawei Mitte 2018) haben die USA immer strengere Verbote für den Export von Halbleitern nach China verhängt. Diese Sanktionen verbieten nicht nur, hochentwickelte Halbleiter-Endprodukte nach China zu verkaufen, sondern auch, Halbleiter-Fertigungsanlagen zu verkaufen, damit China nicht in der Lage ist, auf die neuesten Halbleiter zuzugreifen und diese auch nicht herstellen kann. So soll sichergestellt werden, dass China hinter den USA zurückbleibt, was den Zugang zu den neuesten Fortschritten in der KI betrifft. Acht Jahre immer strengerer Sanktionen zwangen chinesische Unternehmen nicht nur dazu, ihre Eigenständigkeit in der gesamten Halbleiter-Wertschöpfungskette zu erhöhen (was für jedes Land in der Halbleiter-Wertschöpfungskette ein Novum darstellt), sondern auch dazu, ihre begrenzte Rechenleistung im Vergleich zu den US-amerikanischen Konkurrenten weitaus effizienter zu nutzen, um überdurchschnittliche Ergebnisse zu erzielen – wie es die neueste Errungenschaft von DeepSeek zeigt. Während das ursprüngliche DeepSeek-Modell mit in den USA hergestellten Nvidia H800s trainiert wurde, können nachfolgende Modelle möglicherweise mit Gegenstücken aus inländischer Produktion wie dem «Ascend 910C» von Huawei produziert werden. Die Ascend-Serie verfügt zwar nicht über die neuesten Fertigungsprozesse (TSMC 2nm), ist aber eine ausreichend leistungsfähige Plattform, um das DeepSeek R1-Modell in grossem Massstab zu betreiben. Tatsächlich haben DIY-Enthusiasten bereits gezeigt, dass die Basisversion der Open-Source-Software von DeepSeek auf leistungsschwachen Computern wie dem Raspberry Pi (allerdings ohne das vollständige 671-Milliarden-Parameter-Modell) ausgeführt werden kann, wobei der Stromverbrauch so gering ist wie der eines gewöhnlichen Smartphones.
- Die Bewertungen von US-amerikanischen Technologiegiganten müssen exponentiell nach unten korrigiert werden. Noch im vergangenen Jahr ging man davon aus, dass jedes Unternehmen, das ein LLM entwickeln möchte, hochentwickelte Hardware (die nur wenige Unternehmen wie Nvidia bereitstellen können) im Wert von Hunderten Millionen Dollar und Dutzende Millionen GPU-Stunden benötigt. Das bedeutete, dass nur die reichsten Technologieunternehmen der Welt – Google, Meta, Microsoft usw. – es sich leisten konnten, die Dienste eines LLM aufzubauen, zu warten und anzubieten. Folglich würden sich die Gewinne aus LLM-Diensten in den Händen einiger weniger Unternehmen mit einem Wert von mehreren Billionen Dollar (z. B. Nvidia) konzentrieren. Die Veröffentlichung von DeepSeek R1 hat diese Annahme widerlegt. Sie hat gezeigt, dass ein Start-up mit weniger als 10 Millionen USD ein Modell erstellen und trainieren kann, indem es ältere Hardware verwendet, die weit hinter dem neuesten Stand der Technik zurückliegt. Aufgrund der niedrigen finanziellen Eintrittsbarriere können also kleine Unternehmen ihre Dienstleistungen gewinnbringend zu einem Bruchteil des Preises anbieten. Dementsprechend müssen alle vom US-amerikanischen Technologieoligopol prognostizierten Profite (und somit auch die Gesamtbewertungen der Unternehmen) nun deutlich nach unten korrigiert werden, was gefährliche Folgen für die US-amerikanischen Finanzmärkte nach sich ziehen könnte.
- Der Globale Süden kann nun die Früchte von generativer KI geniessen. Die transformativste Auswirkung von DeepSeek betrifft nicht direkt China oder die USA, sondern den Rest der Welt (insbesondere den Globalen Süden). Da nun jeder auf der Welt Zugang zu einem leistungsstarken Open-Source-LLM mit relativ geringen Hardwareanforderungen hat, sind die finanziellen und hardwarebezogenen Eintrittsbarrieren, die den Globalen Süden bisher vom KI-Spiel ausgeschlossen haben, so gut wie beseitigt. Hinzu kommt, dass kein Land der Welt aufgrund geopolitischer Spannungen einem anderen Land, ob gross oder klein, fortschrittliche KI-Technologie vorenthalten kann. Die neuen Engpässe bei der Anwendung von KI sind nun Bildung und Vorstellungskraft. Doch selbst Bildung erweist sich immer weniger als Hürde für KI, zumal DeepSeek-Nutzer bereits gezeigt haben, dass sie Software-Code (einschliesslich KI-Code) entwickeln können, ohne auch nur eine einzige Zeile Code manuell schreiben zu müssen. DeepSeeks kostenloses Open-Source-LLM wird die kreativen und innovativen Fähigkeiten von über 6 Milliarden Menschen im Globalen Süden entfesseln.
Die Leistung von DeepSeek ist zweifellos ein grosser Aufschwung für China im chinesisch-amerikanischen Technologiewettlauf. Die Vorteile gehen weit darüber hinaus, lediglich die Auswirkungen der US-amerikanischen Halbleiter-Exportverbote zu mildern. Der grössere potenzielle Nutzen ergibt sich aus zwei weiteren Faktoren:
- Erweiterte Exportmöglichkeiten für Halbleiter. DeepSeek hat es ermöglicht, ein skalierbares, leistungsstarkes LLM auf relativ erschwinglichen und leistungsbeschränkten Hardwareplattformen auszuführen. Folglich erweitern sich der zugängliche Markt für kleine Unternehmen und staatliche KI-Infrastrukturen mit gezielten Anwendungsfällen in den Märkten des Globalen Südens erheblich. Als weltweit führender Hersteller von Legacy-Halbleitern ist China in der optimalen Position, um vergleichsweise günstige KI-Chips und Backend-Infrastrukturen – oder die entsprechenden Cloud-basierten Dienste – an Entwicklungsländer zu verkaufen, die es sich bisher nicht leisten konnten, eine hochleistungsfähige Recheninfrastruktur für KI-Anwendungsfälle einzurichten oder zu nutzen.
- Erweiterter Bekanntheitsgrad im KI-Entwickler-Ökosystem. Da DeepSeek zum bevorzugten LLM für App-Entwickler, Forscher und Enthusiasten sowohl aus Industrie- als auch aus Entwicklungsländern wird, wird seine schnelle Verbreitung zu schnelleren Verbesserungen, mehr verfügbaren Diensten, beschleunigter Innovation und breiterer Unterstützung durch die Gemeinschaft führen, sodass DeepSeek in Zukunft für eine noch grössere Anzahl von Menschen eine noch attraktivere Alternative darstellt. Die Tatsache, dass es sich grösstenteils um eine Open-Source-Software handelt, macht es für Regierungen nahezu unmöglich, die Nutzung und Verbreitung der oben genannten Verbesserungen einzuschränken oder zu verbieten, weshalb DeepSeek geopolitischen Umwälzungen weitaus besser standhält.
Trotz der zahlreichen Vorteile für China gibt es auch erhebliche unkontrollierbare Risiken, die durch diese Errungenschaft entstehen könnten. Der Autor denkt dabei in erster Linie an die Möglichkeit, dass DeepSeek die USA dazu veranlassen könnte, die Exportkontrollen für Halbleiter zu lockern, nachdem die relative Unwirksamkeit solcher Massnahmen festgestellt wurde. Eine solche Massnahme könnte den nachteiligen Effekt haben, chinesische Unternehmen wieder in einen Zustand der Abhängigkeit von leistungsfähigerer US-Technologie zu locken, wodurch Einnahmen und F&E-Gelder von lokalen chinesischen Start-ups in der IKT-Wertschöpfungskette abgezogen würden. Entgegen der landläufigen Meinung ist die Nachhaltigkeit des technologischen Fortschritts Chinas weitaus anfälliger bei einem «freundlicheren» als bei einem «feindlicheren» Amerika. Eine weitere mögliche, vielleicht unvermeidliche Nebenwirkung ist, dass die Leistung von DeepSeek sich einer Reihe anderer «Sputnik-Momente» der jüngeren Vergangenheit anschliesst – sei es die grosse amerikanische RedNote-Migration, der Testflug von zwei Kampfflugzeugen der sechsten Generation oder der jüngste Rekord von über 1000 Sekunden bei der anhaltenden Kernfusionsreaktion von EAST – die die amerikanische Öffentlichkeit und die Eliten gleichermassen dazu veranlassen könnten, koordinierte, gesamtgesellschaftliche Anstrengungen zu unternehmen, um den technologischen Vorsprung gegenüber der Volksrepublik China aufrechtzuerhalten. Zu Chinas Unglück gibt es keine praktischen Mittel, um diese Risiken zu mindern.
Zusammenfassend lässt sich sagen, dass die Veröffentlichung von DeepSeek R1 im Hinblick auf die KI-Entwicklung und ihre geopolitischen Auswirkungen einen entscheidenden Moment darstellt. DeepSeek hat nicht nur die wachsende technologische Leistungsfähigkeit Chinas unter Beweis gestellt, sondern auch die globale KI-Landschaft neu gestaltet, indem es eine Leistung auf dem neuesten Stand der Technik zu einem Bruchteil der Kosten und der Zeit erzielt hat, die seine Konkurrenten benötigen. Dass die US-amerikanischen Halbleitersanktionen die chinesische Innovation nicht ersticken konnten, die US-amerikanischen Technologiegiganten möglicherweise abgewertet werden und die KI für den globalen Süden demokratisiert wird, sind nur die ersten Anzeichen für die transformativen Veränderungen, die dieser Durchbruch mit sich bringen wird. Die zunehmende Verbreitung des Open-Source-Modells von DeepSeek wird weltweit Milliarden von Menschen neue Möglichkeiten eröffnen, die globale Innovation beschleunigen und die bestehende technologische und wirtschaftliche Ordnung in Frage stellen. In dieser neuen Ära werden diejenigen gewinnen, die die Kraft der KI nutzen können, um die grössten Herausforderungen der Menschheit zu bewältigen – unabhängig von ihrer geografischen oder wirtschaftlichen Ausgangslage.
___
Quelle: MR Online. Erstveröffentlichung: The China Academy. Übersetzt mit Hilfe von DeepL.