DeepSeek V4: Neue Modellgeneration mit 1M-Kontext, Huawei-Chips und Kampfpreisen

DeepSeek hat am 24. April 2026 – exakt ein Jahr nach dem ersten Paukenschlag mit R1 – die neue Modellgeneration V4 vorgestellt. Mit zwei Varianten, einem riesigen Kontextfenster, neuen Aufmerksamkeitsmechanismen und drastisch niedrigeren API-Preisen als die US-Konkurrenz sorgt das chinesische Startup erneut für Aufsehen in der KI-Welt.

Release und Modelle
Technische Innovationen
Leistung und Preisvergleich
Huawei-Chips: Unabhängigkeit von NVIDIA?
Open Source und Lizenz
Stimmen aus Forschung und Industrie
Kritik und offene Fragen
Geopolitische Bedeutung

Release und Modelle

DeepSeek bringt mit V4 zwei Varianten an den Start: DeepSeek V4-Pro und DeepSeek V4-Flash. Beide werden vom Hersteller als „leistungsfähigste Open-Source-KI-Plattform der Welt“ beworben.

Pro setzt auf maximale Qualität bei Reasoning, agentischen Aufgaben und komplexer Programmierung; Flash auf hohe Geschwindigkeit und niedrigen Ressourcenbedarf bei nur leicht reduzierter Reasoning-Qualität.

Technische Innovationen

1 Million Tokens Kontext: Beide Modelle können bis zu einer Million Tokens auf einmal verarbeiten – das entspricht in etwa Tolkiens gesammelten Werken oder rund zehn Romanen. Komplette Programm-Codebases, Verträge oder umfangreiche Berichte lassen sich in einem Schritt analysieren.
Mixture-of-Experts (MoE) mit 1,6 Billionen Parametern: Pro aktiviert pro Anfrage nur die relevanten Netzwerkteile – das senkt den Rechenaufwand drastisch. Flash nutzt eine kompaktere Variante mit 284 Milliarden Parametern.
Optimierte Aufmerksamkeitsmechanismen (DeepSeek Sparse Attention): Das System identifiziert prioritäre Passagen, statt alle Inhalte gleich zu behandeln. Das macht extrem lange Kontexte erst praxistauglich.
Verbesserte Gesprächskontinuität: Schlussfolgerungen werden über mehrere Nutzernachrichten hinweg zuverlässiger berücksichtigt – ein bisheriger Schwachpunkt vieler Sprachmodelle.
Thinking- und Non-Thinking-Modus: Pro Anfrage entscheidbar, ob das Modell intern reflektiert oder direkt antwortet.

Leistung und Preisvergleich

V4-Pro tritt direkt gegen OpenAI GPT-5.4 und Anthropic Claude Opus 4.6 an. Bei standardisierten Coding-Tests fährt DeepSeek Bestwerte ein und positioniert sich „einer der besten Kandidaten für agentische Aufgaben“, so Ben Burtenshaw von Hugging Face.

Bei besonders komplexen logischen Schlussfolgerungen und anspruchsvollen akademischen Prüfungen liegt V4 laut ersten Auswertungen aber noch hinter den absoluten Spitzenreitern.

Der zweite Punkt: der Preis. Während Anthropic für eine Million Output-Tokens rund 25 US-Dollar verlangt, kostet die leistungsfähigste V4-Variante 3,25 US-Dollar. V4-Flash liegt nochmals deutlich darunter. Ein Reddit-Nutzer kommentierte: „Ich glaube nicht, dass es ein Modell gibt, das in puncto Preis-Leistungs-Verhältnis damit mithalten kann.“

Modell	Anbieter	Output (USD / 1M Tokens)
DeepSeek V4-Pro	DeepSeek	~3,25 USD
Claude Opus 4.6	Anthropic	~25 USD
GPT-5.5 (Vergleich)	OpenAI	~30 USD

Huawei-Chips: Unabhängigkeit von NVIDIA?

Eine besondere Pointe: DeepSeek hat V4 explizit für chinesische Huawei-Prozessoren optimiert – ein Novum in der KI-Industrie. Bisher liefen die großen Sprachmodelle nahezu ausschließlich auf NVIDIA-Hardware.

Allerdings betonen Experten, dass dies vor allem für die Inferenz (also den Betrieb für Nutzeranfragen) gilt. Liu Zhiyuan von der Tsinghua-Universität erklärt, dass „nur Teile des Trainingsprozesses an chinesische Chips angepasst“ wurden – beim eigentlichen Training dürfte weiterhin viel NVIDIA-Hardware zum Einsatz kommen.

Open Source und Lizenz

V4 wurde unter der MIT-Lizenz veröffentlicht und ist damit quelloffen verfügbar – heruntergeladen, ausgeführt und modifiziert werden darf das Modell weitgehend frei. DeepSeek-Forscher Deli Chen kommentierte: „Wie immer bleiben wir dem langfristigen Denken und dem Credo ‚Open Source für alle‘ treu.“

Damit setzt sich DeepSeek bewusst von den geschlossenen Modellen aus dem Hause OpenAI, Anthropic und Google ab.

Stimmen aus Forschung und Industrie

Ben Burtenshaw (Hugging Face): Die eigentliche Innovation liege in der effizienten Verarbeitung großer Kontextlängen; V4 sei „einer der besten Kandidaten für agentische Aufgaben“.
Liu Zhiyuan (Tsinghua-Universität): Beim Training selbst seien bislang nur Teile auf chinesische Chips ausgelegt.
Christian Mayr (TU Dresden): Europa sollte weniger an bewährten Systemen festhalten und stärker an Codes und Plattformen arbeiten, um Sprachmodelle effizienter zu betreiben.

Kritik und offene Fragen

Trotz Open-Source-Veröffentlichung warnen Skeptiker, dass V4 derart komplex und rechenintensiv sei, dass eine eins-zu-eins-Reproduktion außerhalb großer Cloud-Anbieter kaum realistisch ist. Auch sicherheitspolitisch wird das Modell kritisch beäugt: Frei verfügbare, leistungsfähige KI könnte theoretisch sowohl für Verteidigungszwecke als auch für gezielte Cyberangriffe missbraucht werden.

Außerdem zeigt V4 bei besonders anspruchsvollen Reasoning-Aufgaben und akademischen Prüfungen noch Schwächen gegenüber den absoluten Top-Modellen aus den USA.

Geopolitische Bedeutung

DeepSeek demonstriert mit V4 ein zweites Mal binnen 12 Monaten, dass innovative Architekturen und konsequente Effizienz die NVIDIA-Abhängigkeit ein Stück weit aufweichen können. Die US-Regierung hat zuvor mit Exportbeschränkungen für NVIDIA-Chips ihre technische Vormacht zu sichern versucht – V4 zeigt, dass es einen Weg drumherum geben könnte.

Im chinesischen KI-Markt verschärft DeepSeek mit aggressiven Preisen den Wettbewerb. Während US-Anbieter wie OpenAI auf reine Rechenpower und Premium-Preise setzen, fährt DeepSeek konsequent die andere Strategie: günstig, offen, hardwaremäßig flexibel.

Die Branche fragt sich nun, ob das Jahr 2026 erneut ein „DeepSeek-Moment“ wird – mit nachhaltigen Auswirkungen auf die globale KI-Landschaft.