Author: Oliver

  • DeepSeeks Blackwell-Einsatz fordert US-Exportverbot heraus

    DeepSeeks Blackwell-Einsatz fordert US-Exportverbot heraus

    Wie DeepSeeks Blackwell-Training das US-Chip-Embargo auf die Probe stellt Die Vereinigten Staaten wollen mit strengen Exportkontrollen verhindern, dass chinesische Unternehmen auf modernste KI-Hardware zugreifen. Der Fall DeepSeek zeigt jedoch, wie durchlässig dieses System geworden ist. Das nächste Modell des Startups soll auf Nvidias aktueller Blackwell-Generation trainiert worden sein, obwohl diese Prozessoren offiziell gar nicht nach…

  • Wie Gengram KI Modelle für DNA schneller und treffsicherer macht

    Wie Gengram KI Modelle für DNA schneller und treffsicherer macht

    Neues Genmodul erweitert den Engram Ansatz von DeepSeek DeepSeek hat mit Engram einen Architekturansatz vorgestellt, bei dem ein KI-Modell einen Teil seines Wissens nicht in den Modellparametern speichert, sondern in ein externes, gezielt abfragbares Nachschlagewerk auslagert. Vom Sprachmodell zur Genom KI Nur wenige Wochen nach der Engram Veröffentlichung setzen Forschende in China diese Idee im…

  • DeepSeek baut KI-Suche und Agenten aus

    DeepSeek baut KI-Suche und Agenten aus

    Strategischer Umbau hinter den Kulissen Neue Stellenausschreibungen geben Einblick in die strategische Ausrichtung von DeepSeek und zeigen, wie sich das Unternehmen gezielt auf die nächste Phase im globalen KI-Wettbewerb vorbereitet. Die gesuchten Profile lassen erkennen, welche technologischen Schwerpunkte künftig ausgebaut werden sollen und welche Rolle Suche, Agentensysteme und Plattformarchitektur dabei spielen. Mehrsprachige Suche als zentrales…

  • Ein Jahr DeepSeek

    Ein Jahr DeepSeek

    Rückblick auf ein Jahr offenes KI Ökosystem Am 28. Januar 2026 liegt der sogenannte DeepSeek Moment ein Jahr zurück. In dieser Zeit hat sich gezeigt, wie stark ein einziges Modell den globalen Wettbewerb, die Open Source Landschaft und die Wahrnehmung chinesischer KI Anbieter verändern kann. Der Moment in dem ein chinesisches Open Source Modell sichtbar…

  • DeepSeek macht lange Texte schneller und günstiger

    DeepSeek macht lange Texte schneller und günstiger

    Neues Modell verschiebt den Fokus auf Effizienz DeepSeek stellt mit V3.2 Exp ein experimentelles Sprachmodell vor, das gezielt für längere Texte und effizienteres Rechnen ausgelegt ist. Im Mittelpunkt steht ein veränderter Umgang mit Aufmerksamkeit, der Rechenaufwand und Speicherbedarf senken soll, ohne die Qualität der Ergebnisse spürbar zu verschlechtern. Von umfassender zu gezielter Aufmerksamkeit Klassische Transformermodelle…