DeepSeek markiert mögliche Verschiebung in der KI-Wettbewerbslandschaft
Portfoliomanager Richard Clode analysiert die aktuellen Sorgen des Marktes in Bezug auf die jüngsten LLM-Entwicklungen von DeepSeek und welche Auswirkungen dies auf die Anleger haben könnte.
![](https://www.janushenderson.com/wp-content/uploads/sites/4/GettyImages-1405065339-4800x3200-1.jpg?w=695)
6 Minuten Lesezeit
Zentrale Erkenntnisse:
- Das innovative V3 LLM von DeepSeek und das auf Reinforcement Learning basierende Denkmodell R1 scheinen darauf hinzudeuten, dass das Unternehmen Fortschritte bei der Bereitstellung effizienterer und kostengünstigerer KI-Lösungen gemacht hat.
- Dies führt zu einer Neubewertung der KI-Investitionsstrategien, die sich auf die Nachhaltigkeit von KI-Investitionen, die KI-Wettbewerbslandschaft und die Monetarisierung von KI konzentriert.
- Ein selektiverer Ansatz bei der Identifizierung von Unternehmen, die von KI-Investitionen profitieren könnten, sowie ein Blick auf die nächsten Phasen von KI-Investitionsmöglichkeiten sind bei der Entwicklung dieser neuen Technologiewelle von entscheidender Bedeutung.
Was hat DeepSeek in Bezug auf LLM-Innovationen erreicht?
DeepSeek, KI-Startup und Entwickler von Open-Source-Large-Language-Modellen (LLMs) aus China, hat im Dezember 2024 sein LLM der dritten Generation V3 auf den Markt gebracht. DeepSeek-V3, ein Mixture of Experts (MoE)-Modell, das sich gut mit den am besten entwickelten LLMs im Westen messen kann, und diesen Monat DeepSeek-R1, ein Reinforcement Learning Reasoning-Modell, das sich gut mit dem generativen Pre-Trained Transformer (GPT) o1 von OpenAI messen kann. V3 verwendet ein MoE-Modell, das aus mehreren kleineren Modellen besteht, die mit insgesamt 671 Milliarden Parametern zusammenarbeiten und nur 37 Milliarden aktive Parameter zu einem bestimmten Zeitpunkt für jedes Token während der Inferencing-Phase aufweisen. V3 verfügt über weitere Innovationen wie Multi-Head Latent Attention (MHLA), die den Cache- und Speicherbedarf reduziert, Mixed-Precision-Berechnungen auf FP8 und eine neue Architektur für die Post-Trainingsphase. MoE erscheint immer effizienter, da nur ein Teil der Gesamtparameter zu einem bestimmten Zeitpunkt während der Token-Inferenz aktiv ist. Das ist also nicht übermäßig überraschend, obwohl V3 sogar noch effizienter aussieht, etwa 10x im Vergleich zu Peers und 3-7x bei anderen Innovationen. Es wird behauptet, dass das DeepSeek-R1-Modell als einziges die überwachte Feinabstimmung abgeschafft hat. Es scheinen also gewisse Innovationen vorhanden zu sein, auch wenn ein Großteil der Verbesserungen auf Standardtechniken zurückzuführen ist. Es gibt eine breitere Debatte darüber, wie viel der Arbeit DeepSeek selbst geleistet hat und wie viel auf die Nutzung von Open-Source-LLMs von Drittanbietern zurückzuführen ist.
Drei zentrale Gründe, warum sich die Märkte um DeepSeek sorgen
1. DeepSeek scheint deutlich niedrigere Trainingskosten zu haben
DeepSeek behauptet, V3 zwei Monate lang auf nur 2.048 NVIDIA H800-Grafikprozessoren trainiert zu haben, was bei 2 US-Dollar pro Stunde die angekündigten Gesamtkosten von 5 Millionen US-Dollar erklärt. Das ist nur ein Bruchteil dessen, was westliche Hyperscaler für ihr LLM-Training aufwenden (z. B. sind es 9% der Rechenleistung, die für das LLaMA 3.1 405B-Modell von Meta verwendet wird).
2. China bleibt trotz US-Restriktionen konkurrenzfähig
DeepSeek zeigt, dass ein chinesisches Unternehmen mit den besten KI-Unternehmen der USA konkurrieren kann, trotz der derzeitigen Beschränkungen des chinesischen Zugangs zu fortschrittlicher US-Halbleitertechnologie. Das weckt Erinnerungen an eine Generation russischer Programmierer, die angesichts der eingeschränkten PC-Zeitfenster im postsowjetischen Russland geniale Wege zum Programmieren erfanden. Passiert das Gleiche jetzt in China, wo Halbleiterbeschränkungen eine größere Innovation in der LLM-Architektur erzwungen haben, während man sich in den USA einfach darauf verlässt, alles, was man hat, in die Waagschale zu werfen, um das Problem zu lösen?
3. KI-Monetarisierung
DeepSeek verlangt für die Nutzung seiner Modelle deutlich weniger als OpenAI (etwa das 20-40-fache weniger), was angesichts der außerordentlichen Investitionssummen, die im Westen eingesetzt werden, weiteres Öl ins Feuer gießt, was die Bedenken hinsichtlich der Monetarisierung von KI betrifft.
Bemerkenswerte KI-Kraft
Das globale KI-Ökosystem nimmt die Entwicklungen von DeepSeek zur Kenntnis. Obwohl DeepSeek erst vor zwei Jahren (2023) lanciert wurde, profitiert das Unternehmen von der Erfahrung und dem Rückhalt des Teams des quantitativen Fonds „High-Flyer Capital Management“ sowie vom Erfolg und der Innovationskraft der Modelle der vorherigen Generation. Aus diesem Grund reagiert der Markt erst jetzt, obwohl V3 bereits im Dezember und R1 Anfang dieses Monats auf den Markt kam, weil die Reasoning-Kapazitäten von R1 jetzt als hochmodern angesehen werden. Außerdem hat DeepSeek am letzten Wochenende ChatGPT als beliebteste kostenlose App im AppStore von Apple abgelöst. Silicon-Valley-Investor Marc Andreessen schrieb, DeepSeek sei „einer der erstaunlichsten und beeindruckendsten Durchbrüche, die ich je gesehen habe“, was ein großes Lob von einem glaubwürdigen Branchenveteranen ist. Kommentare wie dieser haben die Bedenken des Marktes hinsichtlich der Nachhaltigkeit von KI-Investitionen und damit verbundenen Unternehmen wie NVIDIA verstärkt.
Wie ist das alles einzuschätzen?
- Neue Technologiewellen erfordern Innovation
Jede neue Technologiewelle erfordert Innovationen, um die Kostenkurve im Laufe der Zeit zu senken und eine Masseneinführung zu ermöglichen. Wir erleben mehrere Wege der KI-Innovation, um Skalierungsprobleme beim Training von LLMs zu lösen und effizientere Inferenzverfahren zu ermöglichen. DeepSeek scheint in den General Purpose- und Reasoning-Modellen echte Innovation einzubringen. Innovationen und Kostensenkungen sind der Schlüssel, um KI zu erschließen und langfristig eine breite Akzeptanz zu ermöglichen.
- Destillation
Das DeepSeek-Modell nutzt eine Technik namens „Destillation“, die in der KI-Branche immer breiter eingesetzt wird. Bei der Destillation geht es darum, kleinere Modelle mit den Fähigkeiten größerer Modelle auszustatten, indem das Gelernte des größeren Lehrermodells auf das kleinere Schülermodell übertragen wird. Es ist jedoch wichtig zu erwähnen, dass die Destillationstechniken von DeepSeek auf der Arbeit anderer beruhen. Die Frage, in welchem Ausmaß dies der Fall ist, ist eine Schlüsselfrage, mit der sich der Markt gerade beschäftigt.
- Interpretieren Sie die Angaben zu den Investitionen mit kritischem Blick:
In Bezug auf die vorstehenden Ausführungen sind die genannten Zahlen zum Investitionsaufwand (Capex) ein Vergleich von Äpfeln mit Birnen. Die genannten 5 Millionen US-Dollar beziehen sich auf einen einzigen Trainingslauf, ohne Berücksichtigung aller vorherigen Trainingsläufe und der Ausbildung der größeren Lehrermodelle, sei es bei DeepSeek oder den Open-Source-LLMs von Drittanbietern, auf denen sie aufgebaut wurden.
- Open-Source-Innovationen
Wie KI-Koryphäe Yann LeCun feststellte, ist dies ein Sieg für das Open-Source-Modell zur Förderung von Community-Innovationen. DeepSeek nutzt die Open-Source-Modelle Llama von Meta und Qwen von Alibaba. Auch dies ist gut für die längerfristige KI-Entwicklung, da es Innovation vorantreibt und fördert. Aufgrund der aktuellen geopolitischen Lage ist jedoch zu erwarten, dass die US-Regierung den Zugang anderer Länder zu hochmodernen KI-LLMs aus den USA stärker kontrollieren wird.
- LLMs kommerzialisieren?
Wir sind seit langem überzeugt, dass die Monetarisierung von LLMs auf längere Sicht herausfordernd sein wird, da es viel Konkurrenz gibt, beispielsweise von Open-Source-Entwicklern und Konkurrenten, die versuchen, auf andere Weise Geld zu verdienen. Die DeepSeek-Ankündigung führt nur dazu, dass die Investitionsrendite (ROI) der enormen Investitionen, die die Entwickler von General Purpose-Basismodellen tätigen, noch genauer unter die Lupe genommen wird.
Tipps für die Anleger
Die Bedenken im Zusammenhang mit DeepSeek treffen auf eine wachsende Debatte über die Herausforderungen bei der Skalierung von KI sowie über den ROI von KI-Investitionen und letztlich über die Nachhaltigkeit von KI-Investitionsgewinnen und die Preise, die der Markt zu zahlen bereit ist. Wir erwarten weiterhin hohe Ausgaben für KI-Investitionen, was durch die jüngsten Ankündigungen von Meta und dem KI-Projekt Stargate untermauert wird. Wir sind aber auch der Meinung, dass wir bei den Nutznießern von KI-Investitionen selektiver vorgehen und über die nächsten Phasen von KI-Investitionsmöglichkeiten nachdenken müssen, wenn sich diese neue Technologiewelle entwickelt.
Infrastruktur steht unseres Erachtens in der ersten Phase einer neuen Welle im Fokus, gefolgt von Plattformen und dann von Software, Anwendungen und Dienstleistungen. Wir nähern uns dem Übergang zur Plattformphase, die von der Cloud angeführt wird, sehen aber auch längerfristige Investitionsmöglichkeiten in die KI-Infrastruktur. Der Markt ist schnell von der Besorgnis über zu hohe KI-Investitionen zu der Befürchtung übergegangen, dass die KI-Investitionen einbrechen könnten. Beides kann nicht gleichzeitig geschehen, und die Wahrheit liegt wahrscheinlich irgendwo in der Mitte. Letztendlich glauben wir, dass diese Entwicklungen positiv für die langfristige Stabilität und Entwicklung der KI sind. Wir werden weiterhin selektiv Unternehmen identifizieren, die von KI-Infrastrukturen profitieren. Zudem werden wir unser Engagement in Plattformen ausbauen, die von effizienteren KI-Berechnungen, Trainingsmodellen und Inferenzen profitieren werden.
Quelle für DeepSeek-Informationen: https://api-docs.deepseek.com/news/news250120
KI-Token: Kleinste Dateneinheiten, die von einem Sprachmodell zur Verarbeitung und Erzeugung von Text verwendet werden. Capex/Investitionen: Unternehmensausgaben für den Erwerb oder die Modernisierung physischer Vermögenswerte wie Gebäude, Maschinen, Ausrüstung, Technologie usw., um den Betrieb aufrechtzuerhalten oder zu verbessern und zukünftiges Wachstum zu fördern. GPT (Generative Pre-trained Transformers): Familie von neuronalen Netzwerkmodellen, die die Transformator-Architektur verwenden und generative KI-Anwendungen wie ChatGPT antreiben. GPU: Eine Grafikverarbeitungseinheit führt komplexe mathematische und geometrische Berechnungen durch, die für die Grafikwiedergabe erforderlich sind und auch beim Gaming, bei der Inhaltserstellung und beim maschinellen Lernen verwendet werden. Inferenz oder Inferencing: bezieht sich auf die Verarbeitung durch künstliche Intelligenz. Während sich maschinelles Lernen und Deep Learning auf das Training neuronaler Netze beziehen, wendet die KI-Inferenz Wissen aus einem trainierten neuronalen Netzwerkmodell an und verwendet es, um ein Ergebnis abzuleiten. Hyperscaler : Unternehmen, die Infrastruktur für Cloud-, Netzwerk- und Internetdienste in großem Umfang bereitstellen. Beispiele sind Google Cloud, Microsoft Azure, Facebook Infrastructure, Alibaba Cloud und Amazon Web Services. LLM (Large Language Model): eine spezielle Art künstlicher Intelligenz, die auf großen Textmengen trainiert wurde, um vorhandene Inhalte zu verstehen und Originalinhalte zu generieren. MoE (Mixture of Experts)-Modell): Ansatz des maschinellen Lernens, bei dem ein KI-Modell in separate Teilnetzwerke/Experten aufgeteilt wird, die gemeinsam eine Aufgabe erfüllen. Dies ermöglicht eine erhebliche Kostenreduzierung und eine schnellere Leistung beim Inferencing, da spezifische Experten für eine Aufgabe eingesetzt werden, anstatt das gesamte neuronale Netzwerk für jede Aufgabe zu aktivieren. Open-Source-Software: Code, der im Hinblick auf die Ansicht, Änderung und Verbreitung öffentlich zugänglich ist. Reinforcement Learning (RL): Technik, bei der die KI lernt, indem sie mit ihrer Umgebung interagiert und Feedback in Form von Belohnungen oder Strafen erhält. Dies ermöglicht es der KI, sich anzupassen und weiterzuentwickeln sowie ihre logischen Fähigkeiten und Problemlösungsfähigkeiten zu verbessern. ROI (Investitionsrendite): Finanzkennzahl zur Messung der Performance einer Investition, die berechnet wird, indem der Nettogewinn/-verlust durch die ursprünglichen Kosten der Investition geteilt wird.
Die vorstehenden Einschätzungen sind die des Autors zum Zeitpunkt der Veröffentlichung und können von den Ansichten anderer Personen/Teams bei Janus Henderson Investors abweichen. Die Bezugnahme auf einzelne Wertpapiere stellt keine Empfehlung zum Kauf, Verkauf oder Halten eines Wertpapiers, einer Anlagestrategie oder eines Marktsektors dar und sollten nicht als gewinnbringend angesehen werden. Janus Henderson Investors, die mit ihr verbundenen Berater oder ihre Mitarbeiter haben möglicherweise eine Position in den genannten Wertpapieren.
Die Wertentwicklung in der Vergangenheit ist kein zuverlässiger Indikator für die künftige Wertentwicklung. Alle Performance-Angaben beinhalten Erträge und Kapitalgewinne bzw. -verluste, aber keine wiederkehrenden Gebühren oder sonstigen Ausgaben des Fonds.
Der Wert einer Anlage und die Einkünfte aus ihr können steigen oder fallen. Es kann daher sein, dass Sie nicht die gesamte investierte Summe zurückerhalten.
Die Informationen in diesem Artikel stellen keine Anlageberatung dar.
Es gibt keine Garantie dafür, dass sich vergangene Trends fortsetzen oder Prognosen eintreten.
Marketing-Anzeige.
WICHTIGE INFORMATIONEN
Bitte lesen Sie die folgenden wichtigen Informationen zu den Fonds im Zusammenhang mit diesem Artikel.
- Aktien/Anteile können schnell an Wert verlieren und beinhalten in der Regel höhere Risiken als Anleihen oder Geldmarktinstrumente. Daher kann der Wert Ihrer Investition steigen oder fallen.
- Aktien kleiner und mittelgroßer Unternehmen können volatiler sein als Aktien größerer Unternehmen und bisweilen kann es schwierig sein, Aktien zu bewerten oder zu gewünschten Zeitpunkten und Preisen zu verkaufen, was das Verlustrisiko erhöht.
- Wenn ein Fonds ein hohes Engagement in einem bestimmten Land oder in einer bestimmten Region hat, trägt er ein höheres Risiko als ein Fonds, der breiter diversifiziert ist.
- Der Fonds ist auf bestimmte Branchen oder Anlagethemen ausgerichtet und kann durch Faktoren wie Änderungen der staatlichen Regulierung, dem zunehmenden Preiswettbewerb und dem technologischen Fortschritt sowie durch andere nachteilige Ereignisse stark beeinflusst werden.
- Der Fonds verfolgt einen nachhaltigen Anlageansatz, der dazu führen kann, dass er in bestimmten Sektoren über- und/oder untergewichtet ist und sich daher anders entwickelt als Fonds, die ein ähnliches Ziel verfolgen, aber bei der Auswahl von Wertpapieren keine nachhaltigen Anlagekriterien berücksichtigen.
- Wenn der Fonds oder eine währungsabgesicherte Anteilsklasse versucht, die Wechselkursschwankungen einer Währung gegenüber der Basiswährung des Fonds abzumildern, kann die Absicherungsstrategie selbst aufgrund von Unterschieden der kurzfristigen Zinssätze zwischen den Währungen einen positiven oder negativen Einfluss auf den Wert des Fonds haben.
- Wertpapiere innerhalb des Fonds können möglicherweise schwer zu bewerten oder zu einem gewünschten Zeitpunkt und Preis zu verkaufen sein, insbesondere unter extremen Marktbedingungen, wenn die Preise von Vermögenswerten möglicherweise sinken, was das Risiko von Anlageverlusten erhöht.
- Der Fonds könnte Geld verlieren, wenn eine Gegenpartei, mit der er Handel treibt, ihren Zahlungsverpflichtungen gegenüber dem Fonds nicht nachkommen kann oder will, oder als Folge eines Unvermögens oder einer Verzögerung in den betrieblichen Abläufen oder des Unvermögens eines Dritten.
Besondere Risiken
- Aktien/Anteile können schnell an Wert verlieren und beinhalten in der Regel höhere Risiken als Anleihen oder Geldmarktinstrumente. Daher kann der Wert Ihrer Investition steigen oder fallen.
- Wenn ein Fonds ein hohes Engagement in einem bestimmten Land oder in einer bestimmten Region hat, trägt er ein höheres Risiko als ein Fonds, der breiter diversifiziert ist.
- Der Fonds ist auf bestimmte Branchen oder Anlagethemen ausgerichtet und kann durch Faktoren wie Änderungen der staatlichen Regulierung, dem zunehmenden Preiswettbewerb und dem technologischen Fortschritt sowie durch andere nachteilige Ereignisse stark beeinflusst werden.
- Wenn der Fonds oder eine währungsabgesicherte Anteilsklasse versucht, die Wechselkursschwankungen einer Währung gegenüber der Basiswährung des Fonds abzumildern, kann die Absicherungsstrategie selbst aufgrund von Unterschieden der kurzfristigen Zinssätze zwischen den Währungen einen positiven oder negativen Einfluss auf den Wert des Fonds haben.
- Wertpapiere innerhalb des Fonds können möglicherweise schwer zu bewerten oder zu einem gewünschten Zeitpunkt und Preis zu verkaufen sein, insbesondere unter extremen Marktbedingungen, wenn die Preise von Vermögenswerten möglicherweise sinken, was das Risiko von Anlageverlusten erhöht.
- Der Fonds könnte Geld verlieren, wenn eine Gegenpartei, mit der er Handel treibt, ihren Zahlungsverpflichtungen gegenüber dem Fonds nicht nachkommen kann oder will, oder als Folge eines Unvermögens oder einer Verzögerung in den betrieblichen Abläufen oder des Unvermögens eines Dritten.