DeepSeek, ein chinesisches KI-Startup, hat es geschafft, seinen Chatbot an die Spitze des Apple App Store in den USA zu katapultieren und OpenAIs ChatGPT vom Spitzenplatz zu verdrängen.
Bemerkenswert ist, dass dieser KI-Assistent von DeepSeeks Open-Source-Modellen angetrieben wird, die nicht nur günstiger zu entwickeln sind, sondern auch nur einen Bruchteil der Rechenleistung der großen Player wie OpenAI erfordern.
Für alle, die den Hype verpasst haben: DeepSeeks neues R1-Reasoningmodell, das am 20. Januar 2025 erschien. Es wurde entwickelt, um komplexe Probleme zu lösen, und ist Berichten zufolge auf Augenhöhe mit OpenAIs GPT-4 und Anthropics Claude 3.5 Sonnet – und das alles zu einem Bruchteil der Kosten.
DeepSeek behauptet, R1 für weniger als 6 Millionen Dollar entwickelt zu haben, während OpenAIs GPT-4 über 100 Millionen Dollar gekostet haben soll. Und was noch beeindruckender ist? DeepSeek benötigte nur etwa 2.000 Nvidia-Chips, um sein Modell zu trainieren, verglichen mit den 16.000 oder mehr, die normalerweise von Topmodellen verwendet werden.
Aufruhr auf dem KI-Markt – Die Veröffentlichung des neuen Modells von DeepSeek und das daraus resultierende Wachstum der App haben die Finanzmärkte erschüttert, wobei die Nvidia-Aktie im vorbörslichen Handel um über 12 % fiel. Da die Entwicklung des neuen Modells Berichten zufolge weniger als 6 Millionen US-Dollar kostet, verglichen mit den 100 Millionen US-Dollar von OpenAI für GPT-4, stellen einige Investoren in Frage, ob sich die massiven Investitionen in Rechenzentren und rechenintensive Modelle noch lohnen.
Unterdessen stecken große Akteure wie OpenAI, Nvidia, Microsoft und Meta weiterhin Milliarden in die KI, wobei das neu angekündigte Stargate-Projekt 100 Milliarden US-Dollar für Nvidias Rolle im KI-Rennen vorsieht.
Warum das wichtig ist – Die kostengünstigen, stromsparenden KI-Modelle von DeepSeek könnten die Spielregeln für die gesamte Branche ändern. Wenn ihre Behauptungen stimmen, könnte dies bedeuten, dass weniger ressourcenintensive KI-Modelle der Weg der Zukunft sein könnten, und das macht die großen Akteure nervös. Eine solche Veränderung könnte große Technologieunternehmen dazu zwingen, ihre teuren KI-Strategien und die Zukunft der KI-Entwicklung zu überdenken.
Zudem hat DeepSeek sein neuestes Angebot veröffentlicht: Janus Pro 7B, ein Open-Source-KI-Modell auf Basis von Vision. Die Einführung von Janus Pro 7B scheint strategisch günstig gewählt, um die Dominanz des Silicon Valley herauszufordern, nachdem das Unternehmen in jüngster Zeit mit seinen bahnbrechenden KI-Modellen Erfolg hatte, der zu einem deutlichen Rückgang der US-KI-Aktien führte.
Das Unternehmen behauptet, dass das neue Modell sowohl OpenAIs DALL-E 3 als auch Stable Diffusion von Stability AI in einer Rangliste für die Bildgenerierung mithilfe von Textaufforderungen übertrifft. Das Team von AI Fellows arbeitet mit Hochdruck daran, DeepSeek zu integrieren.
Und was noch? Janus Pro 7B ist eine verbesserte Version des im letzten Jahr eingeführten Janus-Modells. Laut dem technischen Bericht von DeepSeek profitiert das neue Modell von verbesserten Trainingsprozessen, besserer Datenqualität und einer größeren Modellgröße, was zu stabileren und detaillierteren Bildern führt. Das Modell enthält jetzt 72 Millionen hochwertige synthetische Bilder neben realen Daten, wodurch sowohl die Bildkonsistenz als auch die visuelle Attraktivität verbessert werden.
Janus Pro 7B ist auf Vielseitigkeit ausgelegt und eignet sich hervorragend für eine Vielzahl visueller Aufgaben, von der Erstellung fotorealistischer Bilder bis hin zur Durchführung komplexer visueller Überlegungen. Das Forschungspapier, das die Markteinführung begleitete, hebt die beeindruckende Leistung des Modells bei der Bildgenerierung, der visuellen Beantwortung von Fragen und der Bildbeschriftung hervor.
Für alle, die den Hype verpasst haben: DeepSeeks neues R1-Reasoningmodell, das am 20. Januar 2025 erschien. Es wurde entwickelt, um komplexe Probleme zu lösen, und ist Berichten zufolge auf Augenhöhe mit OpenAIs GPT-4 und Anthropics Claude 3.5 Sonnet – und das alles zu einem Bruchteil der Kosten.
DeepSeek behauptet, R1 für weniger als 6 Millionen Dollar entwickelt zu haben, während OpenAIs GPT-4 über 100 Millionen Dollar gekostet haben soll. Und was noch beeindruckender ist? DeepSeek benötigte nur etwa 2.000 Nvidia-Chips, um sein Modell zu trainieren, verglichen mit den 16.000 oder mehr, die normalerweise von Topmodellen verwendet werden.
Aufruhr auf dem KI-Markt – Die Veröffentlichung des neuen Modells von DeepSeek und das daraus resultierende Wachstum der App haben die Finanzmärkte erschüttert, wobei die Nvidia-Aktie im vorbörslichen Handel um über 12 % fiel. Da die Entwicklung des neuen Modells Berichten zufolge weniger als 6 Millionen US-Dollar kostet, verglichen mit den 100 Millionen US-Dollar von OpenAI für GPT-4, stellen einige Investoren in Frage, ob sich die massiven Investitionen in Rechenzentren und rechenintensive Modelle noch lohnen.
Unterdessen stecken große Akteure wie OpenAI, Nvidia, Microsoft und Meta weiterhin Milliarden in die KI, wobei das neu angekündigte Stargate-Projekt 100 Milliarden US-Dollar für Nvidias Rolle im KI-Rennen vorsieht.
Warum das wichtig ist – Die kostengünstigen, stromsparenden KI-Modelle von DeepSeek könnten die Spielregeln für die gesamte Branche ändern. Wenn ihre Behauptungen stimmen, könnte dies bedeuten, dass weniger ressourcenintensive KI-Modelle der Weg der Zukunft sein könnten, und das macht die großen Akteure nervös. Eine solche Veränderung könnte große Technologieunternehmen dazu zwingen, ihre teuren KI-Strategien und die Zukunft der KI-Entwicklung zu überdenken.
Zudem hat DeepSeek sein neuestes Angebot veröffentlicht: Janus Pro 7B, ein Open-Source-KI-Modell auf Basis von Vision. Die Einführung von Janus Pro 7B scheint strategisch günstig gewählt, um die Dominanz des Silicon Valley herauszufordern, nachdem das Unternehmen in jüngster Zeit mit seinen bahnbrechenden KI-Modellen Erfolg hatte, der zu einem deutlichen Rückgang der US-KI-Aktien führte.
Das Unternehmen behauptet, dass das neue Modell sowohl OpenAIs DALL-E 3 als auch Stable Diffusion von Stability AI in einer Rangliste für die Bildgenerierung mithilfe von Textaufforderungen übertrifft. Das Team von AI Fellows arbeitet mit Hochdruck daran, DeepSeek zu integrieren.
Und was noch? Janus Pro 7B ist eine verbesserte Version des im letzten Jahr eingeführten Janus-Modells. Laut dem technischen Bericht von DeepSeek profitiert das neue Modell von verbesserten Trainingsprozessen, besserer Datenqualität und einer größeren Modellgröße, was zu stabileren und detaillierteren Bildern führt. Das Modell enthält jetzt 72 Millionen hochwertige synthetische Bilder neben realen Daten, wodurch sowohl die Bildkonsistenz als auch die visuelle Attraktivität verbessert werden.
Janus Pro 7B ist auf Vielseitigkeit ausgelegt und eignet sich hervorragend für eine Vielzahl visueller Aufgaben, von der Erstellung fotorealistischer Bilder bis hin zur Durchführung komplexer visueller Überlegungen. Das Forschungspapier, das die Markteinführung begleitete, hebt die beeindruckende Leistung des Modells bei der Bildgenerierung, der visuellen Beantwortung von Fragen und der Bildbeschriftung hervor.