Faisal Bashir | Lightrocket | Getty -Bilder
Chinas Deepseek wurde diese Woche zum größten technischen Thema, da viele in der Branche und an der Wall Street sich auf eine einzige Zahl konzentrierten: 6 Millionen US -Dollar.
In Deepseeks Papier über sein neuestes Modell für künstliche Intelligenz sagte das Unternehmen, dass die Gesamtausbildungskosten auf 5,576 Millionen US -Dollar beliefen, basierend auf dem Mietpreis von Nvidia Grafikverarbeitungseinheiten. Deepseek beinhaltete eine klare Einschränkung, die sagte, dass die Zahl nur die “offizielle Ausbildung” des Modells enthielt und die Kosten, die mit “früheren Forschungs- und Ablationsexperimenten zu Architekturen, Algorithmen oder Daten” verbunden waren, ausgeschlossen wurden.
Anfang der Woche nahm Deepseeks AI-Assistent den begehrten Spot für die meisten kostenlosen kostenlosen App in den USA im App Store von Apple, das Openai’s Chatgpt, im Apple-App-Store. Globale Tech -Aktien verkauften mit Chipmachern Nvidia und Broadcom Am Montag eine Marktkapitalisierung von 800 Milliarden US -Dollar verlieren.
Ein neuer Bericht von Semianalysis, einem Halbleiterforschungs- und Beratungsunternehmen, fügte den Ausgaben von Deepseek mehr Kontext hinzu. Das Unternehmen schätzte, dass die Hardwareausgaben von Deepseek gegenüber der Unternehmensgeschichte “weit über 500 Mio. USD liegen” und fügte hinzu, dass F & E -Kosten und Gesamtbetreuungskosten erheblich sind. Die Erzeugung von “synthetischen Daten”, für das das Modell zum Training trainiert, müsste “beträchtliche Menge an Rechen” erfordern, schrieb die semianalyse.
Der Bericht sagte Amazonas Und GoogleEin Hinweis darauf, wie viel mehr Geld erforderlich ist, um die Modelle und das Unternehmen zu betreiben.
“Es liegt daran, dass sie experimentieren, neue Architekturen entwickeln, Daten sammeln und sauber machen, Mitarbeiter bezahlen und vieles mehr”, sagte die Semianalysis.
Deepseeks eigenes Papier beinhaltet keine Schätzung seiner Berechnung. Das Unternehmen antwortete nicht sofort auf eine Anfrage nach Kommentaren.
“Es ist einzigartig, dass Deepseek zuerst dieses Maß an Kosten und Fähigkeiten erreicht hat”, schrieb Semiianalytiker. Die Firma fügte hinzu, dass Deepseeks R1 “ein sehr gutes Modell ist” und dass “die Argumentationskante so schnell objektiv beeindruckend ist”.
Experten und Analysten in dieser Woche haben die Qualität von Deepseeks Modell angepriesen und stellten fest, wie beeindruckend es ist, dass die US -amerikanischen Chip -Exporte dreimal in drei Jahren nach China in Betracht gezogen werden. Dies führte zu Bedenken, dass die USA in einem Markt, der innerhalb eines Jahrzehnts einen Umsatz von 1 Billion US -Dollar prognostiziert, hinter ihrem Hauptgegner zurückzuführen ist.

Bernstein -Analysten haben am Montag in einer Notiz geschrieben, die “nach den vielen (gelegentlich hysterischen) heißen Teilen, die wir gesehen haben [over the weekend,] Die Implikationen reichen von “Das ist wirklich interessant” bis ‘Dies ist der Todesknochen des KI-Infrastrukturkomplexes, wie wir es kennen.’ “
Deepseek wurde 2023 von Liang Wenfeng, Mitbegründer von High-Flyer, einem quantitativen Hedgefonds, der sich auf KI konzentriert, gegründet. Das KI -Startup ist im April 2023 aus der KI -Forschungseinheit des Hedgefonds entstand Openai und andere verfolgen.
Laut Analysten von Jefferies befindet sich Deepseek immer noch vollständig im Besitz und wird von High-Flyer finanziert.
Die Begeisterung um Deepseek begann zu Beginn dieses Monats, als das Startup R1 veröffentlichte. Es ist Open-Source, was bedeutet, dass jeder KI-Entwickler es verwenden kann.
Wie andere chinesische Chatbots hat Deepseeks Einschränkungen zu bestimmten Themen: Wenn Deepseek beispielsweise nach einigen der Richtlinien des chinesischen Führers Xi Jinping gefragt wird, lenkt er den Benutzer Berichten zufolge von ähnlichen Fragestellen ab.
Sam Altman, CEO von OpenAI, hat das Modell öffentlich gelobt, aber das Unternehmen hat auch bekannt, dass es Hinweise darauf gibt, dass Deepseek OpenAI -Daten für den Bau seines Produkts nicht ordnungsgemäß geerntet hat.
Bei einer Veranstaltung in Washington, DC, sagte Altman am Donnerstag, das am Donnerstag veranstaltet wurde, und sagte, Deepseek sei “eindeutig ein großartiges Modell”.
“Dies ist eine Erinnerung an das Wettbewerbsniveau und die Notwendigkeit, dass demokratischer Al gewinnt”, sagte er. Er sagte, es wehte auch auf das “Interesse an Argumentation, das Interesse an Open Source” hin.
BETRACHTEN: Jensen Huang, CEO von Nvidia, und Präsident Trump treffen sich in der KI -Politik
