QWEN3 ist Alibabas Debüt in sogenannte “Hybrid-Argumentationsmodelle”, die laut Angaben traditionelle LLM-Funktionen mit “fortschrittlichem, dynamischem Denken” kombiniert.
SOPA -Bilder | Lightrocket | Getty -Bilder
Alibaba veröffentlichte am Dienstag die nächste Generation seiner Open-Sourcing-großartigen Modelle QWEN3-und Experten nennen es einen weiteren Durchbruch im boomenden Raum für künstliche Intelligenz in China.
In einem Blog-Beitrag sagte der chinesische Tech-Riese, QWEN3 verspricht Verbesserungen bei Argumentation, Anweisungen, Werkzeugverwendung und mehrsprachigen Aufgaben, wobei sie mit anderen Top-Tier-Modellen wie Deepseeks R1 in mehreren Branchen-Benchmarks mithalten können.
Die LLM -Serie enthält acht Variationen, die eine Reihe von Architekturen und Größen umfassen und Entwicklern Flexibilität bieten, wenn QWEN zum Erstellen von AI -Anwendungen für Kantengeräte wie Mobiltelefone verwendet wird.
QWEN3 ist auch Alibabas Debüt in sogenannte “Hybrid-Argumentationsmodelle”, was lautet traditionelle LLM-Funktionen mit “fortschrittlichem, dynamischem Denken” kombiniert.
Laut Alibaba können solche Modelle für komplexe Aufgaben wie das Codieren und einen “Nicht-Denken-Modus” für schnellere, allgemeine Antworten nahtlos einen “Denkmodus” übergehen.
“Insbesondere senkt das QWEN3-235B-A22B-MOE-Modell im Vergleich zu anderen hochmodernen Modellen signifikant die Einsatzkosten und verstärkt das Engagement von Alibaba für zugängliche Hochleistungs-KI”, sagte Alibaba.
Die neuen Modelle sind bereits für einzelne Benutzer auf Plattformen wie Hugging Face und Github sowie für die Weboberfläche von Alibaba Cloud bereits frei verfügbar. QWEN3 wird auch verwendet, um Alibabas KI -Assistent Quark zu versorgen.
Chinas KI -Fortschritt
KI -Analysten teilten CNBC mit, dass das QWEN3 eine ernsthafte Herausforderung für Alibabas Kollegen in China sowie für Branchenführer in den USA darstellt
In einer Erklärung zu CNBC, Wei Sun, Hauptanalyst der künstlichen Intelligenz bei Contrapoint Research, sagte die QWEN3-Serie, sei ein “bedeutender Durchbruch-nicht nur für ihre erstklassige Leistung”, sondern auch für mehrere Merkmale, die auf das “Anwendungspotential der Modelle” hinweisen.
Zu diesen Funktionen gehören der hybride Denkmodus von QWEN3, die mehrsprachige Unterstützung, die 119 Sprachen und Dialekte abdeckt, und der Verfügbarkeit von Open-Source-Verfügbarkeit, fügte Sun hinzu.
Open-Source-Software bezieht sich im Allgemeinen auf Software, bei der der Quellcode im Web frei verfügbar ist, um eine mögliche Änderung und Umverteilung zu erhalten. Zu Beginn dieses Jahres erschütterte Deepseeks Open-Sourcing-R1-Modell die KI-Welt und wurde schnell zu einem Katalysator für Chinas KI-Raum und Open-Source-Modelloption.
“Alibabas Veröffentlichung der QWEN 3-Serie unterstreicht ferner die starken Fähigkeiten chinesischer Labors, um stark wettbewerbsfähige, innovative und Open-Source-Modelle zu entwickeln.
Laut Alibaba ist Qwen bereits eine der weltweit am weitesten verbreiteten Open-Source-KI-Modellreihen geworden und zeichnet weltweit über 300 Millionen Downloads und mehr als 100.000 Derivatmodelle für das Umarmungsgesicht an.
Wang sagte, dass diese Adoption mit QWEN3 fortgesetzt werden könnte, und fügte hinzu, dass seine Leistungsansprüche sie weltweit zum besten Open-Source-Modell machen könnten-obwohl sie immer noch hinter den modernsten Modellen der Welt wie OpenAIs O3 und O4-Mini ist.
Chinesische Konkurrenten wie Baidu haben sich auch nach dem Auftauchen von Deepseek neue KI-Modelle freigeben, einschließlich Plänen, sich auf ein Open-Source-Geschäftsmodell zu verschieben.
In der Zwischenzeit berichtete Reuters im Februar, dass Deepseek den Start seines Nachfolgers in seinen R1 unter Berufung auf anonyme Quellen beschleunigt.
“Im breiteren Kontext des AI-Rennens der USA-China hat sich die Kluft zwischen amerikanischen und chinesischen Labors eingegrenzt-wahrscheinlich auf ein paar Monate, und einige könnten auch nur bis zu wenigen Wochen argumentieren”, sagte Wang.
“Mit der neuesten Veröffentlichung von Qwen 3 und dem bevorstehenden Start von Deepseeks R2 ist es unwahrscheinlich, dass diese Lücke sich erweitern kann – und kann sogar weiter schrumpfen.”