Tech News

Technik & Digital

Elon Musks xAI kündigt Grok-1.5 mit 128K Kontextlänge an


Nach der Open-Source-Veröffentlichung von Grok-1 vor zwei Wochen hat xAI von Elon Musk nun ein aktualisiertes Grok-1.5-Modell angekündigt. Das neue KI-Startup sagt, dass Grok-1.5 über verbesserte Denkfähigkeiten verfügt und a Kontextlänge von 128.000 Token. Das Modell ist nicht sofort verfügbar, sondern wird in den kommenden Tagen für frühe Tester und bestehende Grok-Benutzer auf der X-Plattform (ehemals Twitter) verfügbar sein.

Um die Problemlösungsfähigkeit von Grok-1.5 zu demonstrieren, hat xAI das Modell anhand beliebter Tests verglichen. Im MMLU-Test, Grok-1.5 erzielte 81,3 % (5 Schuss), höher als Mistral Large und Claude 3 Sonnet. Im MATH-Test erreichte es 50,6 % (4 Schüsse) und schlug damit erneut Claude 3 Sonnet. Im nächsten GSM8K-Test erreichte es satte 90 %, allerdings mit 8-Schuss-Aufforderung. Beim HumanEval-Test schließlich erreichte das Grok-1.5-Modell 74,1 % mit 0-Schuss.

Elon Musks xAI kündigt Grok-1.5 mit 128K Kontextlänge an
Bild mit freundlicher Genehmigung: xAI

xAI hat außerdem die Kontextlänge von 8.000 Token auf 128.000 Token beim Grok-1.5-Modell erhöht. Um seine Rückholfähigkeit zu bewerten, führte das Unternehmen das durch NIAH-Test (Die Nadel im Heuhaufen) und es wurden perfekte Ergebnisse erzielt.

Da es sich um ein inkrementelles Modell handelt, hat xAI die Parametergröße nicht bekannt gegeben. Um Ihnen jedoch einen Überblick zu geben, wird auf Grok-1 trainiert 314 Milliarden Parameter, eines der größten Open-Source-Modelle überhaupt. Es basiert auch auf der Mixture-of-Experts (MoE)-Architektur. xAI hat auch die Modellgewichte und die Architektur unter der Apache 2.0-Lizenz veröffentlicht, was großartig ist.

Vor kurzem hat Anthropic seine Familie von Claude-3-Modellen auf den Markt gebracht, die sich als vielversprechend erwiesen haben, und in vielen Fällen hat das größte Opus-Modell bereits das GPT-4-Modell von OpenAI übertroffen. OpenAI soll an einem Zwischenmodell GPT-4.5 Turbo arbeiten und GPT-5 ist ebenfalls in Planung und könnte im Sommer 2024 auf den Markt kommen. Das Modell Gemini 1.5 Pro von Google hat über einen langen Kontextzeitraum ebenfalls unglaubliche multimodale Fähigkeiten unter Beweis gestellt.

Unter den leistungsstarken proprietären Modellen liegt der Grok-1.5 von xAI irgendwo in der Mitte, wenn wir uns an seinen Benchmark-Zahlen orientieren. Wir müssen abwarten, wie gut es bei Tests zum logischen Denkvermögen abschneidet. Wie auch immer, was halten Sie vom Grok-1.5-Modell? Lass es uns unten in den Kommentaren wissen.



Source link