Tech News

Technik & Digital

Die Cortex X925- und A725-Modelle von Arm werden einige der bisher größten Leistungssteigerungen im Vergleich zum Vorjahr bringen


Arm ist das Unternehmen, das so ziemlich alle CPU-Kerne entwickelt, die letztendlich in Ihrem Android-Smartphone zum Einsatz kommen, aber dieses Jahr sieht es etwas anders aus. Da Qualcomm für den Snapdragon 8 Gen 4 auf seine eigenen Oryon Arm-basierten Kerne umsteigt, werden im nächsten Jahr eine beträchtliche Anzahl von Smartphones auf den Markt kommen, die nicht von einem von Arm entwickelten Kern angetrieben werden. Wir gehen jedoch weiterhin davon aus, dass MediaTek diese Kerne weiterhin verwenden wird, und Qualcomm könnte in Zukunft möglicherweise ein Nicht-Flaggschiff-SoC mit einer Kombination dieser Kerne herausbringen.


Dennoch kündigt Arm dieses Jahr einen Cortex-X925-Flaggschiffkern, einen Cortex-A725-Leistungskern und einen aktualisierten Cortex-A520-Effizienzkern an. Diese Kerne sind mit Arm v9.2 kompatibel und bilden die Grundlage für das CSS for Client des Unternehmens, das zuvor als Total Compute Solutions bekannt war. CSS steht für Compute SubSystems, ein Akronym, das zuvor in den auf Rechenzentren ausgerichteten Neoverse-Kernen des Unternehmens verwendet wurde. Wir sehen auch eine neue DynamIQ Shared Unit (DSU) und eine verbesserte GPU in Form des Immortalis G925.


Arm verpackt diese Kerne außerdem erstmals als GDSII, um sie OEMs zur Verfügung zu stellen. Dabei handelt es sich im Wesentlichen um eine Datei, die einem Hersteller wie TSMC oder Samsung zur sofortigen Produktion zur Verfügung gestellt werden kann, und diese GDSII-Dateien berücksichtigen alle spezifischen Eigenheiten oder Merkmale des Herstellers. Arm sagt, ein großer Vorteil davon sei, dass es die Markteinführungszeit für Unternehmen, die diese Kerne verwenden, verkürzen könne, diese Unternehmen aber einfach die Designs lizenzieren und die ganze Kleinarbeit selbst erledigen könnten, wenn sie dies wünschen, genau wie bei früheren Arm-Kernen.

Alle drei Kerne wurden gegenüber den Vorjahresmodellen in irgendeiner Form verbessert, wobei der Cortex X925 die größten Fortschritte von allen vorweisen kann.


Arm Cortex X925: „Das Beste noch besser machen“

Die beste Performance eines Cortex X-Kerns im Vergleich zum Vorjahr

Die Cortex X925- und A725-Modelle von Arm werden einige der bisher größten Leistungssteigerungen im Vergleich zum Vorjahr bringen

Quelle: Arm


Die Kerne der X-Serie von Arm haben sich vor einigen Jahren von der A-Serie abgespalten. Die Philosophie dahinter ist, dass es sich um einen leistungsstarken Kern handelt, der bei Bedarf etwas mehr Strom verbrauchen darf. Normalerweise verbauen Chipsatzhersteller nur ein oder maximal zwei davon, da sie trotz ihrer Leistungsfähigkeit viel Strom verbrauchen.

Dieses Jahr ist diese Philosophie immer noch dieselbe, aber Arm rühmt sich großer Verbesserungen sowohl bei der KI als auch beim regulären IPC. Der Grund dafür ist, dass Arm behauptet, dass die meiste KI immer noch auf CPU-Kernen läuft, insbesondere angesichts der großen Vielfalt an KI-Hardware, die es gibt. Für Entwickler ist es schwierig, ihre KI-Verarbeitung tatsächlich auf integrierten NPUs durchzuführen. Die Zielfrequenz des X925 liegt bei 3,6 GHz und höher, aber interessanterweise spricht Arm davon, dass dies eine Skalierungsplattform „für die nächste Generation von KI-PCs“ sei.

Leistungsdiagramm des Arm Cortex X925, das die Spitzenleistung in verschiedenen Leistungsbereichen zeigt

Quelle: Arm


Laut Arm bedeutet dies, dass es bei mehreren Indikatoren im CPU-Cluster eine durchschnittliche Steigerung von 30 % gibt. Arm sagt, dieser Kern werde „Cortex-CPUs in den kommenden Jahren grundlegend verändern“. Außerdem erhalten Sie eine bessere Leistung bei geringerem Stromverbrauch.

Was die Art und Weise angeht, wie Arm diese Verbesserungen erreicht, handelt es sich um eine vielschichtige architektonische Verbesserung auf ganzer Linie. Zunächst einmal kann der Verzweigungsprädiktor des Cortex X925 im Frontend doppelt so weit in die Zukunft sehen, und auch die Genauigkeit dieser Verzweigungsvorhersagen wurde deutlich verbessert. Darüber hinaus verfügt er über die doppelte Bandbreite für den Vorabruf von Anweisungen, was einige wichtige Vorteile mit sich bringt.

Arm Cortex X925 Kernverbesserungen laut Arm

Quelle: Arm


Weitere Änderungen umfassen Optimierungen für Dekodierung und Versand. Beispielsweise handelt es sich um eine 10-Breit-CPU, die jedoch durch die Beseitigung mehrerer Verarbeitungsbeschränkungen effektiver genutzt wird. Die Vektorbandbreite wurde von 4 x 128 Bit pro Zyklus auf 6 x 128 Bit pro Zyklus erhöht, und die Anzahl der Integer-ALU-Pipelines wurde erhöht. Arm sagt auch, dass einer der Vorteile der Bereitstellung eines GDSII für Partner darin besteht, dass Arm von bestimmten Verbesserungen profitieren kann, die ein Prozessknoten bieten kann, was bedeutet, dass ihre ALU allein aufgrund dieser Knotenverbesserungen Ein- und Zwei-Zyklus-Operationen durchführen kann. So ziemlich alle dieser Vorteile gelten für die KI.

Auch im Backend gibt es einige kleinere Verbesserungen, wie beispielsweise eine Erhöhung der Ladepipelines von drei auf vier und Verbesserungen bei der Out-of-Order-Verarbeitung. All dies führt zur größten Leistungssteigerung in der Geschichte von Cortex X; zumindest laut Arm.

Arm Cortex A725: „Das Arbeitspferd für energieeffizienten KI-Durchsatz“

Arm zielt mit diesem Kern auf Gaming und KI ab

Übersicht über den Arm Cortex A725-Kern

Quelle: Arm


Die Kerne der X-Serie von Arm lassen sich normalerweise etwas frei bewegen und verbrauchen so viel Strom, wie sie brauchen, während die Kerne der A-Serie normalerweise darauf abzielen, Stromverbrauch und Leistung ins Gleichgewicht zu bringen. Mit dem Cortex-A725 verspricht Arm einen um 35 % leistungseffizienteren Kern mit höherer Leistung bei gleichem Stromverbrauch als der A715 vom letzten Jahr.

Wie bereits erwähnt, werden die meisten KI-Workloads auf der CPU ausgeführt, und Arm zielt mit dem A725 genau auf diese Workloads ab. Es hat eine um 25 % höhere Energieeffizienz und bietet außerdem eine Reihe von Optimierungen.

  • Verbesserungen der Registerdateistruktur
  • Erhöhter Nachbestellpuffer
  • Längere Warteschlangen für die Anweisungsausgabe
  • Neue 1MB L2-Konfiguration

Diagramm zur Dauerleistung des Arm Cortex A725

Quelle: Arm


Zusammenfassend lässt sich sagen, dass der A725 bei deutlich geringerem Stromverbrauch genauso viel Leistung bietet wie der A720 vom letzten Jahr. Bei den meisten Geräten wird hier der Großteil der Arbeit erledigt, daher sind hier alle Verbesserungen willkommen.

Arm Cortex A520 Refresh: Keine großen Änderungen nötig

Einige kleinere Verbesserungen, das war's

Arm Cortex A520 Unübertroffene Änderungen bei der Energieeffizienz

Quelle: Arm

Aufgrund der GDSII-Implementierung dieser Kerne verspricht Arm für das A520 Refresh einige Verbesserungen bei der physischen Implementierung. Viel mehr gibt es dazu eigentlich nicht zu sagen, außer dass dieser stromsparende Kern noch stromsparender sein wird. Der Grund dafür, dass es sich hier eher um ein Refresh als um eine komplett neue Implementierung handelt, ist, dass die Verbesserungen an anderen Kernen schnell erfolgen können, während die A5xx-Serie eher kleinere Verbesserungen aufweist, die im Laufe der Zeit vorgenommen werden können. Daher ist es sinnvoller, alle paar Jahre zwei Jahre Innovation in diese Kerne zu packen.


Arm versichert mir auch, dass es sich dabei nicht um einen „festen“ Zeitplan handele und dass, wenn es etwas Bedeutendes zu diesen Kernen zu sagen gäbe, dies zu einem früheren Zeitpunkt geschehen würde, aber das liege einfach in der Natur ihrer Entwicklungszyklen, dass dies geschehe.

DSU-120: Kleinere Änderungen, aber mehr vom Gleichen

Die größte Änderung ist L3 Quick Nap, das viel Strom sparen kann

Arm Cortex DSU 120 aktualisiert

Quelle: Arm

Die DynamIQ Shared Unit (DSU) integriert einen oder mehrere Kerne mit einem L3-Speichersystem, Steuerlogik und externen Schnittstellen, um einen Multicore-Cluster zu bilden. Es handelt sich im Wesentlichen um Arms Fabric, das es all diesen Kernen ermöglicht, miteinander zu kommunizieren und Ressourcen zu teilen. Daher ist es ein ziemlich wichtiges Puzzleteil für jeden Chipsatzhersteller, der einen Chip mit Arms Kerndesigns bauen möchte.


DSU-120 wurde letztes Jahr mit TCS23 eingeführt und dies ist eine aktualisierte Version desselben DSU vom letzten Jahr. Es gibt jedoch eine wesentliche Änderung, und das ist L3 Quick Nap.

L3 Quick Nap im DSU-120 ist ein ausgeklügelter Energiesparmodus, der unabhängig ausgeführt wird und für dessen Aktivierung oder Feinabstimmung kein Eingreifen von Chipsatzherstellern wie MediaTek oder Qualcomm erforderlich ist. Diese Funktion stellt sicher, dass der L3-Cache bei Nichtgebrauch in einen Energiesparmodus wechselt und bei Bedarf automatisch aktiviert wird. Dieser nahtlose Übergang ist der Schlüssel zur Reduzierung des Stromverbrauchs bei gleichzeitiger Beibehaltung hoher Leistung.

Noch besser ist, dass die Auswirkungen auf die Latenz vernachlässigbar sind. Das Design stellt sicher, dass die Wake-Up-Latenz so minimal ist, dass sie in den Pipeline-Stufen des Prozessors verborgen werden kann. Wenn Zugriffsanforderungen beim L3-Cache eintreffen, ist dieser bereits aufgeweckt und voll einsatzfähig, wenn der Zugriff erforderlich ist.

Wo wird das CSS für den Client angezeigt?

Es gibt einige wahrscheinliche Orte

Arm Cortex CSS für Client 2024 AI PC

Quelle: Arm


Wir gehen davon aus, dass CSS for Client an einigen Stellen auftauchen wird, aber das Interessante ist, dass Qualcomms Flaggschiff-Chips jetzt wahrscheinlich nicht mehr in Frage kommen. Da Arm in seinen Präsentationen immer wieder von „AI PC“ spricht, ist es durchaus möglich, dass einige dieser Kerne später in diesem Jahr sogar auf PCs zu sehen sein werden. Arm hat in seiner Präsentation viel über AI PCs gesprochen, und es gibt einige große Verbesserungen gegenüber früheren Kernen, von denen insbesondere PCs profitieren werden.

Abgesehen davon ist es wahrscheinlich, dass MediaTek weiterhin handelsübliche Arm-Kerne verwenden wird, und vielleicht werden sie auch in einigen Qualcomm-Chips der unteren Preisklasse zum Einsatz kommen. Wir werden abwarten, wie sich diese Kerne später in diesem Jahr in Chips schlagen, aber einige dieser Verbesserungen sind enorm aufregend.



Source link