Ein genauer Blick auf den ARM CortexA-72-Prozessor: Kann er die Leistung wirklich um das 3,5-fache steigern?

Ein genauer Blick auf den ARM CortexA-72-Prozessor: Kann er die Leistung wirklich um das 3,5-fache steigern?

Obwohl ARM ein kleines Unternehmen ist, bildet es den Kern des gesamten ARM-Prozessorlagers. Mit Ausnahme einiger weniger Unternehmen wie Apple und Qualcomm, die selbst ARM-kompatible Architekturen entwickeln können, verwenden die meisten Unternehmen wie MediaTek und HiSilicon direkt die öffentliche Version der Cortex-A-Architekturlizenz von ARM. Seit der 64-Bit-Ära hat ARM zwei Architekturen herausgebracht, Cortex-A57/A53, eine große und eine kleine, aber nur A53 ist überall beliebt. Der Hochleistungskern A57 wird auf dem Mobiltelefonmarkt nur von Samsung und Qualcomm verwendet und steht vor der peinlichen Herausforderung einer schwierigen Geburt.

Zu diesem Zweck brachte ARM im Februar dieses Jahres den Nachfolger des A57, die Cortex-A72-Architektur, auf den Markt und gab an, dass seine Leistung 3,5-mal so hoch sei wie die des A15 und sein Stromverbrauch um 75 % gesenkt werde.


Zu diesem Zeitpunkt wussten wir noch nicht viel über den Cortex-A72-Kern von ARM. Wir wussten nur, dass der A72-Kern mit einer neuen Generation von FinFET-Prozessen hergestellt werden würde, darunter 14 nm von Samsung/Globalfoundries und 16 nm von TSMC. Dank des fortschrittlichen Prozesses ist die Kernfrequenz des A72 höher und erreicht 2,5 GHz. Durch die höhere Frequenz wird A72 seine Präsenz auf dem Servermarkt verstärken, der ebenfalls einer seiner Zielmärkte ist.

ARM hat vor Kurzem die detaillierte Architektur des Coretx-A72-Kerns bekannt gegeben und auf der Anandtech-Website wurden auch einige Analysen durchgeführt. Schauen wir uns an, welche Verbesserungen die A72-Architektur mit sich bringt. Schließlich dürfte der A72-Kern zum Standard für die Flaggschiff-Mobiltelefone/Tablets des nächsten Jahres werden.

Erwähnenswert ist, dass hier erstmals der Ursprung der Namensgebung des A72-Kerns erklärt wurde. Warum nicht einen Namen wie Cortex-A59 wählen? ARM erklärte, dass dies ausschließlich aus Marketinggründen diene. Wenn die Benennung der von A57 sehr ähnlich ist, wird es für die Leute schwierig sein, den Unterschied zwischen den beiden Kernen zu erkennen – achten die Leute nur auf die Zahlen, um zu beurteilen, ob sie gut oder schlecht sind?




ARM hat zuvor damit geworben, dass die Kernleistung des A72 3,5-mal so hoch sei wie die der vorherigen Generation und der Stromverbrauch um 75 % gesenkt wurde. Allerdings sollte jeder verstehen, dass dies nur Werbung ist. ARM hat den Unterschied zwischen A57 und A72 nicht direkt verglichen. Wenn man nur die beiden betrachtet, ist der A72-Kern im gleichen 14/16-nm-Prozess nur 34 % höher als der A57 (2,6x bis 3,5x, und der Frequenzunterschied muss auch berücksichtigt werden), und im gleichen 28-nm-Prozess ist sein Stromverbrauch nur um etwa 20 % reduziert.

Beachten Sie auch, dass der A72-Kern mit einer höheren Frequenz laufen kann. Dies ist nicht einfach die maximale Frequenz. Zuvor war der A57 zu leistungsstark, sodass er die höchste Frequenz nur für kurze Zeit halten konnte, bevor seine Frequenz reduziert werden musste. Von ARM bereitgestellte Daten zeigen jedoch, dass der A72-Kern bei 2,5 GHz im 16-nm-FinFET-Prozess nur 750 mW Strom verbraucht.


Neben dem Stromverbrauch hat ARM auch viele Optimierungen an der A72-Architektur vorgenommen. Wie in der obigen Abbildung gezeigt, wurde die Leistung von Ganzzahlen, Gleitkommazahlen, Speicher usw. in unterschiedlichem Maße verbessert. Obwohl noch einige Details fehlen, gibt es immer noch eine Verbesserung der IPC-Leistung um 16–30 %.

A72-Architektur von A57 aktualisiert

ARM scheint umfassende Verbesserungen bei Leistung, Stromverbrauch und Kernfläche erzielt zu haben, was ebenfalls drei wichtige Indikatoren für das Halbleiterdesign sind. Dieser Erfolg wurde erzielt, nachdem ARM fast alle A57-Logikblöcke neu optimiert hatte, mit erheblichen Verbesserungen der CPU-Architektur, einschließlich einer neuen Verzweigungsvorhersageeinheit und einem verbesserten Decoder-Pipeline-Design.


Im Bereich des Vorabrufs von Anweisungen können wir sehen, dass ARM die Verzweigungsvorhersageeinheit neu gestaltet hat, um komplexere Algorithmen zu unterstützen, die Leistung zu verbessern und den Stromverbrauch sowie die Fehlvorhersage- und Spekulationsrate zu reduzieren. Konkret wird im Vergleich zu A57 die Fehlvorhersagerate um 50 % und die Spekulationsrate um 25 % reduziert. Die redundanten Verzweigungsvorhersageeinheiten sind deaktiviert. ——Wenn die Verzweigungsvorhersageeinheit in der Praxis nicht effektiv arbeiten kann, wird sie umgangen.

Darüber hinaus hat ARM die RAM-Organisation durch eine bessere Kopplung verschiedener IP-Blöcke optimiert.



Beim Blick auf das Pipeline-Design von A72 wurde auch die Dekodierungs-/Umbenennungsleistung verbessert. Der Decoder selbst ist ein 3-Befehls-Decoder, aber ARM hat große Anstrengungen unternommen, um die Leistung zu verbessern und den Stromverbrauch zu senken. Zur Verbesserung der Leistung wurde die effektive Dekodierbandbreite erhöht und der Decoder erhielt außerdem einige Verbesserungen bei der AArch64-Befehlsfusion. Darüber hinaus wird der Stromverbrauch durch verschiedene Methoden, einschließlich der direkten Dekodierung, reduziert.

Es sieht so aus, als ob die Dispatch/Retire-Einheit die größten Änderungen zur Leistungsverbesserung erfahren hat. Der Decoder kann Anweisungen zusammenführen, und die Befehlsverteilungseinheit von ARM kann Ops-Operationen in kleinere Mikro-Ops aufteilen und diese an die Ausführungseinheit übertragen, sodass 3 Starts in der Befehlsverteilungseinheit in äquivalente 5 Starts umgewandelt werden können. Dadurch wird der Decoderdurchsatz erhöht und auch die Anzahl der von der Befehlsversandeinheit pro Zyklus erstellten Mikrooperationen erhöht.

Für die A72-Architektur gibt ARM durchschnittlich 1,08 Mikrooperationen pro Befehl an, was die Leistung der Befehlsverteilungseinheit verringern wird, die in der 57-Architektur tatsächlich begrenzt ist.



Andererseits verfügt auch die Ausführungseinheit über ein neues Design, einschließlich einer neuen Generation von FP-Gleitkomma-/Advanced-SIMD-Einheiten. Da die FP-Gleitkomma-Pipeline von 9 auf 6 reduziert wird, ist die Latenz geringer.

Die Latenz von FMUL (Gleitkommamultiplikation) wurde ebenfalls von 5 auf 3 Zyklen reduziert, die von FADD (Gleitkommaaddition) von 4 auf 3, die von FMAC (Gleitkommamultiplikation-Akkumulation) von 9 auf 6 und die von CVT-Einheiten von 4 auf 2. Die Rendering-Pipeline-Länge der FP-Gleitkommaeinheit wurde von 19 auf 16 reduziert.

Auch die Integer-Einheit wurde verbessert. Die Bandbreite des Radix-16-Teilers wurde verdoppelt und die Verzögerung der CRC-Einheit auf 1 Zyklus reduziert. Im Vergleich zur A57-Architektur wurde die Bandbreite verdreifacht.


Eine weitere wesentliche Leistungsverbesserung ist die L/S-Load-Store-Einheit. Laut ARM wurde die Bandbreite der L/S-Einheit durch die Einführung eines neuen Prefetchers um 30 % erhöht.

Die Verbesserungen der A72-Architektur auf dem Papier sind beeindruckend. Es handelt sich um ein innovatives Upgrade der A57-Architektur. Ob Leistung, Stromverbrauch oder Kernbereich, das A72 weist Verbesserungen auf.

Die A57-Architektur kam im dritten Quartal des letzten Jahres auf den Markt, aber die Prozessoren mit der A57-Architektur von Samsung und Qualcomm werden erst jetzt in Massenproduktion hergestellt und auf den Markt gebracht, sodass es mindestens ein Jahr dauern wird, bis der A72-Kern wirklich auf dem Markt ist.

Als Gewinner des Qingyun-Plans von Toutiao und des Bai+-Plans von Baijiahao, des Baidu-Digitalautors des Jahres 2019, des beliebtesten Autors von Baijiahao im Technologiebereich, des Sogou-Autors für Technologie und Kultur 2019 und des einflussreichsten Schöpfers des Baijiahao-Vierteljahrs 2021 hat er viele Auszeichnungen gewonnen, darunter den Sohu Best Industry Media Person 2013, den dritten Platz beim China New Media Entrepreneurship Competition Beijing 2015, den Guangmang Experience Award 2015, den dritten Platz im Finale des China New Media Entrepreneurship Competition 2015 und den Baidu Dynamic Annual Powerful Celebrity 2018.

<<:  Tracking & Survival „Leo’s Fortune“ bringt Tiefe in Casual Games

>>:  Surface 3-Upgrade auf Windows 10: Schmerz und Freude

Artikel empfehlen

Wie heben Mädchen Hanteln richtig?

Um ihren persönlichen Charme zu zeigen und ihren ...

RetailX: UK-E-Commerce-Bericht bis 2023

Die Ausgabe 2023 des RetailX UK eCommerce Report ...

Welche Übungen gibt es zum Bodybuilding?

Die Trainingsmethode für Bodybuilding ist bei jed...

Kann tägliches Training am Morgen beim Abnehmen helfen?

Bewegung ist der beste Helfer beim Abnehmen, aber...

Übersetzungsmeister: Wo Leidenschaft ist, gibt es eine Untertitelgruppe

„Die Ära, in der Sagittarius.com nötig war, ist v...

Wie macht man Liegestütze am besten mit einer Hand?

Liegestütze sind eine Übung, die vielen Jungen se...

Wie macht man Augenyoga am besten?

Moderne Hightech-Produkte bieten uns zwar Komfort...

vivo Xplay 3S Video- und Audio-Test

Beim Abspielen von hochauflösenden Videos sind inl...

Indoor-Muskelaufbaumethoden für Männer

Mit der zunehmenden Verbreitung des Internets in ...