Tobende Computer: Millionen von CPUs kämpfen in Clustern! Ein leistungsstarker Supercomputer ...

Tobende Computer: Millionen von CPUs kämpfen in Clustern! Ein leistungsstarker Supercomputer ...

Produziert von: Science Popularization China

Autor: Luan Chunyang (Institut für Physik, Tsinghua-Universität)

Hersteller: China Science Expo

Wenn ein neues Smartphone oder ein neuer Heimcomputer auf den Markt kommt, sind die meistdiskutierten Themen stets die Rechenleistung und die Wärmeableitung der zentralen Verarbeitungseinheit (CPU). Die genaue Computerarchitektur innerhalb der CPU eines elektronischen Geräts ist uns vielleicht nicht klar, aber wir können die enormen Veränderungen, die die Verbesserung der CPU-Rechenleistung für unser Leben und unsere Arbeit mit sich gebracht hat, deutlich spüren.

Tatsächlich können diese elektronischen Geräte mit Datenverarbeitungsfunktionen, von den wissenschaftlichen Taschenrechnern, die wir oft in der Mittelschule verwendet haben, bis hin zu den Laptops, die für die tägliche Büroarbeit unverzichtbar sind, zusammenfassend als elektronische Computer bezeichnet werden. Gibt es also, ausgehend von klassischen Computern, schnellere und leistungsfähigere Computer?

(Fotoquelle: Veer Gallery)

Die wunderbare Welt der „0“ und „1“

Jedes Mal, wenn wir eine Taste auf einem Mobiltelefon oder einer Computertastatur drücken, müssen diese Zeichen oder Informationen zunächst in Codes umgewandelt werden, die von elektronischen Computern verarbeitet werden können: Kombinationen aus Nullen oder Einsen.

Beispielsweise wird der englische Buchstabe K gemäß der ASCII-Zeichenkodierung (American Standard Code for Information Interchange) als „01001011“ kodiert. Nach der Verarbeitung durch die CPU des Computers kann eine Zeichenfolge mit 0 oder 1 codierten Informationen in Buchstaben oder Bilder umgewandelt werden, die wir erkennen und die vor unseren Augen erscheinen.

In der CPU eines elektronischen Computers kann ein elektronischer Transistor als Basiseinheit für numerische Berechnungen von 0 oder 1 verwendet werden. Zu diesem Zeitpunkt kann der Durchgang des elektronischen Transistors den Wert 1 darstellen, und der offene Stromkreis stellt den Wert 0 dar. Wenn Millionen elektronischer Transistoren und anderer elektronischer Komponenten durch den Prozess der ultragroßen integrierten Schaltung auf einem kleinen Halbleiterchip verpackt werden, wird diese integrierte Schaltung mit Datenverarbeitungsfunktionen und Mikroverpackung allgemein als „Chip“ bezeichnet.

(Fotoquelle: Veer Gallery)

16 Kerne reichen nicht? Dann kommen noch ein paar „Hundert Millionen“ dazu!

Angesichts der kontinuierlichen Zunahme der Datenverarbeitungsaufgaben in Privatleben und Beruf kann die Rechenleistung eines einzelnen CPU-Kerns auf elektronischen Geräten den Anforderungen jedoch oft kaum gerecht werden. Derzeit können wir mehrere Rechenkerne in die CPU integrieren, um sicherzustellen, dass mehrere Kerne Datenaufgaben gleichzeitig unabhängig voneinander verarbeiten können. Gängige kommerzielle Computer verwenden heute im Allgemeinen 8-Kern-CPUs, und sogar einige Workstations, die für die Bewältigung großer Rechenaufgaben eingesetzt werden, verfügen über 16-Kern-CPUs.

Doch selbst solche Hochleistungsrechner können den immer komplexer werdenden Rechenanforderungen kaum gerecht werden. Nehmen wir als Beispiel unsere übliche Wettervorhersage: Für die numerische Simulation muss der Computer die Atmosphäre eines bestimmten Gebiets in Gitter diskretisieren. Soll die Wettervorhersage für die nächsten drei Tage eine Genauigkeit von über 90 % erreichen, sind mehrere zehn Milliarden Gleitkommaoperationen erforderlich. Bei der Berechnung mit einem handelsüblichen Computer dauert die Berechnung mindestens einen halben Monat.

Darüber hinaus erfordern intelligente städtische Transportsysteme und Online-Cloud-Computing, das von großen Rechenzentren unterstützt wird, exponentielle Datenverarbeitungskapazitäten. Daher begann man damit, bis zu Millionen von CPUs miteinander zu verbinden, um gemeinsam einen „Supercomputer“ zu bauen, der paralleles Rechnen ermöglicht.

(Fotoquelle: Veer Gallery)

Tatsächlich ist „Supercomputer“ kein einzelner Computer mit Superrechenleistung, sondern eine Abkürzung für einen Supercomputer-Cluster. Mit anderen Worten: Jeder Knoten in einem Supercomputer-Cluster ist ein unabhängiger Computer. Seine „Superlative“ liegt in der einzigartigen Knotenverbindungsstruktur, die es ihm ermöglicht, Tausende von CPUs gleichzeitig auf allen Knoten einzuplanen. Jede CPU verfügt im Allgemeinen über Dutzende physischer Kerne, was ihr exponentielle Datenverarbeitungskapazitäten verleiht.

Ein Allrounder ist der „Supercomputer“ allerdings nicht. Es verfügt nur über leistungsstarke Verarbeitungsmöglichkeiten für algorithmische Probleme, die parallel berechnet werden können, kann jedoch die Verarbeitung von Datenaufgaben für serielle Berechnungen nicht beschleunigen. Darüber hinaus wirken sich die Aufgabenplanungsstrategie des „Supercomputer“-Betriebssystems und die Optimierung des Compilers stark auf die eigene Leistung aus.

Die seriellen/parallelen Rechenaufgaben lassen sich hier vereinfacht wie folgt darstellen: Ein Erdhaufen lässt sich ursprünglich von einer Person in 10 Stunden bewegen, kann aber auch von 10 Personen in 1 Stunde bewegt werden. Wenn jedoch eine Person 10 Stunden braucht, um einen Brunnen zu graben, in dem nur eine Person Platz hat, ist es unmöglich, 10 Personen zu organisieren, um den Brunnen innerhalb einer Stunde fertigzustellen. Dabei handelt es sich um eine serielle Rechenaufgabe, die selbst ein „Supercomputer“ nur schwer effizient bewältigen kann.

Ein „Supercomputer“ ist daher nicht einfach ein Stapel von CPUs und Rechenkernen. Seine beschleunigte Rechenleistung beruht nicht nur auf der hoch koordinierten Verbindung zwischen den CPU-Kernen, sondern auch auf der Optimierung der algorithmischen Reihenfolge der Datenverarbeitungsaufgaben, um das Rechenpotenzial jeder CPU voll auszunutzen.

(Fotoquelle: Veer Gallery)

Der bekannte Supercomputer „Sunway TaihuLight“ verfügt über insgesamt 40.960 CPUs und seine Spitzenrechengeschwindigkeit erreicht 12,54 Billiarden Mal pro Sekunde und seine Dauerrechengeschwindigkeit erreicht 9,3 Billiarden Mal pro Sekunde. Mithilfe des Supercomputers „Sunway TaihuLight“ konnten Teams der Universität Tsinghua, der Pädagogischen Universität Peking und der Chinesischen Akademie der Wissenschaften die „Globale atmosphärische nicht-hydrostatische Wolkenauflösungssimulation“ abschließen und eine globale numerische Simulation des Erdsystems mit einer Auflösung von 10 Kilometern erreichen. Dieses Forschungsergebnis hat die Fähigkeit meines Landes, Naturkatastrophen unter komplexen meteorologischen Bedingungen zu überwachen, weiter verbessert.

Derzeit werden „Supercomputer“ häufig in der Molekulardynamiksimulation in der medizinischen Forschung und Entwicklung, im Brennstoffzellendesign für Elektrofahrzeuge, in der aerodynamischen Formoptimierung im Flugzeugdesign, in Randstabilitätsberechnungen von Einschlussvorrichtungen im Bereich der Kernfusion und in der Quantenmechaniktechnologie in der Atomphysik eingesetzt.

(Fotoquelle: Veer Gallery)

Supercomputer haben Grenzen

Allerdings erfordert der Bau eines „Supercomputers“ nicht nur Investitionskosten in Höhe von mehreren zehn Milliarden Yuan, sondern verursacht auch Stromkosten von bis zu Hunderttausenden Yuan pro Tag. Darüber hinaus schränken das enorme Volumen von Tausenden Kubikmetern und die aufwändige Wasserkühlung die Weiterentwicklung von „Supercomputern“ ein. Infolgedessen begann man darüber nachzudenken, wie man Computern bei kleinerer Größe und geringerem Stromverbrauch zu leistungsfähigeren Datenverarbeitungsfunktionen verhelfen könnte.

(Fotoquelle: Veer Gallery)

Eine naheliegende Idee besteht darin, mehrere Transistoren auf demselben Chip zu integrieren. Gordon Moore, einer der Gründer von Intel, schlug das „Mooresche Gesetz“ vor, das besagt, dass sich die Anzahl der Transistoren auf einem integrierten Schaltkreis alle 18 bis 24 Monate verdoppelt, sodass sich die Datenverarbeitungskapazität der CPU verdoppelt. Aus diesem Grund verfügen sogar die CPUs unserer heutigen, Tausende Yuan teuren Mobiltelefone über eine höhere Rechenleistung als handelsübliche Computer vor zehn Jahren – weil die Transistordichte zugenommen hat.

Allerdings kann das „Mooresche Gesetz“ nicht ewig aufrechterhalten werden. Einer der Gründe dafür besteht darin, dass der für die Chip-Mikroschaltkreisverarbeitung verwendete Lithografieprozess die optische Beugungsgrenze von 2 bis 3 nm erreicht hat und es daher schwierig geworden ist, die Transistordichte weiter zu erhöhen und gleichzeitig die Chipausbeute sicherzustellen. Da die Transistoren immer kleiner werden, kommt es außerdem zu Leckagen zwischen den Elektroden und großen Problemen bei der Wärmeableitung, die ebenfalls zu Leistungseinbußen des Chips führen.

Bedeutet ein solches Dilemma, dass die Entwicklung unserer Computertechnologie an einen Engpass gestoßen ist? Keine Sorge, die Antwort verrate ich Ihnen im nächsten Artikel.

Herausgeber: Sun Chenyu

<<:  Kann man über Nacht abgestandenes oder abgekochtes Wasser trinken? Viele Menschen können sich die Folgen nicht vorstellen!

>>:  Erstatten Sie Ihr Geld zurück! Beginnen Sie noch heute!

Artikel empfehlen

Hu Q&A: Kann ein Welpe verstehen, was Sie sagen?

„Komm schon, komm schon, Welpe, Welpe, saug, saug...

Ist die „hohe Strafe“ von 260 Millionen für Kuaibo zu viel?

Nur durch eine Trendwende hin zu einer schwachen S...

Welche Aerobic-Übungen gibt es zur Gewichtsabnahme nach der Geburt?

Fühlen Sie sich als frischgebackene Mutter direkt...

Meizu Note 2 im Praxistest: Details machen den großen Unterschied

Meizu brachte das Meizu Blue Note 2 mit fast kein...

Welche Gefahren birgt das Joggen?

Joggen ist eigentlich eine Form der körperlichen ...

US-Energieministerium: Blaupause zur Dekarbonisierung des Verkehrssektors

Die US-Regierung hat den Nationalen Plan zur Deka...

Wie gestaltet man ein Krafttraining, das zur Gewichtsabnahme geeignet ist?

Für manche Menschen, die abnehmen und perfekte Ku...

Beachten Sie diese unausgesprochenen Regeln beim Museumsbesuch

Es ist mittlerweile sehr in Mode gekommen, auf Re...