Auf dem Gebiet der Nuklearwissenschaft gab es kürzlich große Neuigkeiten. Sogar die Wissenschaftler, denen das gelungen ist, finden es unglaublich – erstaunlich! „Auf diesen Moment habe ich lange gewartet – die erste Demonstration von Deep Reinforcement Learning in der Kernfusionsforschung!“ David Pfau, ein Wissenschaftler von DeepMind, teilte begeistert sein Papier. Ich weiß nicht, wie viele Freunde die Avengers – Iron Man im Film gesehen haben. Der Grund, warum er so großartig ist, liegt darin, dass sich in der Mitte seiner Rüstung eine „kleine Sonne“ befindet, die ihn kontinuierlich mit viel Energie versorgt. Diese kleine Sonne ist kein anderer als der Protagonist, über den wir heute sprechen werden – einer von ihnen – die kontrollierte Kernfusion. Obwohl wir nicht wissen, wie Iron Man im Marvel-Universum eine kontrollierte Kernfusion erreicht, ist dies in der menschlichen Welt bislang nur ein Traum. Quelle des „Iron Man 3“-Posters: www.sfs-cn.com 01 Was ist kontrollierte Kernfusion? So wie exotherme chemische Reaktionen zwischen Molekülen Energie erzeugen können, können auch exotherme Kernreaktionen zwischen Atomkernen (oder Neutronen) Energie erzeugen, und diese Energie ist weitaus größer als die Energie, die durch chemische Reaktionen erzeugt wird. Im aktuellen Verfahren der kontrollierten Kernfusion wird die Deuterium-Tritium-Reaktion verwendet: Schematische Darstellung der Kernfusionsreaktion (Deuterium und Tritium reagieren, wobei Neutronen und Helium entstehen und Energie freigesetzt wird) Quelle: Referenz [2] Bei der Fusionsreaktion von Deuteriumkernen und Tritiumkernen wird eine große Menge Energie freigesetzt, es ist jedoch nicht einfach, Deuteriumkerne und Tritiumkerne miteinander kollidieren zu lassen. Das erste Problem besteht darin, dass sowohl Deuterium- als auch Tritiumkerne positiv geladen sind und in der Natur Elektronen einfangen, um Atome zu bilden. Damit Deuterium und Tritium reagieren können, müssen diese Elektronen entfernt werden. Darüber hinaus ist der Zellkern sehr klein. Betrachtet man ein Atom als Fußballfeld, dann entspricht der Atomkern einem Ping-Pong-Ball auf dem Fußballfeld. Es ist sicherlich äußerst schwierig, zwei Tischtennisbälle in einem so großen Raum kollidieren zu lassen. Wissenschaftler nutzten eine wundersame Methode, um zwei Probleme gleichzeitig zu lösen: Erhitzen und Druckausübung. Erstens können durch Erhitzen die Elektronen und Kerne in den Atomen getrennt werden, um Plasma zu bilden, wodurch das erste Problem gelöst wird und außerdem die kinetische Energie der Kerne erhöht wird, also die Geschwindigkeit des Tischtennisballs. während durch die Druckbeaufschlagung der Abstand zwischen den Kernen verringert wird, was eine Verkleinerung des „Fußballfeldes“ bedeutet. Dadurch erhöht sich die Wahrscheinlichkeit einer Kollision von Atomkernen erheblich. Also, bis zu welchem Grad sollte es erhitzt werden? Nehmen wir die Sonne als Referenz. Die Temperatur im Zentrum der Sonne beträgt 15 Millionen Grad Celsius und der Druck erreicht das 300-Milliarden-fache des atmosphärischen Drucks. Da es für uns schwierig ist, einen solchen Druck zu erreichen, können wir nur eine höhere Temperatur verwenden. Die Betriebstemperatur des EAST (vollständig supraleitendes Tokamak-Kernfusions-Experimentiergerät) meines Landes beträgt bis zu 100 Millionen Grad. Doch damit stellt sich auch ein neues Problem: Wie können wir eine so kleine Sonne unterbringen? Um dieses Problem zu lösen, wurden verschiedene Lösungen zur kontrollierten Kernfusion vorgeschlagen. Eine der gängigeren Lösungen besteht darin, die Lorentzkraft zur magnetischen Einschließung zu nutzen. Ein Tokamak ist eine magnetische Einschlussvorrichtung. Schematische Darstellung einer Tokamak-Anlage (Spulen: Spulen, Plasma: Plasma) Quelle: Referenz [2] Seine Hauptstruktur ist ein kreisförmiger Ring mit einem Vakuum im Inneren. Um den Ring herum befinden sich mehrere Spulen, die ein Magnetfeld entlang der Tangentialrichtung des Rings erzeugen können. Außerdem gibt es in der Mitte des Rings mehrere Spulen, die ein Magnetfeld senkrecht zur Ringebene und ein induziertes elektrisches Feld entlang der Tangentialrichtung des Rings erzeugen. Unter einem solchen elektromagnetischen Feld kann das Plasma in einem Ring eingeschlossen und einer ohmschen Erwärmung ausgesetzt werden (Materialien mit Widerstand erzeugen Wärme, wenn ein elektrischer Strom durch sie hindurchfließt). Die kontrollierte Kernfusion bietet viele Vorteile. Einerseits sind die Rohstoffe im Überfluss vorhanden: Die Energie, die durch die Fusionsreaktion des aus jedem Liter Meerwasser gewonnenen Deuteriums freigesetzt wird, entspricht der Energie, die von 300 Litern Benzin freigesetzt wird. Tritium kann durch die Spaltung von Lithiumatomen erzeugt werden und Lithium kommt in großen Mengen sowohl in der Erdkruste als auch im Meerwasser vor. Man kann sagen, dass die Menschheit, sobald eine kontrollierte Kernfusion gelingt, weitgehend „Energiefreiheit“ erlangen wird. Zum anderen weisen die Produkte eine geringe Schadstoffbelastung auf. Die derzeit bevorzugte Option für eine kontrollierte Kernfusion ist die Deuterium-Tritium-Reaktion, bei der nur Neutronen und Helium-4-Kerne sowie eine große Menge Energie entstehen. Es entstehen keine schädlichen Gase und es gibt nahezu keine radioaktive Belastung. Und das Wichtigste: Obwohl es sich bei beiden um Kernenergie handelt, ist die Kernfusion sicherer und zuverlässiger als die Kernspaltung. Um die Kernfusion aufrechtzuerhalten, muss das Plasma eine Temperatur von Hunderten Millionen Grad erreichen und eine bestimmte Dichte aufrechterhalten. Um diese Temperatur und Dichte aufrechtzuerhalten, sind extrem harte Bedingungen erforderlich. Wenn auch nur die geringste Voraussetzung fehlt, kommt die Kernfusionsreaktion schnell zum Stillstand. Darüber hinaus befindet sich das an der Kernfusion beteiligte Plasma in einem Vakuum und seine Dichte ist sehr gering, sie liegt um mehrere Größenordnungen unter der Dichte von Luft. Daher besteht kein Grund zur Sorge, dass dieses Plasma austreten und mit der Luft reagieren und explodieren könnte. Allerdings ist es nicht einfach, an diese unerschöpfliche, saubere und umweltfreundliche Energie zu kommen. Ausreichend hohe Temperatur und Druck sind notwendige Voraussetzungen für eine kontrollierte Kernfusion. Laut bisherigen Analysen kann der Anstieg von Temperatur und Druck die Wahrscheinlichkeit erhöhen, dass Atomkerne miteinander kollidieren. aber die Wahrscheinlichkeit allein reicht nicht aus. Wir müssen auch dafür sorgen, dass diese Temperatur und dieser Druck lange genug anhalten, um die Zahl der Fusionsreaktionen in einem Experiment zu erhöhen und dadurch die insgesamt erzeugte Energie zu steigern. Wir nennen diese Zeit die Energieeinschlusszeit. Zusammen mit Druck und Temperatur stellt es die drei Elemente zur Bewertung einer kontrollierten Kernfusion dar. 02 Was kontrollierte Kernfusion eigentlich bedeutet... So wie die Menschen glauben, dass „das Aussehen das Herz widerspiegelt“ und „das Aussehen Gerechtigkeit ist“, legt auch die kontrollierte Kernfusion großen Wert auf das „Aussehen“ des Plasmas – wir nennen es „Konfiguration“. Dies liegt daran, dass die Querschnittsform des Plasmas verschiedene Parameter der Kernfusion beeinflussen kann. Wissenschaftler haben herausgefunden, dass es drei wichtige Parameter gibt: durchschnittliche Ionendichte, Energieeinschlusszeit und Ionentemperatur. Für ein kontrolliertes Kernfusionsexperiment gilt: Je größer das Produkt dieser drei Zahlen ist, desto besser. Durch die Optimierung der Querschnittsform des Plasmas kann die Energieeinschlusszeit dieser drei Zahlen verbessert werden. Fünfundzwanzig Jahre lang haben Wissenschaftler an der Verbesserung dieses Produkts gearbeitet und es konnte inzwischen um das Vierfache gesteigert werden. Plasma in einem Tokamak (links) und eine schematische Darstellung seiner Querschnittskonfiguration (rechts) Quelle: Referenz [1] Obwohl kluge Menschen einige der Regeln bereits beherrschen und Parameter wie Stromstärke und Spannung basierend auf der gewünschten Plasmakonfiguration rückwärts berechnen können, ist es einfach … ein bisschen ermüdend. Vereinfacht ausgedrückt können Sie auf Grundlage dieser erlernten Regeln ein Steuerungssystem erstellen – etwa welche Sensoreingangsdaten gelesen werden sollen und wie auf deren Änderungen reagiert werden soll; Bei einem echten Kernfusionsprozess unterliegt die Energiekonfiguration des Plasmas jedoch immer einigen merkwürdigen Schwankungen. Daher wird es einen Prozess gegenseitiger Iteration von Messung und Modellierung sowie Echtzeitanpassungen des ursprünglichen Systems geben, bevor das endgültige Steuersystem generiert wird. Der resultierende Controller ist nicht nur schwer zu bekommen, sondern kann auch nur für dieselbe Plasmakonfiguration verwendet werden. Jeder Versuch, mit einer radikal anderen Plasmakonfiguration in einem Tokamak zu experimentieren, würde wahrscheinlich erhebliche Änderungen am System erfordern. Experimentieren mit einer völlig anderen Plasmakonfiguration in einem Tokamak, als hätte der Vater des Kunden einige kleine Änderungen vorgenommen↑ Der Wissenschaftler, der das System überholen wollte, setzte eine Maske des Schmerzes auf↑ Tatsächlich wollen Menschen nicht so hart arbeiten. Ist nicht die Konfiguration selbst interessanter als die konkrete Methode, eine bestimmte Konfiguration zu erreichen? Lassen Sie deshalb die künstliche Intelligenz (KI) lernen, wie die Konfigurationsparameter bestimmt werden, was eine so langweilige und hirnzermürbende Aufgabe ist! KI: Es ist Zeit, die Welt zu verändern—— Deshalb hat sich DeepMind, ein Star-Unternehmen, das sich mit Problemen von der Proteinfaltung bis hin zu StarCraft auseinandergesetzt hat, mit dem Plasmazentrum der Eidgenössischen Technischen Hochschule Lausanne zusammengetan, um die Reise zur Zähmung des Tokamaks zu beginnen. 03 Reinforcement Learning: Diese Frage kann ich beantworten erster Schritt Ziele setzen Beim Studium steht natürlich das Ziel im Vordergrund. Das Ziel kann eine Vielzahl gewünschter Merkmale enthalten, einschließlich, aber nicht beschränkt auf Plasmaposition, erhebliche Stabilität des Stromflusses, präzise Formkontur mit angegebener Dehnung und X-Punktposition usw. (wie in der folgenden Tabelle gezeigt). Diese Ziele werden zu einer „Belohnungsfunktion“ zusammengefasst, die gezielt Steuerungsstrategien bestraft, die die Ziele nicht erreichen (ähnlich wie Schulregeln und -vorschriften). Obwohl mehr als ein Dutzend Funktionen aufgelistet sind, ist das Design der Belohnungsfunktion tatsächlich minimal, wodurch sichergestellt werden kann, dass der Verstärkungslernalgorithmus über maximale Flexibilität verfügt. (DeepMind: Das sind alles die guten Absichten des Lehrers! Komponenten der Belohnungsfunktion. Jede Komponente hat einen Zielwert und einen tatsächlichen Wert und viele können sich im Laufe der Zeit ändern. Quelle: Referenz [1] Schritt 2 Bestimmen Sie Ihre Strategie Verwenden Sie den Simulator, um relevante Daten zur Entwicklung von Plasmazuständen zu generieren, lassen Sie den Verstärkungslernalgorithmus diese Daten sammeln, kontinuierlich lernen und Erfahrungen sammeln und finden Sie dann unter Anleitung der Belohnungsfunktion die „optimale Steuerungsstrategie“. (Tatsächlich gibt es auch einen sorgfältig entwickelten „Kritiker“-Algorithmus, der speziell für das Training verwendet wird. Einzelheiten finden Sie in der Referenz [1].) Schritt 3 Praktische Übung Wie in der Abbildung dargestellt, besteht das „Echtzeit-Steuerungssystem“ des Tokamak aus zwei Teilen – einem herkömmlichen Controller und einem durch Deep Learning trainierten Steuerungssystem. In jedem Experiment erscheint nach der Erzeugung eines Standardplasmas als erstes der herkömmliche Regler, der zur Aufrechterhaltung der Position und des Gesamtstroms des Plasmas verwendet wird. Wenn sich das Plasma stabilisiert, ist das Deep-Learning-Steuerungssystem an der Reihe, in Aktion zu treten. Es verfolgt das Plasma anhand von 92 Arten von Messdaten 10.000 Mal pro Sekunde genau und passt die 19 Steuerspulen des Reaktors entsprechend den zuvor erlernten Strategien an, um letztendlich die Plasmaform und den Plasmastrom zu erhalten, die wir benötigen. Das Steuerungssystem besteht aus zwei Teilen: e ist das Deep-Learning-Steuerungssystem und f ist der traditionelle Controller. Letzterer stabilisiert zunächst das Plasma, und ersterer passt dann die Spule an, um die gewünschte Plasmakonfiguration zu erhalten. Quelle: Referenz [1] Tatsächlich sind die ersten beiden dieser drei Schritte wie Unterricht und Übungseinheiten in der Schule und nur der letzte Schritt ist die eigentliche Prüfung. Vor dem dritten Schritt werden zum Trainieren von Deep-Learning-Algorithmen lediglich „Übungsfragen“ und „alte Prüfungsunterlagen“ verwendet. Daher kann der schließlich durch Training erhaltene Algorithmus, wenn er in der tatsächlichen physikalischen Umgebung in einem realen Test ausgeführt wird, die Stabilität des Plasmas aufrechterhalten und die geometrische Struktur des Plasmas unter verschiedenen experimentellen Bedingungen ändern und sogar … gleichzeitig zwei unabhängige „wassertropfenförmige“ Plasmastrukturen im selben Tokamak erzeugen! (Bild unten links) Aus Sicht der Wissenschaftler bedeutet jede Konfiguration völlig unterschiedliche Parametereinstellungen. Quelle: Referenz [1] Dies war im Zeitalter herkömmlicher Controller undenkbar. Wenn es sich bei „Plasmakonfigurationssteuerung“ um einen Kurs handelt, dann ist künstliche Intelligenz offensichtlich der geniale Student in diesem Kurs! Die Entwicklung von Plasmasteuerungen war schon immer ein schwieriges Problem, da es bei einem der komplexesten Systeme, dem Tokamak, ein Problem mit der magnetischen Steuerung gibt. Man muss sagen, dass dieser bemerkenswerte Versuch der künstlichen Intelligenz neue Hoffnung und neue Richtung in die Entwicklung von Plasmasteuerungen gebracht hat. Dies wird zweifellos die Entwicklung der magnetischen Steuerung von Tokamaks und der Kernfusionswissenschaft beschleunigen. Dies ist auch das erste Mal, dass künstliche Intelligenz ihre Fähigkeiten in einem so wichtigen Bereich nach Schach (Alpha Go) und Spielen (StarCraft) unter Beweis gestellt hat. Mit unserem Wachstum wächst auch die künstliche Intelligenz. Wo wird es uns das nächste Mal überraschen? Warten wir es ab! Quellen: Magnetische Steuerung von Tokamak-Plasmen durch Deep Reinforcement Learning | Nature Originalartikel~ Ariola, M. & Pironti, A. (2008). Magnetische Steuerung von Tokamak-Plasmen (Band 187). London: Springer. Kontrollierte Kernfusion_Baidu-Enzyklopädie (baidu.com) Zum ersten Mal in der Geschichte steuert ein Reinforcement-Learning-Algorithmus die Kernfusion und erscheint in der Natur: DeepMind macht einen großen Schritt vorwärts in der künstlichen Sonne (qq.com) Neuer Fusionsreaktor verdoppelt Energierekord durch Atomfusion (sciencefriday.com) Die KI von DeepMind kann jetzt erfolgreich Plasma in einem Fusionsreaktor steuern – Von Futurist und virtuellem Keynote-Speaker Matthew Griffin (fanaticalfuturist.com) Wird die Anwendung der kontrollierten Kernfusion immer „noch 50 Jahre“ dauern? (baidu.com) Die „künstliche Sonne“ hat einen weiteren Schritt nach vorne gemacht, und die Technologie der kontrollierten Kernfusion hat einen weiteren Durchbruch erzielt (baidu.com). DeepMind_Baidu-Enzyklopädie (baidu.com) Warum Deuterium und Tritium? Ein umfassendes Verständnis der Grundprinzipien der Fusion in einem Artikel. - Zhihu (zhihu.com) Kontrollierte Kernfusion – Zhihu (zhihu.com) Was ist kontrollierte Kernfusion? - Zhihu (zhihu.com) Lithium (metallisches Element) – Baidu-Enzyklopädie (baidu.com) „Künstliche Sonne“ ist der Verwirklichung des Traums einen Schritt näher gekommen – die Geheimnisse der kontrollierten Kernfusion Chinas werden enthüllt – Zentrum für Stromzuverlässigkeitsmanagement und technische Qualitätsüberwachung der Nationalen Energieverwaltung (nea.gov.cn) Besonderer Dank an: Banyan Tree Emoticon-Quelle: Internet Titelbild: sktfaker Herausgeber: Banana Quelle: Institut für Physik, Chinesische Akademie der Wissenschaften |
<<: In einer Nacht kam es 263 Mal zu Atemaussetzern. Warum ist Schnarchen so schädlich?
>>: Hafermilch ist um ein Vielfaches teurer als Kuhmilch. Ist es Hafer oder Milch?
Viele junge Freunde gehen in ihrer Freizeit gerne...
Sind diejenigen gesegnet, denen beim Anblick der ...
Mendelejew: Begründer des Periodensystems der che...
Vor kurzem, Zhangjiagang Zoll unter Nanjing Zoll ...
Bewegung ist für jeden von uns sehr wichtig. Wenn...
In letzter Zeit sind die Krafttrainingsmethoden v...
Wenn Sie Ihre Muskeln stärker und voller machen m...
Es gibt viele Lebensmittel, die Ernährungswissens...
Obwohl das Wetter im Winter kalt ist, gehen viele...
Heutzutage trainieren immer mehr Menschen durch L...
Im Vergleich zu herkömmlichen Häusern verfügen Sma...
Bei den Übernahmen von Sunrise und Acompli durch ...
Am 22. Ortszeit verabschiedete die 78. Generalver...
Wir haben danach gesucht, aber es war nirgends zu...
Die Geburt einer Frau bringt nicht nur psychologi...