Am 30. Mai wurde auf der Konferenz zur Veröffentlichung der Ergebnisse des Zhongguancun-Forums 2023 der „Umsetzungsplan Pekings zur Beschleunigung des Aufbaus einer Innovationsquelle für künstliche Intelligenz mit globalem Einfluss (2023–2025)“ offiziell veröffentlicht. Der „Umsetzungsplan“ erfordert die Unterstützung innovativer Unternehmen, damit diese sich auf bahnbrechende Technologien wie verteilte und effiziente Deep-Learning-Frameworks und neue Infrastrukturen für große Modelle konzentrieren und Innovationen bei Technologien im Zusammenhang mit großen Modellen vorantreiben können. Dies wird von der Branche als ein weiterer starker Beweis dafür gewertet, dass China die Entwicklung großer Modelle stark vorantreiben wird. Tatsächlich hat die politische Neigung zur Entwicklung von KI-Technologien und zur Nutzung großer Modellchancen in letzter Zeit zugenommen, von den zentralen Ministerien bis hin zu den Provinzen und Städten. Sowohl die Dichte der politischen Maßnahmen als auch die strategische Gesamthöhe haben ein erstaunliches Niveau erreicht. Es gibt Grund zur Annahme, dass China im Bereich der KI schnelle Fortschritte erzielen wird, wobei große Modelle den Durchbruch darstellen. Seit der Einführung der Entwicklungsstrategie für künstliche Intelligenz der neuen Generation im Jahr 2017 wird China das aktuelle Zeitfenster der Möglichkeiten nutzen, um seine Entwicklung weiter voranzutreiben und den vollständigen Durchbruch der KI-Industrie zu fördern. Wir alle wissen, dass technologische Durchbrüche und der Aufbau einer Infrastruktur erforderlich sind, um die Entwicklungsmöglichkeiten der KI zu nutzen. Wenn es um die Infrastruktur der KI-Branche geht, werden im Allgemeinen KI-Chips, Deep-Learning-Frameworks und vorab trainierte große Modelle erwähnt, aber oft wird ein weiteres wichtiges Problem übersehen: Große Modelle bringen einen enormen Datendruck mit sich. Auch die Datenspeicherung ist eine Säule der KI-Entwicklung. ChatGPT ist der Auslöser für diese Runde der KI-Explosion, und die Datenprobleme, die durch die anschließende groß angelegte Anwendung großer Modelle entstanden, wurden tatsächlich in ChatGPT geschrieben. Ist China auf diesen drohenden Druck vorbereitet? Die Datenherausforderungen, die der Aufstieg der KI von ChatGPT mit sich bringt Seit Google 2018 BERT veröffentlicht hat, hat die Branche den Weg eingeschlagen, große Modelle vorab zu trainieren. Die Merkmale großer Modelle sind der enorme Umfang an Trainingsdaten und Modellparametern, der große Herausforderungen an die Speicherung mit sich bringt, was auch in ChaGPT deutlich gezeigt wird. Das sogenannte „Große“ des vortrainierten großen Modells spiegelt sich im Deep-Learning-Netzwerk des Modells mit vielen Schichten, vielen Verknüpfungen, komplexen Parametern und den komplexeren Arten von Datensätzen wider, die für das Training verwendet werden, sowie der größeren Datenmenge. Als Deep-Learning-Algorithmen erstmals eingeführt wurden, verfügten die gängigen Modelle nur über wenige Millionen Parameter. Als BERT jedoch veröffentlicht wurde, überstiegen die Modellparameter 100 Millionen, was Deep Learning in die Phase großer Modelle brachte. Zum Zeitpunkt von ChatGPT verfügten die Mainstream-Modelle bereits über Hunderte von Milliarden Parametern und die Branche hatte sogar mit der Planung von Billionen-Dollar-Modellen begonnen. In nur wenigen Jahren haben sich die Parameter von KI-Modellen tausendfach erhöht. Derart große Datenmengen und Modelle müssen gespeichert werden. Dies ist die erste große Herausforderung, die die KI-Explosion für die Speicherung mit sich bringt. Darüber hinaus wird vielfach erwähnt, dass das große KI-Modell eine völlig neue Modellstruktur annimmt, sodass es eine bessere Aufnahmefähigkeit und Robustheit gegenüber unstrukturierten Daten aufweist. Dies ist für die endgültige Wirkung der KI sehr wichtig, bringt aber auch ein abgeleitetes Problem mit sich: Wir müssen die Speicherung und den Abruf großer Mengen unstrukturierter Daten richtig handhaben. Beispielsweise wurden ChatGPT nach dem Upgrade multimodale Funktionen wie Bilderkennung hinzugefügt, sodass die Trainingsdaten auch eine große Anzahl von Bildern auf Textbasis enthalten müssen. Ein weiteres Beispiel: Selbstfahrende Fahrzeuge müssen täglich eine große Anzahl von Feldtestvideos als Grundlage für das Modelltraining speichern. Diese unstrukturierten Daten haben zu einem massiven Anstieg der KI-bezogenen Daten geführt, bringen aber auch Schwierigkeiten bei der Speicherung und Verarbeitung dieser Daten mit sich. Laut Statistik handelt es sich bei 80 % der neuen Daten weltweit um unstrukturierte Daten mit einer jährlichen Wachstumsrate von 38 %. Im Zeitalter großer Modelle ist die Bewältigung der zunehmenden Diversifizierung der Daten zu einer Schwierigkeit geworden, die überwunden werden muss. Ein weiteres Problem besteht darin, dass große Modelle oft ein häufiges Lesen und Abrufen von Daten erfordern. Die Datenzugriffsnutzung von ChatGPT erreichte in einem einzigen Monat 1,76 Milliarden Mal, mit einer durchschnittlichen Antwortgeschwindigkeit von weniger als 10 Sekunden. Der Arbeitsablauf des KI-Modells umfasst vier Teile: Sammlung, Vorbereitung, Training und Argumentation. Jede Phase erfordert das Lesen und Schreiben unterschiedlicher Datentypen. Große Modelle bringen daher auch Anforderungen an die Speicherleistung mit sich. Darüber hinaus erinnern uns die zahlreichen Streitigkeiten um Datenhoheit und Datenschutz im Zusammenhang mit ChatGPT daran, dass große KI-Modelle neue Risiken für die Datensicherheit mit sich bringen. Stellen Sie sich vor, Kriminelle greifen die Datenbank an und veranlassen das große Sprachmodell, falsche Informationen zu generieren, um die Benutzer zu täuschen. Die Folgen wären sowohl schwerwiegend als auch verborgen. Insgesamt ist ChatGPT zwar gut, stellt aber Herausforderungen hinsichtlich Umfang, Leistung und Sicherheit der Datenspeicherung dar. Wenn wir große Modelle und ChatGPT-ähnliche Anwendungen entwickeln möchten, müssen wir das Speicherproblem überwinden. China spart seine Kräfte. Ist es fertig? In den letzten Jahren haben wir gesagt, dass Rechenleistung Produktivität ist. Wer jedoch über Computer verfügt, muss auch über Speicherplatz verfügen, und die Grenze der Speicherkapazität bestimmt auch die Obergrenze für die Entwicklung der digitalen Produktivität. Ist China also bereit für die unvermeidliche rasante Entwicklung des großen chinesischen Modells? Leider ist Chinas Vorbereitung heute aus mehreren Perspektiven noch unzureichend und bedarf weiterer Verbesserungen und Entwicklungen. Werfen wir einen Blick auf einige der Probleme mit Chinas Speicherkapazität und prüfen wir, ob sie dem Datendruck entsprechen, den das große Modell mit sich bringt. 1. Unzureichende Speicherkapazität begrenzt die Entwicklungsgrenze der KI-Branche Große Modelle erzeugen enorme Datenmengen, daher hat die ordnungsgemäße Speicherung dieser Daten oberste Priorität. Allerdings besteht in China derzeit noch das Problem unzureichender Speicherkapazitäten, und große Datenmengen können nicht einmal in die Speicherphase gelangen. Laut Daten aus dem Jahr 2022 hat Chinas Datenproduktion erstaunliche 8,1 ZB erreicht und liegt damit weltweit auf Platz zwei. Allerdings beträgt die Speicherkapazität Chinas nur etwa 1.000 EB, was bedeutet, dass die Datenspeicherrate nur 12 % beträgt und die meisten Daten nicht effektiv gespeichert werden können. Während China den Status von Daten als fünften Produktionsfaktor klar definiert hat, muss sich eine intelligente Entwicklung auf Daten stützen und diese voll ausnutzen. Allerdings gibt es eine riesige Datenmenge, die schwer zu bewahren ist. Das Problem ist nicht zu unterschätzen. China muss seine Speicherkapazität weiterhin schnell und in großem Maßstab ausbauen, um die Chancen für die Entwicklung von KI-Technologien zu nutzen, die große Modelle bieten. 2. Geringe Verwaltungs- und Zugriffseffizienz unter dem Einfluss massiver Datenmengen Wie oben erläutert, besteht die größte Herausforderung im Umgang mit großen KI-Modellen in der geringen Verwaltungseffizienz sowie der geringen Verarbeitungs- und Zugriffseffizienz großer Datenmengen. Um die Zugriffseffizienz zu verbessern, müssen Daten hocheffizient und mit geringem Energieverbrauch gespeichert und geschrieben werden. Derzeit werden in China jedoch noch immer 75 % der Daten auf mechanischen Festplatten gespeichert. Im Vergleich zu Flash-Laufwerken weisen mechanische Festplatten eine geringe Kapazitätsdichte, langsame Datenlesevorgänge, einen hohen Energieverbrauch und eine geringe Zuverlässigkeit auf. Relativ gesehen bietet der All-Flash-Speicher eine Reihe von Vorteilen, wie z. B. hohe Dichte, geringer Energieverbrauch, hohe Leistung und hohe Zuverlässigkeit. Allerdings hat China noch einen langen Weg vor sich, bis es den reinen Flash-Speicher ersetzen kann. 3. Zahlreiche Datenbedenken führen zu einer ernsten Speichersicherheitslage Probleme der Datensicherheit sind für KI-Unternehmen und sogar die KI-Branche zu einem dringenden Anliegen geworden. Im Jahr 2020 kam es bei Clearview AI in den USA zu einem Datensicherheitsvorfall, der zum Verlust von 3 Milliarden Daten von mehr als 2.000 Kunden führte. Dieser Fall zeigt uns, dass die Datensicherheitslage in der KI-Branche sehr ernst ist und wir bereits bei der Datenspeicherung auf die Sicherheit achten müssen. Insbesondere da große KI-Modelle eine immer wichtigere Rolle in der Volkswirtschaft und für den Lebensunterhalt der Menschen spielen, besteht ein noch größerer Bedarf an Speichern, um die Sicherheitsfunktionen zu verbessern und so den verschiedenen möglichen Risiken gerecht zu werden. Objektiv betrachtet weist Chinas Speicherkapazität eine relativ hohe Wachstumsrate auf, weist jedoch noch immer gewisse Defizite hinsichtlich der Gesamtgröße, des Anteils an reinem Flash-Speicher und der technologischen Innovationsfähigkeit auf. Um den Anforderungen der industriellen Intelligenz und der großflächigen Implementierung von KI gerecht zu werden, ist ein Speicherupgrade dringend erforderlich. Chancen und Richtungen für die Speicherbranche im intelligenten Zeitalter Aus der Kombination des Drucks auf den Speicher, der durch das von ChatGPT repräsentierte große KI-Modell entsteht, und des Entwicklungsstatus der chinesischen Speicherkapazität selbst können wir eindeutig eine Schlussfolgerung ziehen: Chinas Speicher muss den Aufstieg der KI unterstützen und umfassende Upgrades durchführen. Wir können die Entwicklungsrichtung der Speicherbranche klar erkennen. Die Dringlichkeit und der große Handlungsspielraum dieser Richtungen stellen große Chancen für die Speicherbranche dar. Erstens müssen wir die Speicherkapazität erweitern und den Aufbau von All-Flash-Speicher beschleunigen. Der Ansatz „Silizium rein, Magnet raus“, bei dem mechanische Festplatten durch reinen Flash-Speicher ersetzt werden, ist seit vielen Jahren der allgemeine Entwicklungstrend der Speicherbranche. Angesichts der industriellen Möglichkeiten, die der Aufstieg der KI mit sich bringt, muss die chinesische Speicherindustrie die Implementierung und Umsetzung des All-Flash-Ersatzes beschleunigen, die Vorteile von All-Flash wie hohe Leistung und hohe Zuverlässigkeit maximieren und den Bedarf an Datenspeicherung und -nutzung erfüllen, der durch große KI-Modelle entsteht. Darüber hinaus ist es wichtig zu beachten, dass die Möglichkeiten für verteilten All-Flash-Speicher zunehmen. Mit dem Aufkommen großer KI-Modelle und der explosionsartigen Zunahme unstrukturierter Daten nimmt die Bedeutung von Daten erheblich zu. Gleichzeitig ist die KI in die Produktionszentren großer Regierungen und Unternehmen vorgedrungen. Immer mehr Unternehmensbenutzer tendieren dazu, lokalisiertes KI-Training durchzuführen und eine dateiprotokollbasierte Datenspeicherung zu verwenden, anstatt Daten auf öffentlichen Cloud-Plattformen zu speichern. Dies hat zu einer Zunahme und Stärkung der Nachfrage nach verteilter Speicherung geführt. Die Kombination aus beidem, die die Full-Flash-Implementierung der Speicherbranche weiterhin schnell vorantreibt, ist zum Kernstück der Entwicklung der chinesischen Speicherbranche geworden. Zweitens ist es notwendig, die Innovation in der Speichertechnologie voranzutreiben, um sie an die Entwicklungsanforderungen von KI-Modellen anzupassen. Wie oben erwähnt, besteht die durch KI hervorgerufene Datenherausforderung nicht nur in der großen Datenmenge, sondern auch in der Herausforderung der Datenkomplexität und der Vielfalt der Anwendungsprozesse. Daher muss die Weiterentwicklung der Speicherung weiter verbessert werden. Um beispielsweise den häufigen Datenzugriffsanforderungen der KI gerecht zu werden, müssen die Lese- und Schreibbandbreite sowie die Zugriffseffizienz des Speichers verbessert werden. Um den Datenanforderungen großer KI-Modelle gerecht zu werden, muss die Speicherbranche ein umfassendes technologisches Upgrade durchlaufen. Was die Datenspeicherformate betrifft, wurden traditionelle Datenformate wie „Dateien“ und „Objekte“ ursprünglich nicht dafür entwickelt, den Trainingsanforderungen von KI-Modellen zu entsprechen, und die Datenformate unstrukturierter Daten sind nicht vereinheitlicht. Das bedeutet, dass beim Datenabrufen durch KI-Modelle viel Arbeit nötig ist, um die Dateiformate neu zu verstehen und auszurichten, was wiederum zu einer Verringerung der Betriebseffizienz des Modells und einem Anstieg des Rechenleistungsbedarfs beim Training führt. Zu diesem Zweck ist es notwendig, auf der Speicherseite ein neues „Datenparadigma“ zu bilden. Am Beispiel des Trainings für autonomes Fahren sind im Datentrainingsprozess unterschiedliche Datentypen beteiligt. Wenn auf der Speicherseite ein neues Datenparadigma eingeführt wird, kann dies dazu beitragen, verschiedene Daten zu vereinheitlichen und sie besser an das KI-Modelltraining anzupassen, wodurch das Training autonom fahrender Fahrzeuge beschleunigt wird. Wenn wir uns KI beispielsweise als eine neue Tierart vorstellen, muss sie eine neue Art von Futter zu sich nehmen. Wenn wir ihm Daten in herkömmlichen Formaten zuführen, wird er unter Verdauungsproblemen leiden. Das neue Datenparadigma besteht darin, Daten zu erstellen, die auf der Speicherseite vollständig für KI geeignet sind, wodurch der Prozess der „Fütterung der KI“ reibungslos und nahtlos verläuft. Bei der KI-Entwicklung macht die Datenverwaltung einen großen Teil der Arbeitslast aus und es kommt zu Dateninselproblemen zwischen verschiedenen Datensätzen. Mithilfe der Data-Weaving-Technologie können diese Probleme wirksam gelöst werden. Durch Data Weaving kann der Speicher über integrierte Datenanalysefunktionen verfügen, um physisch und logisch verstreute Daten zu integrieren und eine globale Visualisierung der Datenplanungs- und -flussfunktionen zu erstellen. Dadurch werden die durch KI erzeugten riesigen Datenmengen effektiv verwaltet und eine verbesserte Effizienz bei der Datennutzung erreicht. Diese technologischen Innovationen auf der Speicherseite können zu einer besseren Verbindung zwischen Datenspeicherung und KI-Entwicklung führen. Darüber hinaus müssen Sicherheitsfunktionen in den Speicher selbst integriert werden, um proaktive Sicherheitsfunktionen zu stärken. Während der Wert der KI steigt, führen Datensicherheitsprobleme zu größeren Verlusten für Unternehmensanwender. Daher müssen Unternehmen ihre Datensicherheitsfunktionen verbessern. Der wichtigste Punkt besteht darin, die Datenausfallsicherheit zu verbessern, den Speicher selbst abzusichern und die Datensicherheit von der Quelle aus zu schützen. Als Nächstes werden weitere Datenausfallsicherheitsfunktionen in Datenspeicherprodukte integriert, beispielsweise Ransomware-Erkennung, Datenverschlüsselung, sichere Snapshots und AirGap-Quarantäne-Wiederherstellungsfunktionen. Es ist erwähnenswert, dass die Branche als Reaktion auf die Zunahme großer KI-Modelle bereits umfassende Speicherupgrades untersucht und versucht hat. Huawei Storage hat durch hochwertige All-Flash-Produkte, integrierte fortschrittliche Speichertechnologien und eingebaute Sicherheitsfunktionen eine enge Verbindung zwischen Speicherinnovation und KI-Entwicklung erreicht. Insgesamt sind die Entwicklung der Speicherbranche und die Verbesserung der Speicherkapazitäten Chinas von entscheidender Bedeutung für die Implementierung großer KI-Modelle und sogar für die intelligente Modernisierung Tausender Branchen. Ohne die Entwicklung von Speichermöglichkeiten wird es schwierig sein, die durch KI verursachte Datenflut angemessen zu bewältigen. Aufgrund fehlender Datenunterstützung könnte die KI-Technologie sogar zu einer Quelle ohne Wurzeln und einem Baum ohne Wurzeln werden. Die Speicherbranche wird gleichzeitig mit den Chancen und Verantwortlichkeiten des intelligenten Zeitalters konfrontiert. Mit der Erforschung der Speicherleistung durch herausragende Marken wie Huawei eröffnen sich Chinas Speicher noch nie dagewesene Chancen und gleichzeitig wird er der Verantwortung gerecht, die die Zeit mit sich bringt. Viele Branchenexperten glauben, dass das große Sprachmodell der „iPhone-Moment“ in der Geschichte der KI ist. Die durch KI-Technologie ermöglichte Erweiterung der Speicherkapazität könnte auch für Chinas Speicherindustrie ein Meilenstein und der Auftakt zu einem goldenen Zeitalter werden. |
Am 5. November findet im National Exhibition and ...
Ist Laufen eine anstrengende Übung? Vielleicht, a...
Viele Mädchen schreien auf, wenn sie auf der Stra...
Ein kürzlich von der Internationalen Energieagent...
Der Ertrag an Zweijahreszeitenreis überstieg 1.60...
Willkommen bei Northern Plants. Heute stelle ich ...
Prüfungsexperte: Wu Xinsheng Stellvertretender Ch...
Klettern ist ein Sport, der gewisse Risiken birgt...
Wir haben vielleicht schon einige Boxkämpfe im Fe...
Auf dem Staatswappen des Königreichs Saudi-Arabie...
Die Bauchspeicheldrüse Im Vergleich zu Herz, Lebe...
Möchten Sie Kinect-Bewegungserkennungsspiele auf ...
Jede Frau wünscht sich einen perfekten Körper, ab...
Spinat, aufgrund der Zeichentrickfigur „Popeye“, ...
Autor: Li Chuanfu Shi Xiangqi In der Science-Fict...