Ich, ein PPT-Designer, habe den Mund gehalten, nachdem ich aufgrund der KI nicht mehr aufhören konnte

Ich, ein PPT-Designer, habe den Mund gehalten, nachdem ich aufgrund der KI nicht mehr aufhören konnte

Bei der Frühlingsfestgala 2024 sahen sich Menschen im ganzen Land das erste KI-Video der Frühlingsfestgala an, begleitet von Ren Suxis warmem und liebevollem Gesang. „Durch das Fenster auf ein Märchen blicken, unter den leuchtenden Wolken, die Abendbrise sanft durch ihr silbernes Haar weht, er lächelt und wartet auf sie, um gemeinsam langsam nach Hause zu gehen“, in der Musik wandern ein Mann und eine Frau, die zur Musik tanzen, von der Jugend ins hohe Alter.

Frühlingsfestgala 2024 des chinesischen Zentralfernsehens

Was nur wenige wissen, ist, dass sich hinter diesem berührenden Programm ein äußerst schwieriger Auftrag verbirgt, dessen Deadline weniger als einen Monat beträgt und bei dem es keinen Raum für Fehler gibt.

Und KI hat diese scheinbar „unmögliche Aufgabe“ bewältigt .

Die rasante Entwicklung der Technologie der generativen künstlichen Intelligenz hat es ermöglicht, dass die Zusammenarbeit zwischen künstlicher Intelligenz und Menschen eine beispiellose Tiefe und Breite erreicht hat. Während wir nicht mehr nur abstrakt über KI in Science-Fiction-Filmen sprechen, hat KI bereits begonnen, unsere Arbeit und unser Leben im Stillen zu verändern. Vor diesem Hintergrund hat Science Popularization China eine Interviewreihe gestartet, um mit Brancheninsidern über alles rund um AIGC zu sprechen.

Sind Sie neugierig, wie der KI-Duetttanz im Frühlingsfest-Galawerk „She Who Pillows on Light“ zustande kam? Wie unterstützt KI Designer? Awen, der PPT-Designer hinter diesem Video, teilte seine Erfahrungen in einem Gespräch mit uns.

Er sagte: Als er KI zum ersten Mal einsetzte, hätte er sich nie vorstellen können, dass es heute so weit kommen würde – „Ich kann im Grunde nicht ohne KI leben.“

Im Folgenden finden Sie eine Zusammenfassung meines Gesprächs mit Awen.

Copyright-Bilder in der Galerie. Der Nachdruck und die Verwendung können zu Urheberrechtsstreitigkeiten führen.

Wie KI Teil meines Jobs wurde

F: Könnten Sie Ihre Arbeit bitte kurz vorstellen?

Awen: Mein Hauptjob ist PPT-Designer für Pressekonferenzen. Ich habe ein Designstudio in Peking, das auf PPT spezialisiert ist. Ich bin auch ein KI-Künstler.

F: Wann haben Sie begonnen, sich für AIGC zu interessieren?

Awen: Ich habe im April 2022 begonnen, mich mit KI zu beschäftigen. Da ich oft auf Weibo surfe, wurde im April 2022 ein Tool namens Disco Diffusion auf Weibo populär, und viele Künstler und gute Freunde in meinem Umfeld nutzten es.

F: Als Sie AIGC zum ersten Mal ausprobierten, was waren Ihrer Meinung nach die maximalen Möglichkeiten der KI-Malerei?

Awen: Der erste Eindruck muss schockierend sein. Wer hat im Jahr 2022 schon einmal ein Tool gesehen, das durch die Eingabe einiger Wörter Bilder generieren kann? Ich war also sehr aufgeregt, aber die Qualität der KI-generierten Bilder war damals noch sehr durchschnittlich und nicht hochauflösend genug. Nach der Veröffentlichung von DALLE-2 hatte ich eine völlig andere Meinung zu diesem Tool und dachte, dass es „für unsere Arbeit nützlich sein könnte“, aber ich hätte nie erwartet, dass es das werden würde, was es heute ist – meine tägliche Arbeit ist im Grunde untrennbar mit KI verbunden. Zumindest im Bereich der Standbilder ist KI durchaus leistungsfähig.

F: Wobei hat Ihnen KI geholfen?

Awen: KI spielt derzeit die größte Rolle in einem sehr wichtigen Teil meiner Arbeit – der Suche nach Designmaterialien. Bei Pressekonferenzen kommen häufig ultrabreite Bildschirmdesigns zum Einsatz, in der Galerie gibt es jedoch nur sehr wenige Bildschirme mit einer Länge von über zehn Metern, die sehr hochauflösendes, großformatiges Bildmaterial erfordern. In der Vergangenheit haben wir viel Zeit mit der manuellen Synthese großformatiger Materialien verbracht. Jetzt müssen wir der KI nur noch mitteilen, welche Materialgröße ich möchte.

Tatsächlich macht KI in meiner Hauptaufgabe, der Erstellung von PPT-Workflows für Pressekonferenzen, derzeit nur einen kleinen Anteil von etwa 25–30 % aus. Vor Kurzem habe ich begonnen, einige KI-Übertragungskreationen auszuprobieren, bei denen KI 80–90 % des gesamten Arbeitsablaufs ausmacht.

F: Werden sich Ihre kreativen Ideen durch die Hinzufügung von KI ändern?

Awen: Ich scheine faul geworden zu sein. Wenn früher ein kreatives Bedürfnis aufkam, habe ich zuerst darüber nachgedacht. Jetzt gebe ich vielleicht unbewusst ein paar Schlüsselwörter ein, um sie der KI zuzuführen. Es ist, als hätte ich einen besonders leistungsstarken Assistenten .

F: Müssen die von der KI erhaltenen Bilder manuell bearbeitet werden?

Awen: Anfangs mussten wir die KI-Materialien noch in PS importieren, um sie „aufzuhübschen“, mittlerweile schaffen wir das im Prinzip in einem Rutsch und nehmen kaum noch Änderungen vor.

F: Haben Sie schon einmal KI-Tools zum Erstellen von PPT ausprobiert?

Awen: Tatsächlich schätzen unsere professionellen PPT-Designer die Effekte, die mit dieser Art von Tool erzielt werden, nicht wirklich, und wir verwenden es nicht. Es handelt sich eher um eine Vorlage für einen Arbeitsbericht, den Büroangestellte ihren Vorgesetzten vorlegen.

F: Wann haben Sie mit der KI-Rotoskopie begonnen?

Awen: Anfang des Jahres erhielten Lehrer Hai Xin und ich einen Auftrag vom Programmteam der Frühlingsfestgala. Als Ren Suxi das Lied „She Who Pillows on the Light“ sang, wurde auf der großen Leinwand als Hintergrundvideo ein Duett-Tanzvideo auf die Bühne projiziert, um ein Paar zu präsentieren, das von der Jugend bis ins hohe Alter zur Musik tanzt. Da der Produktionszyklus sehr kurz war, weniger als einen Monat, hätte das Motion-Capture-Scannen und Modellieren der beiden Tänzer bei Verwendung der herkömmlichen Methode sehr viel Zeit in Anspruch genommen . Damals dachte das Programmteam der Frühlingsfest-Gala darüber nach, mithilfe von KI zu sehen, ob sich damit innerhalb kürzester Zeit ein „nicht schlechter“ Effekt erzielen ließe. Endlich haben wir es geschafft.

F: Wie wird dies konkret erreicht?

Awen: Bei der Umsetzung des Projekts sind wir auf viele Herausforderungen gestoßen.

Beispielsweise die Frage der Charakterstabilität. Das Programm ist als dreistufiges Cross-Dressing-Duett konzipiert, das die Zeit der Ehe, die Zeit nach der Ehe und das Alter umfasst. Der Einsatz von KI zur Erzielung einer reibungslosen Transformation ist eine wichtige Voraussetzung . Der Grund, warum Duette schwierig sind, liegt darin, dass die KI die Eigenschaften der beiden Charaktere verwechselt, sodass es häufig zu Problemen wie dem Vertauschen des Geschlechts kommt. Wir haben viele Methoden ausprobiert und dieses Problem schließlich gelöst, indem wir das ControlNet-Kachelmodell verwendet haben, um die Eigenschaften der Zeichen festzulegen.

Ein weiteres Beispiel ist die Realisierung des Materials Porzellan. Mit der Unterstützung der Open-Source-Modelle SDXL und Civitai sowie LoRa haben wir uns schnell für die tanzende Figur aus weißem Porzellan entschieden. Dabei sind wir jedoch auf viele Probleme gestoßen. Gerade als wir dachten, wir müssten das Porzellan-LoRa von SD1.5 trainieren, stellten wir fest, dass die Verwendung eines „Schlüsselworts“ das Materialproblem lösen könnte. Zusätzlich zu den Schlüsselwörtern haben wir auch ein Plug-In namens IP-Adapter gefunden, das mithilfe eines Referenzbilds die KI anleiten kann, bestimmte Materialeffekte zu erzeugen.

Eine weitere Herausforderung war der Stabilitätstest der Kostümwechsel. Wir haben die Clips zunächst in PR ausgerichtet und während der Generierung Prompt Travel (verschiedene Keyframes beschreiben unterschiedliche Inhalte) verwendet, um ein Ergebnis zu erzielen, mit dem das Programmteam zufrieden war.

Vision der KI

F: Welchen Verbesserungsbedarf gibt es bei den aktuell KI-generierten Bildern?

Awen: Ich denke, dass KI-generierte Bilder ihre Grenzen erreicht haben.

F: Hat es die Grenzen Ihrer Vorstellungskraft erreicht?

Awen: Wie dem auch sei, wenn Sie mir zwei Bilder nach dem Zufallsprinzip vorlegen, kann ich möglicherweise nicht sagen, welches von einer KI (generiert) und welches von einer echten Person erstellt wurde.

Je weiter sich die KI entwickelt, desto weniger kann ich den Unterschied erkennen. Sogar Designer in unserem Berufsfeld sind so. Für die breite Öffentlichkeit ist die Qualität der KI-Bilder also bereits völlig ausreichend und die KI-Malerei hat das nächste Level erreicht. Tatsächlich ist unsere Gruppe die arroganteste, was die Entwicklung der KI angeht. Am Anfang haben die meisten von uns auf KI-generierte Bilder herabgesehen. Ich dachte: „Wie kann KI überhaupt mit etwas mithalten, das wir selbst entworfen oder gezeichnet haben?“ Doch je mehr ich daran arbeitete, desto mehr wurde mir klar, dass die Qualität der KI-Generierung immer besser wurde. Als wir es ausprobiert haben, konnten wir einfach nicht mehr aufhören, es zu verwenden. Es reduziert wirklich Ihren Arbeitsaufwand und macht Sie effizienter. Dann halte ich langsam den Mund.

Wenn wir es jedoch sagen müssen, müssen wir es mit den Funktionen großer Textmodelle wie ChatGPT kombinieren, damit das textbasierte Graphenmodell die „menschliche Sprache“ besser verstehen kann.

Jetzt mache ich mehr KI-Übertragungen und schaffe einen Stil, der eher an Ölgemälde erinnert. Beispielsweise könnte man eine Straßenszene in Shanghai in eine Szene aus einem berühmten Gemälde von Van Gogh verwandeln.

F: Welche Jobs kann KI ersetzen und welche nicht?

Awen: Wiederholte Arbeiten werden definitiv ersetzt. Wenn Ihr bisheriger Job beispielsweise darin bestand, täglich Bilder auszuschneiden und Arbeiten auszuführen, die nichts mit Kreativität zu tun haben, werden Sie auf jeden Fall ersetzt. Wenn es etwas nicht ersetzen kann, müssen es weichere Fähigkeiten sein, wie zum Beispiel Kreativität. Ich bin der Meinung, dass diese Art von Arbeit völlig unersetzlich ist und dass es umso mehr von Ihrem persönlichen ästhetischen Geschmack abhängt, je mehr Sie daran arbeiten. Ihr persönlicher ästhetischer Geschmack hinsichtlich Inhalt oder Design wirkt sich auf Ihre endgültige Bildarbeit aus. Derzeit kann KI nur zufällig Inspiration bringen, Menschen können jedoch subjektiv ihre eigene Ästhetik hervorbringen, was unersetzlich ist.

Ich habe ein interessantes Phänomen beobachtet. Vor zwei Jahren provozierten einige Außenseiter Maler, Spieleentwickler und Designer mit der Ankündigung, sie würden bald ihre Arbeit verlieren. Doch zwei Jahre später werden Sie feststellen, dass die meisten der Top-Ten-Leute in der OPENART-Community Spielekünstler und -designer sind. Die KI-Malerei hat es schließlich an die Spitze der Pyramide geschafft, und diese Profis stehen immer noch an der Spitze.

F: Welchen Rat haben Sie für AIGC-Praktiker?

Awen: Machen Sie sich nicht zu viele Sorgen, zurückgelassen zu werden. Jeden Tag entstehen auf dieser Welt neue Technologien. Auf Grundlage meiner Beobachtungen der letzten sechs Monate ist es am effizientesten, abzuwarten, bis alle sie ausprobiert haben, dann die Schwachstellen zu finden und das Tool zu testen, das am besten funktioniert. So geht das am besten.

F: Glauben Sie, dass KI neue Arbeitsplätze schaffen kann?

Awen: Das wird es definitiv. Doch derzeit sind es traditionelle Designer, die den Beruf gewechselt haben und häufiger KI einsetzen.

F: Glauben Sie, dass die zukünftige Obergrenze der KI die gleiche sein wird wie die des Menschen? Oder wird die KI eine andere Entwicklungsrichtung einschlagen?

Awen: Ich denke, sie wird den Menschen übertreffen, denn allein die Wissensreserven der KI übersteigen die jedes einzelnen Menschen bei weitem. Möglicherweise handelt es sich sogar um die Summe allen menschlichen Wissens. Der Schlüssel liegt darin, wie KI Wissen nutzt. Ich denke, es ist nur eine Frage der Zeit, bis die KI den Menschen übertrifft.

F: Können Sie einige interessante Möglichkeiten zum Spielen von AIGC empfehlen, die Sie entdeckt haben?

Awen: Das beste KI-Übersetzungs-Plug-in, das ich je verwendet habe, ist Immersive Translation, das alle fremdsprachigen Webinhalte mit nur einem Klick in zweisprachige Übersetzungen umwandeln kann. Es wird durch ein großes Sprachmodell unterstützt, sodass die Übersetzung äußerst genau ist. Ich empfehle außerdem allen Programmieranfängern, Cursor auszuprobieren, da Sie damit Websites und Anwendungen schreiben können, ohne Codekenntnisse zu haben! Darüber hinaus möchte ich einem Freund, der AIGC gründlich erkunden möchte, ein KI-Tool empfehlen, das für Anfänger geeignet ist: comfyUI. Nach dem Einstieg stehen Ihnen alle Open-Source-Technologien als Plug-Ins zur Verfügung.

F: Gibt es noch etwas, das Sie mitteilen möchten?

Awen: Ich möchte sagen , dass Chinas Errungenschaften im Bereich der KI tatsächlich sehr beeindruckend und wirkungsvoll sind . Auf der ganzen Welt haben die Medien die Modelfähigkeiten großer ausländischer Unternehmen übertrieben und die unauffälligen, aber glänzenden chinesischen Teams ignoriert.

Tatsächlich werden in der Open-Source-Community, zumindest in den Bereichen KI-Malerei und KI-Video, 90 % der Komponenten von Chinesen oder chinesischen Teams geschrieben : LCM, AnimateDiff, instantID, IPadapter, LivePortrait usw., ganz zu schweigen von KeLing. Tatsächlich haben ausländische Open-Source-Communitys großen Respekt vor chinesischen Teams, doch chinesische Teams haben sich immer sehr zurückhaltend verhalten und ihre Bekanntheit in China ist selten groß. Daher denken viele Leute immer, dass Chinas KI-Technologie nicht gut sei und im Ausland nicht erfolgreich sein könne. Tatsächlich ist dies meiner Meinung nach überhaupt nicht der Fall!

Planung und Produktion

Autor: Dongding Oolong Popular Science Creator

Interviewpartner: Simon Awen, Mitbegründer von AbleSlide, KI-Künstler

Rezension von Yu Yang, Leiter des Tencent Xuanwu Lab

Planung von Lin Lin

Herausgeber: He Tong

Korrekturgelesen von Xu Lailinlin

<<:  Die neuesten Nachrichten sind, dass unsere nahen Verwandten bereits Nudeln mit Stäbchen essen!

>>:  „Wild Robots“ läuft im Kino! Wie kann Mutterliebe das „Gefängnis“ der Programmierung durchbrechen?

Artikel empfehlen

Es gibt eine Art Bank, deren "Vorteile" wir alle ungewollt genießen

Produziert von: Science Popularization China Auto...

Warum kann ich beim Schwimmen nicht schweben?

Jeden Sommer gehen viele Menschen zum Schwimmen a...

So bauen dünne Menschen Muskeln auf

Muskeln sind etwas, wonach sich viele Männer sehn...

Mit welchen Übungen kann man größer werden?

Als wir jung waren, wollte jeder groß werden. Gro...

Worauf sollten Sie beim Schwimmen achten?

Viele Menschen schwimmen gern. Im Sommer schwimme...

Training für schnellen Fettabbau

Auch für Mädchen ist Abnehmen ein lebenslanges Er...

Weltschlangentag | Neun Fragen zum Thema Schlangen, hier sind die Antworten!

„Gehen ohne Füße, schwimmen ohne Flossen, fliegen...