F: Welches Unternehmen ist in der KI-Welt das beste in der Bulldozer-Produktion?

Wenn Sie jemand fragt: „Welches Unternehmen verfügt über die beste Baggertechnologie?“

Sie werden sich wahrscheinlich an diesen bekannten Werbeslogan erinnern: „Finden Sie Lanxiang in Shandong, China.“ (Keine Werbung, keine Werbung.)

Was wäre, wenn wir das Thema wechseln und anders fragen würden: „Welcher Bulldozer ist in der Welt der künstlichen Intelligenz (KI) der coolere?“

Was ist eine mögliche Antwort?

Komm, lass uns zuerst mit ein paar Bildern kämpfen.

Wie wäre es damit? Sind die verschiedenen Bulldozer nicht sehr cool und voller künstlerischer Atmosphäre?

Doch in Wirklichkeit ist ihre Vorlage aus dem wirklichen Leben nur der gewöhnliche Bulldozer in der Farbe „Bumblebee“ unten.

Wenn ein hässlicher Bulldozer auf Van Goghs „Sternennacht“ trifft, geschieht etwas Magisches.

Die „Magie“, die es dem Bulldozer ermöglicht, sich in alles zu verwandeln, was er will, stammt von der Cornell University und Adobe Research.

Berichten zufolge können sie mithilfe künstlicher Intelligenz den Stil berühmter Kunstwerke in jede 3D-Szene integrieren.

Darüber hinaus kann diese neueste Technologie Details in höherer Qualität darstellen als frühere Studien.

Abbildung | Die neue Methode zeigt weniger geometrische Artefakte (Quelle: arXiv)

Zusätzlich zum Stil „Sternennacht“ hat das Forschungsteam auch erfolgreich einen Pickup-Truck mit dem künstlerischen Stil von Edvard Munchs „Der Schrei“ ausgestattet, mit besseren Integrationseffekten sowohl hinsichtlich der Farbabstimmung als auch der Detaildarstellung.

(Quelle: arXiv)

Das zugehörige Forschungspapier mit dem Titel „ARF: Artistic Radiance Fields“ wurde auf der Preprint-Website arXiv veröffentlicht.

Dem Dokument zufolge ist die verbesserte Konvertierungsqualität darauf zurückzuführen, dass die künstliche Intelligenztechnologie des Forschungsteams in der Lage ist, die Details zwischen dem Originalbild und der 3D-Szene im neuen Stil direkt zu vergleichen. Frühere Technologien der künstlichen Intelligenz wandelten Bildmerkmale zur Analyse einfach in kompaktere statistische Sätze um, wodurch viele der ursprünglichen Details verloren gingen.

Kai Zhang, einer der Autoren des Artikels, sagte hierzu: „Wir haben versucht, wirklich subtile künstlerische Stile einzufangen, wie etwa die Pinselstriche in ‚Sternennacht‘. Das ist für die menschliche Wahrnehmung sehr wichtig, da unsere Augen sehr empfindlich auf lokale Details reagieren.“

In dieser Arbeit hat das Forschungsteam gezeigt, dass der Stilverlust durch Nearest Neighbor Feature Matching (NNFM) sehr effektiv ist, um Stildetails zu erfassen und gleichzeitig die Konsistenz über mehrere Ansichten hinweg aufrechtzuerhalten.

Abbildung｜Erstellen konsistenter Renderings im Stil freier Blickwinkel basierend auf NNFM (Quelle: arXiv)

Gleichzeitig schlugen sie auch eine neue Methode zur verzögerten Rückausbreitung vor, die Stilverluste verwendet, die auf in voller Auflösung gerenderten Bildern definiert sind, um speicherintensive Strahlungsfelder zu optimieren.

Abbildung | Schematische Darstellung der verzögerten Rückausbreitung (Quelle: arXiv)

Darüber hinaus zeigten sie in einer Online-Umfrage Videos von 5 verschiedenen 3D-Szenen in 5 verschiedenen künstlerischen Stilen. Im Vergleich zu früheren KI-Technologien war ihre KI-Technologie beliebter (über 86 %) und erhielt mehr Punkte.

Das Erstellen künstlerischer Bilder erfordert oft viel Zeit und spezielle Fachkenntnisse. Die Ausweitung von Kunstwerken über die zweidimensionale Bildebene hinaus auf Dimensionen wie Zeit (bei Animationen) oder 3D-Raum (bei Skulpturen oder virtuellen Umgebungen) bringt viele Einschränkungen und Herausforderungen mit sich.

Das Forschungsteam sagte, dass diese neueste Stilübertragungstechnik voraussichtlich in der Animationsfilm- und Spielebranche künftig für Stilvorlagen vor der manuellen Feinabstimmung verwendet werden könnte.

Darüber hinaus ist diese Technologie auch für fotorealistische Stilübertragungen anwendbar, wie etwa die Umwandlung der Freiheitsstatue am Mittag in die Freiheitsstatue bei Sonnenuntergang.

Allerdings weist diese Technologie auch viele Einschränkungen auf. Beispielsweise erfordert die Erfassung einer visuellen 360-Grad-Szene immer noch die Hilfe mehrerer Kameras oder Drohnen, die schweben und Ansichten aus mehreren Winkeln erfassen können.

Darüber hinaus kann es bis zu 20 Minuten dauern, bis der Algorithmus einmal erfolgreich ausgeführt wird. Dies ist ein sehr zeitaufwändiger Prozess, da man im Laufe eines Versuchs-und-Irrtum-Prozesses möglicherweise verschiedene Stile ausprobiert.

Zu diesem Zweck wird sich das Forschungsteam in seiner weiteren Arbeit auf die Verbesserung der Effizienz der Inhaltserstellung konzentrieren.

Vielleicht wird diese Technologie eines Tages in der Zukunft auf den Smartphones zum Einsatz kommen, die jeder nutzt.

Quellen:

https://arxiv.org/abs/2206.06360

https://www.cs.cornell.edu/projects/arf/

https://github.com/Kai-46/ARF-svox2

<<: Was ist Leben? Der Turing-Test könnte die Antwort liefern

>>: Werden Menschen durch das Tragen einer Maske krank? So einfach ist das nicht!

8 Ernährungstipps zur Vorbeugung von Herz-Kreislauf-Erkrankungen, die viele Menschen jedoch nicht befolgen

Wie präzise ist das Quadratkilometer große Radioteleskop-Array, das ein „riesiges Netz“ webt, um ins Universum zu blicken?

Artikel

Heute ist es leicht kalt. Sei eine schneewandernde Wildgans, sei eine schneebedeckte Kiefer

Artikel

Hat jemand in Ihrem Umfeld schon wieder Fieber? Ist Influenza A, Norovirus oder COVID-19 der Übeltäter? Ein Bild zeigt Ihnen den Unterschied!

Im Frühling sind Infektionskrankheiten weit verbr...

Ideal Auto veröffentlichte seinen Finanzbericht und erreichte erstmals die Gewinnzone, wobei der Umsatz im vierten Quartal um 65 % stieg

Li Auto, einer der neuen Automobilhersteller Chin...

Die Leistung liegt nahe am Golf R. Die neue Generation des Hyundai Veloster steht kurz vor dem Debüt

Vor Kurzem hat Hyundai offiziell eine Reihe von V...

CTIA: Branchenumfragebericht zur drahtlosen Netzwerkindustrie in den USA 2022

Laut der jährlichen Mobilfunkbranche-Umfrage 2022...

F: Welches Unternehmen ist in der KI-Welt das beste in der Bulldozer-Produktion?

8 Ernährungstipps zur Vorbeugung von Herz-Kreislauf-Erkrankungen, die viele Menschen jedoch nicht befolgen

Internationaler Tag der Verbraucherrechte – „Free XX“, ist das wirklich kostenlos?

Welche Menschen sind zum Sprinten geeignet?

Ist eine Gesichtsform, die dem Goldenen Schnitt entspricht, wirklich „perfekt“?

Eine Nummer über Harvard-Absolventen

Stimmungseinbruch im Winter? Keine Panik, diese Tipps helfen Ihnen, die Sonne wieder zu sehen!

Vom Panzer- zum Raumschifffahrer: Werden die Astronauten von Shenzhou-17 in Zukunft zum Mond fahren?

Befehle befolgen und anderen dienen ... Wann werden Roboter menschliche Arbeitskraft wirklich ersetzen?

Wie präzise ist das Quadratkilometer große Radioteleskop-Array, das ein „riesiges Netz“ webt, um ins Universum zu blicken?

Heute ist es leicht kalt. Sei eine schneewandernde Wildgans, sei eine schneebedeckte Kiefer

Artikel empfehlen

Welcher Fruchtsaft enthält bis zu 80 % Zucker?

Es ist auch anständig, das Metaverse nicht zu kritisieren

So machen Sie Übungen für einen schlanken Bauch

Welche Übungen gibt es für den inneren Trizeps?

NetEase Youdao Dictionary Pen 2.0 Testbericht: Die Art und Weise, Wörter nachzuschlagen, wird neu definiert

Bestimmen Ihre Gene Ihre Lebensentscheidungen?

Hat jemand in Ihrem Umfeld schon wieder Fieber? Ist Influenza A, Norovirus oder COVID-19 der Übeltäter? Ein Bild zeigt Ihnen den Unterschied!

Verhindern Liegestütze mein Wachstum?

Wie viel des fetten Fischs namens „Splatoon“ sollten Sie täglich essen, um sicher zu gehen?

Jack Ma konnte es nicht mehr ertragen und nutzte Alipay, um Citroen C3 AIRCROSS zu parken und aufzutanken

Mein Haaransatz wandert allmählich zurück. Stehe ich vor einer „Haarausfallkrise“?

Wie intensiv ist Seilspringen?

Ideal Auto veröffentlichte seinen Finanzbericht und erreichte erstmals die Gewinnzone, wobei der Umsatz im vierten Quartal um 65 % stieg

Die Leistung liegt nahe am Golf R. Die neue Generation des Hyundai Veloster steht kurz vor dem Debüt

CTIA: Branchenumfragebericht zur drahtlosen Netzwerkindustrie in den USA 2022