Dieses Bild hat unzählige Menschen getäuscht. Ich kann meinen Augen nicht trauen, nachdem ich es gesehen habe!

Dieses Bild hat unzählige Menschen getäuscht. Ich kann meinen Augen nicht trauen, nachdem ich es gesehen habe!

Schauen wir uns zunächst das Bild unten an. Ist auf dem Bild eine Dose der gewöhnlichen roten Coca-Cola zu sehen? Manche Leute werden sagen: „Ich traue meinen Augen, es ist absolut wahr, es muss dort sein.“

Aber beeilen Sie sich nicht. Vergrößern Sie dieses Bild auf Ihrem Mobiltelefon- oder Computerbildschirm und schauen Sie es sich dann genau an. Haben Sie das Gefühl, dass etwas nicht stimmt? Es schien nur einige schwarze, weiße und blaue Linien darin zu geben, aber kein echtes Rot. Als das Bild jedoch auf seine ursprüngliche Größe verkleinert wurde, erschien die rote Cola-Dose wieder.

Das Bild der „roten Cola-Dose“ wurde in den sozialen Medien weit verbreitet (die rechte Seite ist eine Teilvergrößerung). Quelle: jimhejl (Twitter)

Wie lässt sich dieses seltsame Phänomen erklären, das sowohl real als auch illusorisch ist? Ist es wirklich wahr, dass Sie nur Licht sehen, weil in Ihrem Herzen Güte ist, und nur Dunkelheit, weil in Ihrem Herzen Böses ist? ist es wirklich so, dass Sie nur rote Dosen sehen, weil Sie Coca-Cola im Herzen tragen?

Wenn Ihre Sehkraft Sie täuscht, seien Sie nicht traurig oder besorgt, die Optik wird Ihre Fragen beantworten und Ihre Zweifel ausräumen. Es kommt nicht selten vor, dass auf einem Foto Farben zu sehen sind, die aus dem Nichts auftauchen. Dies hängt mit der Art und Weise zusammen, wie das Foto Farbinformationen darstellt .

Ob Kamera, Display, Drucker oder Projektor – alle Arten digitaler Bildgebungsgeräte stellen ein Bild in Form einer Pixelanordnung dar. Vereinfacht ausgedrückt besteht das gesamte Bild aus vielen kleinen Quadraten als Grundeinheiten, jedes kleine Quadrat wird als Pixel bezeichnet und hat seine eigene Farbe.

Vor zwanzig oder dreißig Jahren war die Bildqualität der ersten elektronischen Spielkonsolen schlecht, die Auflösung niedrig, jeder Pixel groß und das Bild wirkte immer „gitterartig“, wie ein Mosaik. Später, mit der Entwicklung der Anzeigetechnologie, nahm die Anzahl der Pixel in einem Bild zu und die Größe jedes einzelnen Pixels wurde kleiner, sodass das gesamte Bild immer realistischer aussah und einzelne Pixel unsichtbar schienen. Doch egal, wie sich die Dinge veränderten, die Form des Pixel-Arrays blieb dieselbe.

Natürlich werden Ihnen die beliebten NFT-Avatare , die von CryptoPunk repräsentiert werden, aufgrund des Retro-Trends immer noch ein klares „Pixelgefühl“ vermitteln (der Fachname von NFT lautet Non-Fungible Token, nicht fungibles Token).

Screenshot früher Videospielkonsolen Quelle: Light Science/VEER

NFT-Avatar-Bildquelle: Light Science Forum/VEER

Wir sprechen oft von Schwarzweißfotos und Farbfotos, Schwarzweißfilmen und Farbfilmen. Tatsächlich sollte sich „Schwarzweiß“ auf „Graustufen“ beziehen . Obwohl es keine Farbe enthält, weist es einen kontinuierlichen Übergang von tiefem Schwarz, Dunkelgrau, Mittelgrau, Hellgrau zu tiefem Weiß auf (konkret kann dies durch Graustufenwerte von 0 bis 255 ausgedrückt werden), was ebenfalls ein beträchtliches Maß an Bildwirkung und Ausdruckskraft mit sich bringen kann.

So setzte der Regisseur des berühmten 90er-Jahre-Films „Schindlers Liste“ beispielsweise in den meisten Bildern bewusst einen farblosen Graustufeneffekt ein. Aufgrund technischer Einschränkungen sind echte Graustufen jedoch manchmal nicht möglich. Beispielsweise kann ein einfacher Drucker oder Bildschirm in jedem Pixel nur volles Schwarz (0) und volles Weiß (255) anzeigen, was so ist, als hätte er nur zwei Pinsel: reines Schwarz und reines Weiß. Dies kann als echte binäre Schwarzweißanzeige bezeichnet werden. Ein guter Koch kann nicht ohne Reis kochen. Es erfordert einige Überlegung, ein Foto mit unterschiedlichen Grautönen an unterschiedlichen Positionen zu zeichnen.

Graustufenbild eines Männerfotos (links), durch grobe Annäherung erhaltenes Schwarzweiß-Binärbild (Mitte), durch Pixeloptimierung erhaltenes Schwarzweiß-Binärbild (rechts) Bildquelle: Light Science / VEER

Wenn wir beispielsweise dieses Graustufenfoto eines Ausländers anzeigen möchten und die Graustufenwerte verschiedener Pixel direkt an reines Schwarz oder reines Weiß annähern, wird das Hellgrau zu Weiß und das Dunkelgrau zu Schwarz „aufgerundet“. Das Endergebnis wird genauso schrecklich sein wie das zweite Bild, ein komplettes „Clownsgesicht“.

Das dritte Bild sieht viel gemütlicher aus. Es scheint, dass die Graustufentiefe variabel ist, nicht nur Schwarz und Weiß. Aber wenn man genau hinsieht, gibt es immer noch nur diese beiden Arten von Pixeln. Es wird lediglich ein Algorithmus namens „ Fehlerdiffusion “ [1] verwendet, um das Verhältnis von schwarzen und weißen Pixeln in verschiedenen Bereichen sinnvoll zu steuern. Die Bereiche mit relativ dichten schwarzen Punkten stellen dunkle Bereiche dar, und die Bereiche mit relativ dichten weißen Punkten stellen helle Bereiche dar. Die räumliche Verteilung wird gegen die Genauigkeit der Farbtiefendarstellung ausgetauscht. Es ist wie Magie und bietet ein komplettes Graustufen-Seherlebnis.

Dasselbe lässt sich mit einer begrenzten Anzahl von Pinseln erreichen, um unzählige farbenfrohe Variationen zu erstellen. Bei der Farbanzeige sind Rot, Grün und Blau die drei Grundfarben. Durch Mischen von rotem und grünem Licht kann gelbes Licht entstehen, durch Mischen von grünem und blauem Licht kann cyanfarbenes Licht entstehen und durch Mischen von rotem und blauem Licht kann violettes Licht entstehen. Das Ergebnis der Mischung aller drei Primärfarben ist weißes Licht.

Im Idealfall kann ein Pixel gleichzeitig die Grundfarben Rot, Grün und Blau (RGB) des Lichts erzeugen und die Intensität der drei Kanäle lässt sich frei einstellen, sodass sich verschiedene Farben problemlos mischen lassen. Aber Ideale sind schön, die Realität jedoch grausam. Wenn ein Pixel nur Rot oder Blau allein anzeigen kann, wie kann man es dann mit Lila kombinieren?

In den Schachbrettmustern unten ist jedes Quadrat rot oder blau, im Verhältnis 1:1. Von links nach rechts werden die Pixel kleiner und dichter, je kleiner das Raster wird, und es scheint, als würden Rot und Blau nach und nach verschwinden, bis das gesamte Muster schließlich violett wird.

Das ist tatsächlich falsch!

Alle Pixel in allen Mustern (einschließlich des Musters ganz rechts) enthalten nur Rot und Blau. Lila ist eine Illusion, die durch die Verschmelzung roter und blauer Pixel im menschlichen Auge entsteht , oder anders ausgedrückt: Eine Farbe, die nicht existiert, wird aus dem Nichts wahrgenommen.

Die Größe der roten und blauen Blöcke nimmt allmählich ab und geht in eine violette über. Bildquelle: Jiao Shuming

Im linken Bild unten hat jeder Pixel nur 256 mögliche Farben, was es schwierig macht, sattere Farbstufen auszudrücken. Nach einer sinnvolleren Verteilung der Pixel wird das Bild rechts jedoch deutlich ansprechender für das Auge.

Das ursprüngliche 256-Farben-Bild (links) und das optimierte Bild (rechts) Bildquelle: Wikimedia Commons

Wir können neue Farben „aus dem Nichts“ durch die räumliche Verteilung einer begrenzten Anzahl von Farbpixelpositionen erzeugen, und die Zeitdimension ist eine andere Möglichkeit.

Um ein einfaches Beispiel zu nennen: Viele Menschen müssen in ihrer Jugend ein solches Spiel gespielt haben. Aus Pappe eine kleine Scheibe formen, diese abwechselnd rot und gelb anmalen und dann mittig eine kleine Säule durch die kleine Scheibe stecken, sodass sich die kleine Scheibe schnell wie ein Kreisel drehen kann. Was werden Sie sehen?

Das stimmt, die kleine Scheibe ist weder rot noch gelb, aber die beiden Farben „wechseln“ schnell an Ihren Augen vorbei und werden auf die orange Farbe in der Mitte „angepasst“. Wenn auf dem Bildschirm ein Video abgespielt wird, entspricht dies tatsächlich Dutzenden von statischen Bildern, die jede Sekunde schnell hintereinander aufblinken. Das menschliche Auge verfügt über einen Persistenzeffekt, der die beiden Farben vermischt. Auf diese Weise werden die beiden Primärfarben abwechselnd und schnell angezeigt, was Ihre Augen auf natürliche Weise täuschen kann, sodass sie nach der Fusion die neue Farbe sehen.

Tatsächlich haben die oben genannten Bildverarbeitungstricks einen besonderen Namen: Dithering . Diese Geschichte beginnt vor mehreren Jahrzehnten während des Zweiten Weltkriegs.

Damals waren elektronische Computer noch nicht erfunden und die Bomber des US-Militärs konnten zur Berechnung von Flugrichtungen und Bombenkurven nur mechanische Computer verwenden. In einem großen Karton befanden sich zahlreiche Zahnräder und Hebelteile. Obwohl die Rechengenauigkeit nicht sehr gut war, waren die Computer auch recht zerbrechlich und anfällig für Stöße und Stürze. Das Auf- und Absteigen im Bombercockpit war nicht so bequem wie das Sitzen auf dem Sofa zu Hause. Die größte Sorge bestand darin, dass durch die heftigen Erschütterungen Teile abfallen könnten, wodurch der mechanische Computer ausfallen könnte, das Flugzeug seinen Kurs verlieren könnte und die Bombe versehentlich auf ihre eigene Position abgeworfen werden könnte, was große Probleme verursachen würde.

Dieser Computer funktionierte jedoch recht gut und wurde durch die Erschütterungen im Flugzeug nicht beschädigt. Überraschender ist, dass die Berechnungsergebnisse genauer waren als bei der sicheren Anwendung am Boden, was ein Rätsel ist. Da es dieses „seltsame Temperament“ hat, haben die Ingenieure einmal speziell einen Vibrator entwickelt, um den Flugzustand zu simulieren, damit der mechanische Computer das Fluggefühl am Boden erleben und die Berechnungsgenauigkeit verbessern kann.

Warum arbeiten diese Jungs besser, nachdem sie im Flugzeug durchgeschüttelt wurden?

Dies liegt vor allem daran, dass frühe mechanische Teile nicht wie heutige Computer auf viele Dezimalstellen genau sein konnten, sondern nur über eine begrenzte Anzahl von Ziffern verfügten. Unter der Annahme, dass die Genauigkeit nur auf zehn Stellen (100, 110, 120, 130, 140, ...) liegen kann, muss die Einerstelle gerundet werden. Beispielsweise kann 123 nur als 120 und 128 nur als 130 ausgedrückt werden. Dies ist offensichtlich nicht zuverlässig genug. Nach schrittweisen Berechnungen häufen sich die Fehler immer mehr.

Anstatt 123 jedes Mal mit dem „Shortweight“ 120 auszudrücken, ist es klüger, 123 manchmal mit 120 und manchmal mit 130 auszudrücken. Da es jedoch näher an 120 liegt, sollte der durch 120 dargestellte Anteil etwas größer sein, genauso wie das Mischen einer Tasse kochenden Wassers und einer Tasse eiskalten Wassers in entsprechenden Anteilen warmes Wasser mit einem gewissen Grad an Hitze oder Kälte dazwischen ergeben kann.

Durch das Schütteln des mechanischen Computers entsteht ein Fehler, der dazu führt, dass die Berechnung, die normalerweise jedes Mal gerundet wird, manchmal fehlschlägt und die Zahl „vier“ und die Zahl „fünf“ gerundet werden. Durch Zufall wird unbeabsichtigt der Effekt der „ numerischen Mischung “ erzielt. Diese Methode, einige zufällige kleine Fehler hinzuzufügen, um die großen Fehler zu beseitigen, die durch Rundungen während der Berechnung entstehen, ist eine brillante Idee, „Gift mit Gift zu bekämpfen“. Dies ist die früheste Quelle der Dithering-Technologie [2].

Im Jahr 1946, nach dem Ende des Zweiten Weltkriegs, wurde an der University of Pennsylvania der weltweit erste moderne elektronische Digitalcomputer ENIAC geboren . Mechanische Computer sind allmählich aus der Geschichte verschwunden, doch die Dithering-Technologie erstrahlt in einer neuen Phase der Farbanzeigetechnologie.

Eines der heiklen Probleme, mit denen verschiedene Kameras und Displays seit den frühen Entwicklungsstadien bis heute konfrontiert sind, wenn es darum geht, die farbenfrohe reale Welt originalgetreu aufzuzeichnen und wiederzugeben, ist der Mangel an einer großen Farbvielfalt. Dies war vor Jahrzehnten insbesondere beim Zeitungs- und Zeitschriftendruck sowie bei Fernseh- und Computerbildschirmen deutlich zu erkennen.

Ähnlich der Dithering-Methode, die in frühen Computern verwendet wurde, um das Problem der unzureichenden Anzahl von Bits zur Darstellung numerischer Werte zu lösen, können wir, genau wie ein Maler eine Palette verwendet, mehrere vorhandene Farben verwenden, um nicht vorhandene Farben zu mischen. Da das menschliche Sehvermögen nicht besonders gut ist, können wir winzige Pixel, die sehr nahe beieinander liegen, oder Pixel, die sich zu unterschiedlichen Zeitpunkten schnell verändern, zur virtuellen Farbanpassung miteinander kombinieren .

Dank der technologischen Entwicklung können die gängigsten Handy-Displays heute eine große Farbpalette direkt unterstützen, und es besteht keine Notwendigkeit, neue Farben aus dem Nichts zu erschaffen. Viele professionelle Anzeigegeräte, die in bestimmten Szenarien in Laboren verwendet werden, sind jedoch aufgrund von Leistungseinschränkungen immer noch stark auf verwandte Technologien angewiesen, wie etwa Flüssigkristall-Raumlichtmodulatoren und digitale Mikrospiegelgeräte für holografische dreidimensionale Anzeigen [3][4][5].

Wenn es um die Farbwahrnehmung geht, gibt es im menschlichen Sehvermögen noch viele weitere unglaubliche und wunderbare Phänomene. Wenn Sie beispielsweise das Bild unten zum ersten Mal betrachten, denken Sie, es sei ein Farbfoto?

Optische Täuschung mit Farbassimilationsraster. Bildquelle: stuarthumphryes (Twitter)

Die Wahrheit ist, dass die meisten Pixel in diesem Bild Graustufen sind und es unmöglich ist, zwischen den Farben zu unterscheiden . Nur die Pixel in den Gitterlinien, die über das Graustufenfoto gelegt sind, werden eingefärbt.

Natürlich werden die Farben dieser Pixel nicht zufällig festgelegt, sondern sind im Vergleich zu den ursprünglichen korrekten Farben der entsprechenden Pixel im Foto übersättigt. Es lässt sich einfach daran erkennen, dass die Farben der Pixel im Raster viel heller als normal sind und eine hohe Sättigung aufweisen. Im Vergleich dazu haben die Graustufenpixel im Hintergrund überhaupt keine Farbe und eine Sättigung von 0. Durch die Verschmelzung der beiden „extremen“ Pixel erscheint das gesamte Foto im menschlichen Auge farblich normal.

Dieser Effekt ist als Farbassimilationsgitter-Illusion bekannt [6]. Natürlich können wir das Gitter verdichten, bis hinunter zur Skala einzelner Pixel, wodurch die Tatsache, dass die meisten Pixel im „Falschfarben“-Foto Graustufen sind, noch schwieriger zu erkennen ist.

Kommen wir abschließend noch einmal auf die rote Coca-Cola-Dose vom Anfang des Artikels zurück. Dies ist eine weitere Fehleinschätzung der Farbe durch das menschliche Auge. Das Erdbeerbild unten hat eine ähnliche Wirkung.

Um diesen Bildeffekt zu erzeugen, sind folgende Schritte erforderlich:

Zerlegen Sie die ursprünglichen normalen Farbfotos in viele kleine Punkte oder feine Linien. Nehmen wir beispielsweise Zeilen, diese werden in zwei verschachtelte Gruppen unterteilt. In einer Gruppe wird der Rotanteil der Linienpixel auf 0 gesetzt, so dass die ursprünglich roten Anteile dieser Linien schwarz bzw. die ursprünglich nicht roten Anteile cyan erscheinen. In der anderen Gruppe bleibt die Rotkomponente unverändert, die Intensitätswerte der Grün- und Blaukomponenten werden jedoch auf das Maximum eingestellt (Übersättigung), und diese Linien erscheinen weiß. Beide Arten von Zeilensprungverfahren entsprechen einer Erhöhung der Intensität von Grün und Blau und einer Verringerung der Intensität von Rot, was dem Betrachten des Originalfotos durch einen Filter entspricht, der rotes Licht entfernt. Das gesamte Bild scheint mit einem cyanfarbenen Schleier bedeckt zu sein.

In diesem Fall erscheinen sogar Objekte schwarz, die eigentlich rot sind. Umgekehrt neigen das menschliche Auge und das Gehirn bei Objekten, die oberflächlich schwarz erscheinen, instinktiv dazu, sie wieder rot zu färben. Auf diese Weise werden Cola-Dosen und Erdbeeren „rot gefärbt“. Dies wird als Farbkonstanz-Illusion bezeichnet [7].

Original-Farbbild Light Science Center/VEER

Die Illusion von Rot wird durch zwei Sätze versetzter Linien erzeugt (die rechte Seite ist eine Vergrößerung der Linien: Wo ist das Rot?)

Bildquelle: Light Science Center/VEER

Die Illusion von Rot wird durch zwei Sätze versetzter Quadrate erzeugt (rechts sehen Sie eine vergrößerte Version des Rasters: Wo ist das Rot?)

Bildquelle: Light Science Center/VEER

Die oben genannten „Schwindel“ reichen aus, um zu beweisen, dass das menschliche Sehvermögen zu bestimmten Zeiten extrem schwach darin ist, Farben zu unterscheiden. Im Folgenden finden Sie jedoch ein noch ungeheuerlicheres Beispiel[8].

Wir spüren instinktiv, dass die Farben der oberen und unteren Objekte deutlich unterschiedlich sind: Das eine ist dunkelgrau und das andere weiß. Wenn Sie jedoch mit einem Finger die Grenze zwischen den beiden Objekten überstreichen, werden Sie feststellen, dass die Farben der beiden Objekte genau gleich sind! Dieses Ergebnis wird Sie definitiv in den Wahnsinn treiben.

Abbildung 11: Ein Bild, das Ihre Fähigkeit zur Beurteilung der Farbtiefe untergräbt

Bildquelle: American Scientist.org

Trauen Sie Ihren eigenen Augen noch, nachdem Sie diesen Artikel gelesen haben?

Sie machen oft alle möglichen unerklärlichen Fehler, und jedes Mal, wenn sie einen Fehler machen, korrigieren sie ihn und machen ihn erneut. Es ist jedoch genau diese Art der gut gemeinten Täuschung, die Sie dazu verleitet, „die Lücken“ mit Farben zu füllen, die in realen Objekten nicht vorkommen, wodurch die Welt, die Sie wahrnehmen, bunter wird.

Autor: Jiao Shuming (Pengcheng-Labor)

Rezension|Cao Liangcai (Tsinghua-Universität)

Quellen:

[1] RW Floyd, L. Steinberg, Ein adaptiver Algorithmus für räumliche Graustufen. Verfahren der Gesellschaft für Informationsanzeige 17, 75–77 (1976).

[2] Ken C. Pohlmann (2005). Prinzipien des digitalen Audios. McGraw-Hill-Profi.

[3] S. Jiao, D. Zhang, C. Zhang, Y. Gao, T. Lei und X. Yuan, "Komplexe Amplituden-Holographische Projektion mit einem digitalen Mikrospiegelgerät (DMD) und einem Fehlerdiffusionsalgorithmus", IEEE Journal of Selected Topics in Quantum Electronics, 26(5), 2800108 (2020)

[4] X. Yang, S. Jiao, Q. Song, G.-B. Ma und W. Cai, „Phase-only color rainbow holographic near-eye display“, Optics Letters 46(21), 5445-5448 (2021)

[5] K. Liu, Z. He und L. Cao, „Musteradaptiver Fehlerdiffusionsalgorithmus zur verbesserten Erzeugung von Phasenhologrammen“, Chinese Optics Letters 19(5), 050501 (2021).

[6] S. Jiao und J. Feng, „Bild-Steganographie mit visueller Illusion“, Opt. Express 29(10), 14282-14292 (2021)

[7]https://www.wired.com/story/remember-the-dress-heres-why-we-all-see-colors-differently/

[8] Purves D, Lotto RB, Nundy S. Warum wir sehen, was wir tun: Eine auf Erfahrungen aus der Vergangenheit basierende Wahrscheinlichkeitsstrategie erklärt den bemerkenswerten Unterschied zwischen dem, was wir sehen, und der physischen Realität. Amerikanischer Wissenschaftler. 1. Mai 2002;90(3):236-43.

Quelle: Light Science Forum

Das Titelbild dieses Artikels wurde bereitgestellt von Light Science and Technology

<<:  Es stellt sich heraus, dass es stimmt, dass Physiker jeden Freitag chinesisches Essen essen! Sheldon hat mich nie angelogen

>>:  Gute Nachrichten: Im Süden sterben die Mücken an der Hitze; schlechte Nachrichten: Sie ziehen nach Norden

Artikel empfehlen

Der mächtigste Raubvogel stellt sich als großer Glatzkopf heraus?

Um 3500 v. Chr. wanderten zahlreiche Menschen aus...

Warum tut mein Hintern weh, wenn ich laufe?

Mit der Entwicklung der Gesellschaft achten immer...

So trainieren Sie Ihre Bauchmuskeln

Die Frage, die sich die meisten Fitness-Fan gegen...

Welche Vorteile bietet Yoga?

Die meisten Menschen haben im Laufe ihres Lebens ...

Null Gewinn auf Hardware: Personalisierte Mobiltelefone starten in eine neue Ära

Ob Betreiber nun von „Null-Yuan-Käufen“ sprechen ...

Für wen ist Yoga nicht geeignet?

Sport ist für die Aufrechterhaltung vieler Körper...

Sie lieben kandierte Hagebutten mehr als Nektar. Sind diese Bienen dumm?

Autor: Shi Jun Gutachter: Yao Jun (Associate Rese...

Welche Yoga-Methoden gibt es zum schnellen Abnehmen?

Die heutige Gesellschaft ist sehr stressig und de...

Welche Kurzhantelbank-Trainingsmethoden gibt es?

Das Sprichwort „Das Leben liegt in der Bewegung“ ...

Was bedeutet es für WeChat, 11 Schnittstellen zu öffnen?

WeChat hat 11 JS-SDK-Schnittstellen geöffnet, dar...