Wie viel wissen Sie über Gesichtserkennung?

Wie viel wissen Sie über Gesichtserkennung?

Mit der rasanten Entwicklung der künstlichen Intelligenztechnologie ist die Gesichtserkennung in den letzten Jahren in den Alltag der Menschen integriert worden und hat ihre Lebensgewohnheiten still und leise verändert, beispielsweise beim Bezahlen per Gesichtswisch, beim Einschalten des Telefons oder beim Vorbeigehen per Gesichtswisch. Wie erkennt die Maschine also, dass es sich um einen Menschen handelt? Wie erkennt man, wem es gehört? Lassen Sie uns als Nächstes gemeinsam das Geheimnis hinter dieser „schwarzen Technologie“ erkunden und lüften.

Überblick über die Gesichtserkennungstechnologie

Die Gesichtserkennungstechnologie ist eine Art biometrischer Erkennungstechnologie. Es handelt sich um eine Technologie, die eine Person automatisch anhand bestimmter Gesichtsmerkmale (wie Augen, Nase, Mund, Augenbrauen usw.) identifiziert. Es wird auch Gesichtserkennung, Porträterkennung, Erscheinungserkennung, Gesichtserkennung usw. genannt. Dabei werden hauptsächlich Kameras oder Camcorder verwendet, um Bilder oder Videostreams mit Gesichtern zu erfassen, und mithilfe der Gesichtserkennungstechnologie wird analysiert, ob ein Gesicht vorhanden ist. Wenn ja, liefert es Informationen über die Lage und Größe des Gesichts sowie die Position wichtiger Gesichtsorgane. Anschließend extrahiert es die in diesen Informationen enthaltenen Identitätsmerkmale und vergleicht sie mit bekannten Gesichtsmerkmalen, um die Identität jedes Gesichts zu ermitteln.

Gesichtserkennung

Die Gesichtserkennung ist der erste wichtige Schritt in Gesichtserkennungs- und Gesichtsanalysesystemen. Es wird hauptsächlich verwendet, um das Problem „Wo ist das Gesicht“ zu lösen, die Position und Größe des Gesichts im Bild genau zu kalibrieren und es für die anschließende Analyse und Erkennung von Gesichtsmerkmalen bereitzustellen. Die frühen Arbeiten zur Gesichtserkennung basierten hauptsächlich auf der Merkmalsextraktion auf Basis manuell entworfener lokaler Deskriptoren, die sich im Wesentlichen in vier Kategorien unterteilen lassen: wissensbasierte Gesichtserkennungsmethoden, modellbasierte Gesichtserkennungsmethoden, merkmalsbasierte Gesichtserkennungsmethoden und auf dem Erscheinungsbild basierende Gesichtserkennungsmethoden. Zu den klassischeren Arbeiten zählen unter anderem der Haar-Kaskaden-Klassifikator und der HOG-Merkmalserkennungsalgorithmus (Histogram of Oriented Gridients). Bei der Gesichtserkennung anspruchsvoller Bilder mit mehreren Variationsfaktoren ist die Genauigkeit herkömmlicher Erkennungsmethoden jedoch begrenzt.

Abbildung WIDER FACE: Ein Benchmark zur Gesichtserkennung

Mit der rasanten Entwicklung des Deep Learning haben sich nach und nach viele Methoden zur Gesichtserkennung entwickelt, die auf unterschiedlichen Deep-Learning-Architekturen basieren. Dazu gehören vor allem das Kaskaden-CNN-Modell, das R-CNN-Modell, das Single-Shot-Detektormodell, das Feature-Pyramidennetzwerkmodell, das Transformer-Modell usw., die die herkömmliche Gesichtserkennung und -erkennung hinsichtlich Merkmalsextraktion, Genauigkeit und Skalierbarkeit erheblich verbessert haben. MTCNN ist eines der besseren Modelle zur Gesichtserkennung. Dieses Modell sagt die Positionen von Gesichtern und Orientierungspunkten grob bis fein über ein dreistufiges tiefes Faltungsnetzwerk voraus. Die konkreten Schritte sind wie folgt: Phase 1: Schnelles Generieren von Kandidatenfenstern durch ein flaches CNN; Stufe 2: Verfeinern Sie die Fenster, indem Sie eine große Anzahl von Nicht-Gesichtsfenstern durch ein komplexeres CNN ablehnen. Stufe 3: Verwenden Sie ein leistungsfähigeres CNN, um die Ergebnisse erneut zu verfeinern und fünf Gesichtsmarkierungspositionen auszugeben.

Gesichtszüge

Gesichtsmerkmale, auch Gesichtsdarstellungen genannt, sind bestimmte Merkmale des Gesichts, wie Gesichtslänge, Gesichtsbreite, Lippenbreite, Nasenlänge usw. Bei der Extraktion von Gesichtsmerkmalen werden die Merkmale des Gesichts modelliert, um vektorisierte Gesichtsmerkmale zu erhalten. Die Extraktion von Gesichtsmerkmalen kann entsprechend ihrer technischen Merkmale grob in drei Kategorien unterteilt werden: ganzheitliche Methode basierend auf globalen Informationen, lokale Merkmalsmethode basierend auf lokalen Informationen und Methode basierend auf Deep Learning. Auf Deep Learning basierende Gesichtsmerkmale können automatisch Merkmale aus dem Datensatz erlernen. Wenn der Datensatz genügend robuste Daten (wie Beleuchtung, Haltung, Ausdruck usw.) abdecken kann, kann sich der Algorithmus an verschiedene Herausforderungen anpassen. Es handelt sich derzeit auch um die gängigste Methode zur Extraktion von Gesichtsmerkmalen.

Gesichtserkennung

Gesichtserkennung ist der Prozess des Gesichtsvergleichs. Die Ähnlichkeit zweier Gesichter wird durch Vergleich der extrahierten Gesichtsmerkmale ermittelt. Die Beurteilungsmethode besteht darin, die euklidische Distanz (L2-Distanz) oder die Kosinusdistanz (Kosinusdistanz) zwischen den beiden Merkmalen zu vergleichen: Je kleiner die L2-Distanz, desto höher die Ähnlichkeit; Je kleiner der Kosinusdistanzwinkel, je größer die Kosinusdistanz, desto höher die Ähnlichkeit. Abhängig von der Anzahl der Ausrichtungen kann in 1:1 und 1:N unterteilt werden. Das häufigste 1:1-Szenario ist die Zuordnung von Person und Dokument, wie beispielsweise bei der Ausrüstung, die wir bei der Fahrt mit dem Hochgeschwindigkeitszug vorfinden. 1:N bedeutet, 1 Gesicht mit N Gesichtern in der Datenbank zu vergleichen. Beispielsweise enthält unsere Gesichtsdatenbank im Anwesenheitsgerät alle Gesichtsfotos des gesamten Unternehmens.

Autor: Jin Jianchao

Einheit: China Mobile Smart Home Operation Center

<<:  500.000 Babys für andere großzuziehen und sie dann zurückgeben zu müssen, was soll das?

>>:  Der Start des Starships scheiterte, doch die nächste Ära der Raumfahrt steht bevor

Artikel empfehlen

Warum schaltet sich das iPhone 6s abnormal ab? Apple weiß es immer noch nicht

Nachdem sich das iPhone 6s häufig automatisch abs...

Kennen Sie den wahren Grund, warum die Leistung von Lithiumbatterien nachlässt?

Lithium-Ionen-Akkus werden heute häufig in Mobilg...

Was ist Muskelabbau bei intensiver körperlicher Betätigung?

Bewegung ist eine gute Sache, und es wird empfohl...

Sago ist kein Reis, sondern „Kokosnuss“!

Wie könnten wir bei dem heißen Wetter die eiskalt...

So funktioniert die Fünf-Schritte-Aerobic

Immer mehr Menschen spüren den zunehmenden Druck ...

Was sind die Aufwärmübungen für Yoga?

Yoga ist eine relativ verbreitete Sportart. Sie k...

Warum heißt Bluetooth „Blue“? Kann man ihn nicht einfach White Fang nennen?

Für modebewusste und technikbegeisterte Jugendlic...

Kann sanftes Hula-Hoop-Reifen beim Abnehmen helfen?

Beim Abnehmen können wir Hula-Hoop-Reifen verwend...

Was tun, wenn das Knie beim Training schmerzt?

Heutzutage sind immer mehr Menschen sportbegeiste...