Wie bringen wir Maschinen das Lernen bei?

Wie bringen wir Maschinen das Lernen bei?

Im Sommer 2013 erschien im Open-Source-Blog von Google ein unscheinbarer Beitrag mit dem Titel „Die Bedeutung hinter Wörtern verstehen“.

„Computer sind derzeit nicht besonders gut darin, die menschliche Sprache zu verstehen, und obwohl wir von diesem Ziel noch weit entfernt sind, machen wir mit den neuesten Techniken des maschinellen Lernens und der natürlichen Sprachverarbeitung erhebliche Fortschritte“, heißt es in dem Beitrag.

Google nutzte eine riesige Menge menschlicher Sprachdaten aus Printmedien und dem Internet – tausendmal größer als der bisher größte Datensatz –, speiste sie in ein biologisch inspiriertes „neuronales Netzwerk“ ein und ließ das System nach Korrelationen und Verbindungen zwischen Wörtern suchen.

Mithilfe des sogenannten „unüberwachten Lernens“ begann das System, Muster zu erkennen. So wird beispielsweise darauf hingewiesen, dass das Wort „Peking“ in derselben Beziehung zu „China“ steht wie „Moskau“ zu „Russland“, unabhängig von der Bedeutung der Wörter. Können wir sagen, dass der Computer „versteht“? Das ist eine Frage, die nur Philosophen beantworten können, aber es ist klar, dass das System einen Teil der Essenz dessen erfasst hat, was es „liest“.

Google nannte das System „word2vec“ – was so viel bedeutet wie „Word-to-Digital Vector“ – und machte es Open Source. Für Mathematiker haben Vektoren alle möglichen wunderbaren Eigenschaften. Sie können sie wie einfache Zahlen bearbeiten, indem Sie sie addieren, subtrahieren und multiplizieren. Auf diese Weise entdeckten die Forscher bald etwas völlig Unerwartetes. Sie nennen es „linguistische Regelmäßigkeiten in kontinuierlichen lexikalischen Darstellungen“ und es zu erklären ist nicht so schwer, wie es klingt. Word2vec wandelt Wörter in Vektoren um, sodass Sie mathematische Operationen mit ihnen durchführen können.

Wenn Sie beispielsweise „China + Flüsse“ eingeben, erhalten Sie den Jangtsekiang. Geben Sie Paris-Frankreich+Italien ein und Sie erhalten Rom.

Geben Sie König-Mann + Frau ein und Sie erhalten die Königin.

Die Ergebnisse sind erstaunlich. Das Word2Vec-System wurde erstmals in der maschinellen Übersetzung und Suchmaschine von Google eingesetzt und fand auch in anderen Bereichen der Branche breite Anwendung, beispielsweise bei der Personalbeschaffung. Es ist zu einem unverzichtbaren Werkzeug für eine neue Generation datenorientierter Linguisten in Wissenschaft und Technik geworden.

Zwei Jahre vergingen und niemand bemerkte, dass es ein Problem gab.

Maschinelles Lernen umfasst im Wesentlichen drei Bereiche: unüberwachtes Lernen , bei dem der Maschine direkt eine Reihe von Daten gegeben werden, wie etwa beim word2vec-System, mit dem Ziel, die Daten zu verstehen und Muster, Regelmäßigkeiten und nützliche Möglichkeiten zu finden, die Daten zu verfeinern, darzustellen oder zu visualisieren; überwachtes Lernen , bei dem dem System eine Reihe klassifizierter oder gekennzeichneter Beispiele zum Lernen vorgelegt werden, etwa ob ein auf Bewährung Entlassener rückfällig wird, und es dann das erlernte Modell verwendet, um Vorhersagen über neue Beispiele zu treffen, die noch nie gesehen wurden oder bei denen die grundlegenden Fakten noch nicht klar sind; bestärkendes Lernen , bei dem das System in eine Umgebung mit Belohnungen und Bestrafungen gebracht wird, beispielsweise eine Ruderbahn, auf der Energie und Gefahr nebeneinander bestehen, mit dem Ziel, den besten Weg zu finden, um die Bestrafung zu minimieren und die Belohnung zu maximieren.

Immer mehr Menschen erkennen, dass die Welt in vielerlei Hinsicht zunehmend von den mathematischen und rechnerischen Modellen abhängig wird, die das Feld des maschinellen Lernens bereitstellt. Diese einfachen und komplexen Modelle – manche sind bloße Tabellenkalkulationen, andere könnte man als KI bezeichnen – ersetzen nach und nach das menschliche Urteilsvermögen und traditionellere, explizit programmierte Programme.

Dies geschieht nicht nur in den Bereichen Technologie und Wirtschaft, sondern auch in Bereichen mit ethischen und moralischen Implikationen. Das Justizsystem nutzt bei Entscheidungen über Kaution und Bewährung zunehmend Software zur „Risikobewertung“. Immer mehr Fahrzeuge auf der Straße fahren autonom. Unsere Kreditanträge, Lebensläufe und medizinischen Untersuchungen werden zunehmend nicht mehr von Menschen ausgewertet. Zu Beginn des 21. Jahrhunderts arbeiten immer mehr Menschen daran, die Welt autonom fahren zu lassen – im übertragenen und im wörtlichen Sinne.

In den letzten Jahren haben zwei verschiedene Gruppen Alarm geschlagen. Die erste Gruppe konzentriert sich auf aktuelle technologische ethische Risiken . Das ist dann ein Problem, wenn ein Gesichtserkennungssystem bei einer bestimmten ethnischen Gruppe oder einem bestimmten Geschlecht besonders ungenau arbeitet oder wenn jemand auf Grundlage eines ungeprüften statistischen Modells, das niemand im Gerichtssaal – einschließlich Richter, Anwälte und Angeklagter – versteht, ohne Kaution verurteilt wird. Solche Fragen können nicht im Rahmen traditioneller akademischer Disziplinen gelöst werden, sondern nur im Dialog zwischen Informatikern, Soziologen, Juristen, Politikexperten und Ethikern. Das Gespräch hat begonnen.

Eine andere Gruppe ist besorgt über zukünftige Gefahren . Da unsere Systeme zunehmend in der Lage sind, flexible Entscheidungen in Echtzeit zu treffen, besteht diese Gefahr sowohl in der virtuellen als auch in der realen Welt. Ohne Zweifel waren die letzten zehn Jahre die aufregendsten, aber auch plötzlichsten und beunruhigendsten Fortschritte in der KI und im maschinellen Lernen in der Geschichte. Gleichzeitig wird allmählich ein unsichtbares Tabu gebrochen und KI-Forscher scheuen sich nicht mehr, Sicherheitsfragen zu diskutieren. Tatsächlich hat sich dieses Anliegen in diesem Bereich in den letzten fünf Jahren von einer Randerscheinung zu einem Mainstream-Thema entwickelt.

Zwar wird darüber diskutiert, ob kurzfristige oder langfristige Probleme Priorität haben sollten, doch über die großen Ziele sind sich die beiden Gruppen einig. Da Systeme für maschinelles Lernen immer häufiger und leistungsfähiger werden, befinden wir uns immer häufiger in der Situation des Zauberers und seines Lehrlings: Wir rufen eine Macht herbei, geben ihr eine Reihe von Anweisungen, erwarten von ihr, dass sie autonom, aber dennoch vollkommen gehorsam ist, und wenn wir dann erkennen, dass die Anweisungen ungenau oder unvollständig sind, versuchen wir verzweifelt, sie aufzuhalten, damit wir unsere Weisheit nicht dazu nutzen, etwas Schreckliches heraufzubeschwören.

Wie sich solche katastrophalen Divergenzen verhindern lassen – wie man sicherstellt, dass diese Modelle unsere Normen und Werte erfassen, unsere Bedeutungen oder Absichten verstehen und – was am wichtigsten ist – sich so verhalten, wie wir es uns wünschen – ist zu einem der zentralsten und dringendsten Probleme der Informatik geworden. Dieses Problem wird als Ausrichtungsproblem bezeichnet.

Während die Forschung immer näher an die Entwicklung einer sogenannten „allgemeinen“ Intelligenz heranrückt und maschinelle Lernsysteme in der realen Welt immer stärker in die moralische und ethische Sphäre des Privat- und Massenlebens eindringen, gab es auf diese Warnung eine plötzliche und energische Reaktion. Eine vielfältige Gruppe überschreitet traditionelle Disziplingrenzen. Gemeinnützige Organisationen, Think Tanks und Forschungsinstitute haben sich aktiv beteiligt. Immer mehr führende Vertreter aus Industrie und Wissenschaft äußern sich und erhöhen entsprechend die Forschungsgelder. Die erste Generation von Doktoranden mit Spezialisierung auf Ethik und Sicherheit des maschinellen Lernens hat sich eingeschrieben. Die Ersthelfer zur Behebung des Ausrichtungsproblems sind vor Ort eingetroffen.

Maschinelles Lernen ist vordergründig ein technisches Problem, doch es geht zunehmend auch um menschliche Probleme.

Menschliche, soziale und öffentliche Probleme werden technologisch. Technologische Herausforderungen werden menschlich, sozial und öffentlich. Es zeigt sich, dass unsere Erfolge und Misserfolge dabei, diese Systeme dazu zu bringen, „sich so zu verhalten, wie wir es wollen“, für uns ein echter und aufschlussreicher Spiegel sind, in dem wir uns selbst prüfen können.

Ob gut oder schlecht, die Geschichte der Menschheit wird im nächsten Jahrhundert wahrscheinlich von der Entwicklung und Einführung einer großen Vielfalt intelligenter Systeme geprägt sein. Wie der Zauberlehrling könnten wir feststellen, dass wir nur einer von vielen Agenten in einer Welt voller Besen sind.

Wie genau sollen wir sie unterrichten? Was soll ich lehren?

<<:  Ja! Auch Tiere träumen und haben ein Bewusstsein

>>:  Wie entwickelt sich Indiens Weltraumforschung nach der erfolgreichen Mondlandung und der Erforschung der Sonne?

Artikel empfehlen

Wann ist die beste Zeit zum Seilspringen?

Seilspringen ist eine sehr effektive Methode zum ...

Paar-Yoga, lassen Sie Ihrer Leidenschaft am Valentinstag freien Lauf

Der Grund für die Beliebtheit von Paar-Yoga liegt...

Nationale Tofu-Geographie

Geschrieben von Wei Shuihua Headerbild | Pixabay ...

Wie effektiv ist Kampfboxen zum Abnehmen?

Derzeit sind es vor allem junge Büroangestellte i...

So aufregend! Im Wasser spielen und dabei „wachsen“

Heutzutage gibt es immer mehr Methoden zur Brustv...