Roboter sind hervorragende Nachahmer des Menschen, die meisten von ihnen kommen jedoch nicht ohne menschliche Hilfe aus, beispielsweise durch eine voreingestellte Programmierung. Insbesondere Haushaltsroboter werden Schwierigkeiten haben, die täglichen Bedürfnisse menschlicher Familien zu erfüllen, wenn ihnen bei komplexen Hausarbeiten der gesunde Menschenverstand fehlt. Heute schon können Haushaltsroboter, angetrieben von großen Sprachmodellen (LLMs), „gesunden Menschenverstand“ erwerben, sich ohne menschliche Hilfe selbst korrigieren und komplexe Haushaltsarbeiten hervorragend erledigen . Das zugehörige Forschungspapier mit dem Titel „Grounding Language Plans in Demonstrations Through Counterfactual Perturbations“ wurde als Konferenzpapier auf der führenden Konferenz für künstliche Intelligenz (KI) ICLR 2024 veröffentlicht. Yanwei Wang, ein Ph.D. Student der Fakultät für Elektrotechnik und Informatik am Massachusetts Institute of Technology (MIT), ist der korrespondierende Autor der Forschungsarbeit. Er sagte, dass Imitationslernen der gängige Ansatz zur Realisierung von Haushaltsrobotern sei. Wenn der Roboter jedoch blind die Bewegungsbahn eines Menschen nachahmt, häufen sich immer mehr kleine Fehler an, die schließlich zu weiteren Fehlern im Ausführungsprozess führen. „ Mit unserem Ansatz kann der Roboter Ausführungsfehler selbst korrigieren und die Gesamterfolgsrate der Mission verbessern. “ Lassen Sie Roboter einige Hausarbeiten erledigen Vom Aufwischen verschütteter Flüssigkeiten bis zum Servieren von Essen lernen Roboter, immer komplexere Hausarbeiten zu erledigen. Tatsächlich lernen viele Haushaltsroboter, indem sie menschliches Verhalten nachahmen. Sie sind darauf programmiert, die Bewegungen nachzuahmen, die Menschen ihnen anweisen. Da es den Robotern der Vergangenheit jedoch an gesundem Menschenverstand mangelt, wissen sie nicht unbedingt, wie sie mit diesen Situationen umgehen sollen, es sei denn, menschliche Ingenieure programmieren sie so, dass sie sich an jeden möglichen Stoß und Anstoß anpassen, und sie müssen ihre Mission von vorne beginnen . Vielleicht könnten Roboter durch die Einbeziehung einiger „gesunder Menschenverstandkenntnisse“ auf Situationen vorbereitet werden, die sie von ihrem Trainingspfad abbringen. Laut der Arbeit haben Yanwei et al. überprüften die Wirksamkeit der von ihnen vorgeschlagenen Methode anhand einer einfachen täglichen Aufgabe. Die Aufgabe scheint recht einfach: Murmeln aus einer Schüssel schöpfen und in eine andere schütten. Um Robotern die Ausführung dieser Aufgabe zu ermöglichen, ließen Ingenieure bei früheren Methoden den Roboter jedoch häufig die Aktionen „Schöpfen“ und „Gießen“ auf einer Flüssigkeitsbahn ausführen und wiederholten diese möglicherweise viele Male, sodass der Roboter einige menschliche Demonstrationsaktionen nachahmen konnte. Das Problem besteht darin, dass ein Mensch zwar in der Lage sein könnte, eine Aufgabe in einem Durchgang zu demonstrieren, diese Aufgabe jedoch von einer Reihe von Unteraufgaben oder Trajektorien abhängt. Beispielsweise muss der Roboter in die Schüssel greifen, bevor er Wasser schöpfen kann, und er muss Murmeln aufheben, bevor er zur leeren Schüssel gehen kann. Wenn der Roboter bei einer dieser Teilaufgaben durcheinander gerät oder einen Fehler macht, besteht seine einzige Möglichkeit darin, anzuhalten und von vorne zu beginnen. Sofern ein menschlicher Ingenieur nicht jede Teilaufgabe explizit benennt und den Roboter programmiert oder neue Demonstrationen sammelt, kann der Roboter solche Fehler im Bruchteil einer Sekunde beheben und sich selbst korrigieren. „Dieser Planungsumfang ist sehr mühsam“, sagte Yanwei. In dieser Studie verknüpften Yanwei und sein Team die Bewegungsdaten des Roboters mit dem „gesunden Menschenverstand“ eines großen Sprachmodells. Sie ermöglichten es dem Roboter, viele gegebene Haushaltsaufgaben logisch in Unteraufgaben zu zerlegen und sich auf Ablenkungen innerhalb der Unteraufgaben einzustellen. Auf dieser Grundlage kann der Roboter seine Vorwärtsbewegung fortsetzen, ohne dass er zurückgehen und die Aufgabe von vorne beginnen muss. Und was wichtig ist: Menschliche Ingenieure müssen nicht für jeden möglichen Fehler detaillierte Fehlerbehebungen schreiben. Es wird berichtet, dass diese Deep-Learning-Modelle große Textbibliotheken verarbeiten und Verbindungen zwischen Wörtern, Sätzen und Absätzen herstellen können. Durch diese Verbindungen kann ein großes Sprachmodell neue Sätze generieren, basierend auf dem, was es über die Wortarten gelernt hat, die wahrscheinlich auf das vorherige Wort folgen. Darüber hinaus können große Sprachmodelle neben Sätzen und Absätzen auch eine logische Liste von Unteraufgaben generieren, die anhand von Eingabeaufforderungen an einer bestimmten Aufgabe beteiligt sind. Wenn das Modell beispielsweise aufgefordert wird, die Aktionen zum Schaufeln von Murmeln von einer Schüssel in eine andere aufzulisten, könnte es eine Liste mit Verben wie „erreichen“, „schaufeln“, „tragen“ und „gießen“ erstellen. „Ein umfangreiches Sprachmodell kann dem Roboter mithilfe natürlicher Sprache erklären, wie er jeden Schritt einer Aufgabe erledigen soll. Die kontinuierliche Demonstration des Menschen verkörpert diese Schritte im physischen Raum“, sagte Yanwei. „Wir möchten beides miteinander verbinden, sodass der Roboter automatisch erkennt, in welcher Phase der Aufgabe er sich befindet, und selbstständig neu planen und wiederherstellen kann. “ Yanwei sagt, dass ihr Algorithmus nun von einem Teleoperationssystem erfasste Daten in robustes Roboterverhalten übersetzen kann, sodass der Roboter trotz externer Störungen komplexe Aufgaben erledigen kann. Mängel und Perspektiven Dieser Ansatz ermöglicht es Robotern zwar, sich selbst zu korrigieren und komplexe Haushaltsaufgaben ohne menschliche Hilfe auszuführen, er ist jedoch auch mit gewissen Einschränkungen verbunden . Ihr Ansatz erfordert beispielsweise zwar keine große Zahl menschlicher Demonstrationen, erfordert jedoch umfangreiches Ausprobieren und zurücksetzbare Umgebungen, um Aufgabenerfolgsbezeichnungen für Trajektorien zu sammeln. Das Forschungsteam sagte jedoch, dass dieses Problem der Datenineffizienz durch aktives Lernen gelöst werden könne. Darüber hinaus erfordert es auch einige Fähigkeiten, große Sprachmodelle zu zwingen, geeignete Zustandsdarstellungen für Lernklassifikatoren zu finden. In zukünftigen Arbeiten hoffen sie, Musterklassifizierer zu kombinieren, um Zustandsdarstellungen durchgängig zu erlernen. Referenzlinks: https://sites.google.com/view/grounding-plans https://news.mit.edu/2024/engineering-household-robots-have-little-common-sense-0325 https://openreview.net/forum?id=qoHeuRAcSl https://techcrunch.com/2024/03/25/large-lingual-models-can-help-home-robots-recover-from-errors-without-human-help/ https://www.youtube.com/watch?v=uerMlHmgPfI https://yanweiw.github.io/ |
<<: Wie wurde Qingtuan als beliebtester Snack während des Qingming-Festes so „grün“?
>>: Wie sieht ein U-Bahn-Tunnel aus? Warum sind die meisten rund?
Viele unserer Freunde laufen und jeder versteht d...
Nach körperlicher Betätigung kann unser Körper du...
Viele Menschen wärmen sich vor dem Training nicht...
Optisch ist das HTC M8 sehr hochwertig und stimmun...
Wenn Sie unbedingt trainieren möchten, aber nicht...
Treppensteigen ist eine sehr gute Übung zum Abneh...
Eine Erhöhung der COVID-19-Impfrate bei älteren M...
Am 4. Dezember landete die Rückkehrkapsel des bem...
Fünf Mathematiker haben nicht nur ein schwieriges...
Was passiert mit Menschen, die über längere Zeit ...
Lachen ist ein weit verbreitetes Verhalten in der...
Autor: Wang Guanqun, Pan Haochen, Fang Xiang, Liu...
Dieser Artikel wurde übertragen von: Channel Help...
Die Astronautenbesatzung von Shenzhou 15 nutzte v...