„Ich werde das Schiebedach öffnen und mir auf dem Weg nach Quyuan Fenghe die alten Lieder von Jay Chou anhören.“ Wenn Sie dies einer Person sagen, wird sie Ihre drei Absichten leicht verstehen: Erstens, gehen Sie nach Quyuan Fenghe; zweitens, öffnen Sie das Oberlicht; drei, hören Sie sich die alten Lieder von Jay Chou an. Aber wenn wir Menschen durch Maschinen wie Autos ersetzen, werden die Autos dann in der Lage sein, dies zu verstehen und entsprechendes betriebliches Feedback zu geben? Wie wir alle wissen, ist die Sprachkommunikation aufgrund ihrer bequemen und sicheren Bedienung natürlich eine der geeignetsten Möglichkeiten der Interaktion im Auto. Es ist in der Branche fast zum Standard für Fahrzeuglösungen geworden, obwohl es bei den Sprachlösungen, die die verschiedenen Unternehmen derzeit anbieten, große Unterschiede gibt. Beispielsweise ist das eingangs erwähnte semantische Verständnis-Multitasking in der Branche noch eine relativ neue Technologieanwendung. Nur wenige Unternehmen haben es bisher implementiert. Die meisten Hersteller konzentrieren sich auf die Verbesserung der Genauigkeit der Spracherkennung und des natürlichen Sprachverständnisses. Chen Hualiang, Leiter der AliOS-Datenintelligenz, gab bekannt, dass sie derzeit die Sprachtechnologie aufrüsten und sich dabei auf die Verbesserung des szenenbasierten intelligenten semantischen Verständnisses (SSLU: Scene-based Spoken Language Understanding) konzentrieren. Dabei handelt es sich um eine intelligente Verbesserung des Sprachverständnisses auf Grundlage des natürlichen Sprachverständnisses und des szenariobasierten Sprachverständnisses, die auch die Verbesserung der Fähigkeiten zur Aufgabenverarbeitung in mehreren Domänen umfasst. Gängige Dialogsysteme bestehen im Allgemeinen aus mehreren Modulen: Automatische Spracherkennung (ASR), natürliches Sprachverständnis (NLU), Dialogmanagement (DM), natürliche Sprachgenerierung (NLG) und Text-to-Speech (TTS). Es wird berichtet, dass AliOS nun innovative Lösungen zur Datengenerierung und Crowdsourcing-Beschaffung für das Training von Dialogen im Selbstspiel implementiert hat. Dabei wird ein umfassendes Verständnis von Menschen, Autos und Szenarien kombiniert, linguistisches und semantisches Vorwissen sowie Wissen aus Wissensgraphen in das Dialogsystem migriert, durchgängige Deep-Learning-Dialogsystemmodelle trainiert, die Szenarioabdeckung und Dialogflüssigkeit verbessert und es dem System ermöglicht, Sprachbefehle basierend auf Szenarien besser zu verstehen. Am Beispiel des eingangs erwähnten Befehls erkennt AliOS zunächst jedes Wort des Satzes „Ich möchte auf dem Weg nach Quyuan Fenghe das Schiebedach öffnen und mir Jay Chous alte Lieder anhören“ genau und berücksichtigt dann das aktuelle Nutzungsszenario des Benutzers, um die Bedeutung des Satzes zu verstehen und zugehörige Dienste aufzurufen, um komplexe Vorgänge wie die Navigation nach Quyuan Fenghe, das Öffnen des Schiebedachs und das Abspielen von Jay Chous alten Liedern auszuführen. Chen Hualiang sagte: „Gesprochene Sprache ist in der Regel vage und ihre Bedeutung unvollständig. Es reicht nicht aus, sich ausschließlich auf umfangreiche Korpusdaten zu verlassen, um gesprochenen Ausdruck zu verstehen. Wir glauben, dass wir nur mit mehr Informationen wie Personen, Autos und Szenen szenenbasierte intelligente Fähigkeiten zum Verständnis natürlicher Sprache erreichen und den Benutzern ein besseres Spracherlebnis bieten können.“ Er führte aus, dass sich AliOS derzeit auf die Optimierung und Verbesserung der Sprachtechnologie in mehreren hochfrequenten Anwendungsszenarien im Fahrzeug konzentriert, wie etwa Navigation, Musik, Hörbücher und Radio, um eine Suche unter mehreren Bedingungen, Navigations-Multitasking, das Ändern von Einstellungen während der Navigation, Abfragen in mehreren Slots usw. zu ermöglichen. Um einige anschauliche Beispiele zu nennen: „Wie weit ist es von hier zum Zhongshan-Park?“ AliOS kann dies genau so verstehen, als würde nach der Entfernung vom aktuellen Standort zum Zhongshan-Park gefragt. „Vorherige Wegpunkte löschen“, AliOS kann die letzten Wegpunkte präzise löschen; „Spiel mir ein paar Lieder, die zum Anlass passen“, AliOS kann anhand der aktuellen Wetter- und Zeitinformationen passende Lieder abspielen. Darüber hinaus hat AliOS nun eine multimodale Fusion von Sprache, Sehen, Gesten und anderen interaktiven Methoden von der Basis des Systems aus erreicht und ist bestrebt, den Benutzern ein immersives Erlebnis zu bieten. Es wird in verschiedenen Szenarien weit verbreitet sein, beispielsweise für Musik im Auto, Nachrichtensendungen, Hörbücher, Navigation im Auto usw. Als Gewinner des Qingyun-Plans von Toutiao und des Bai+-Plans von Baijiahao, des Baidu-Digitalautors des Jahres 2019, des beliebtesten Autors von Baijiahao im Technologiebereich, des Sogou-Autors für Technologie und Kultur 2019 und des einflussreichsten Schöpfers des Baijiahao-Vierteljahrs 2021 hat er viele Auszeichnungen gewonnen, darunter den Sohu Best Industry Media Person 2013, den dritten Platz beim China New Media Entrepreneurship Competition Beijing 2015, den Guangmang Experience Award 2015, den dritten Platz im Finale des China New Media Entrepreneurship Competition 2015 und den Baidu Dynamic Annual Powerful Celebrity 2018. |
Experte dieses Artikels: Liu Yongjia, stellvertre...
Standbilder von Fans des Dramas „Ning An Ru Meng“...
Yoga ist eine relativ beruhigende Übung, dennoch ...
□ Luo Chaoshu, ein Reporter von Science Populariz...
Taekwondo ist ein Sport, den jeder gut kennt. Tae...
Im heißen Sommer ist Schwimmen eine beliebte Übun...
Heutzutage gibt es immer mehr Übungen zur Gewicht...
Die Schilddrüse, eine schmetterlingsförmige Drüse...
Wie wir alle wissen, ist Badminton ein Wettkampfs...
Kabelfernsehen war einst die größte Form der Heim...
Prüfungsexperte: Wang Guoyi Postdoktorand für Ern...
Am Nachmittag des 8. Januar hielt der Gemeinsame ...
Bei Personen, die generell eine schlechte Körperh...
Eine Minute beim Arzt, die Haltungen verbessern s...
Fahrzeuge mit Wasserstoff-Brennstoffzellen verwen...