Diese KI-Welle sieht umwerfend aus, aber tatsächlich gibt es nur vier mögliche Landerichtungen: Erstens machen Durchbrüche in den Bereichen Sprache und Semantik endlich Sprachinteraktion möglich; zweitens führen Durchbrüche in der Computervision zu Anzeigemethoden wie AR, die realen und virtuellen Raum vermischen; Drittens ermöglichen Durchbrüche in der Computervision eine Verbesserung der Automatisierung, was zu hochautomatisierten Produkten wie selbstfahrenden Autos und Robotern führt. viertens bietet maschinelles Lernen eine neue Möglichkeit zur Datenverarbeitung. Informationen zum grundlegenden Unternehmermodell des letzten Typs finden Sie im vorherigen Artikel: Unternehmerische Inspiration für KI durch zwei Dinge, die Google DeepMind gerade getan hat. Die ersten drei Unternehmensmodelle lassen sich unterteilen in: Produktserien, von weich zu hart und von hart zu weich. Dieser Artikel untersucht die Vor- und Nachteile dieser drei Modelle. Produktserie Die uns bekannten Startups im Bereich künstliche Intelligenz sind im Wesentlichen produktbasiert, wie etwa Mobvoi und Rokid Robotics in China und Jibo, Savioke, Knightscope, Meta usw. im Ausland. Das grundlegende Merkmal dieser Art von Startups besteht darin, dass sie versuchen, technologische Durchbrüche im Bereich der künstlichen Intelligenz zu nutzen, um neue Produkte mit neuartigen Erfahrungen (mit Sprachinteraktion oder AR usw.) zu schaffen und schöne Verkaufskurven zu generieren. Was also ist eine schöne Verkaufskurve? Es wird wahrscheinlich so aussehen: Eine schöne Verkaufskurve bedeutet, dass sich die Verkaufskurve nach der Markteinführung eines neuen Produkts in den nächsten drei Jahren verdoppelt (möglicherweise mehr als zweimal), anstatt nur langsam um 10 % pro Jahr zu steigen. Dies wiederum bedeutet, dass der maßgebliche Zeitraum für diese Startups tatsächlich nur drei Jahre beträgt. Egal, wie viel Sie zuvor getan haben, wenn Sie diese drei Jahre verpassen, kann Ihre ganze harte Arbeit wertlos sein. Wie lange wird es also dauern, bis der Markt aus seiner Frühphase heraus richtig durchstartet? Niemand weiß es. Der Trend lässt sich durch logische Schlussfolgerung beurteilen, der konkrete Startzeitpunkt ist jedoch eigentlich nur eine blinde Vermutung. Es könnte 1 Jahr, 2 Jahre oder sogar 5 oder 10 Jahre sein. Auf diese Weise gibt es nur zwei wichtige Punkte, die alle produktbasierten KI-Unternehmer verstehen müssen: 1. Treffen Sie während einer Aufwärmphase, deren Länge nicht klar vorhergesagt werden kann, angemessene Vorbereitungen, einschließlich Produkte, Vertriebskanäle, Produktions- und Fertigungskapazitäten usw. 2. Sobald der Markt startet, wird er die oben gezeigte Verkaufskurve erzeugen. Wenn der erste Punkt nicht gut umgesetzt wird, wird es wie bei Luo Yonghao und seiner Smartisan-Technologie sein. Wenn der zweite Punkt nicht gut umgesetzt wird, wird es tatsächlich wie bei einigen großen Unternehmen wie Motorola sein, die alles haben, aber einfach nichts auf die Reihe kriegen. Werden beide Punkte erreicht, handelt es sich definitiv um ein neues Unicorn-Unternehmen. Es muss hier betont werden, dass es beim Erreichen der beiden oben genannten Ziele eher auf das Produkterlebnis als auf den technologischen Fortschritt ankommt. Mit anderen Worten: Dieses Modell erfordert Menschen wie Steve Jobs, die Technologie gut nutzen können, und nicht Menschen wie Sergey Brin, die Technologie entwickeln können. Selbst wenn alle Technologien anderen gehören, spielt es eigentlich keine große Rolle, solange es die Benutzererfahrung nicht beeinträchtigt. Da diese Generation von KI-Unternehmern jedoch sehr intelligent und ehrgeizig ist, möchten sie keine reinen Montageunternehmen werden. Daher versuchen diese Startups in der Regel, sich in der Anfangsphase auf bestimmte Schlüsseltechnologiepunkte wie ASR zu konzentrieren. Das extremste unter ihnen ist Mobvoi. Verschiedenen Informationen zufolge hat Mobvoi eine eigene ASR, NLU und sogar eine eigene Suche entwickelt. Dies bedeutet, dass produktbasiertes Unternehmertum der Besteigung des Nordhangs des Mount Everest sehr ähnlich ist. Wenn es gelingt, wird es sicherlich ein großes Unterfangen sein, aber der Erfolg ist äußerst schwierig. Das hohe Risiko ergibt sich aus zwei Aspekten: 1. Die Länge der Aufwärmphase ist höchst unvorhersehbar. Wenn wir von der KI einmal absehen, ist DJI eines der erfolgreicheren inländischen Unternehmen, die dieses Modell bisher nutzen. Die Umsätze von DJI begannen etwa im Jahr 2013 in die Höhe zu schnellen (es gibt noch keine offiziellen Daten, nur Vermutungen von Dronelife). Also, in welchem Jahr wurde DJI gegründet? Im Jahr 2006 wartete DJI fast sieben Jahre auf den Durchbruch seines Produkts. 2. Die Kosten steigen erheblich durch den Versuch, wichtige technische Punkte zu blockieren. Wie bereits erwähnt, möchten die neuen Unternehmer in der Regel kein einfaches Montage- und Vertriebsunternehmen werden. Daher werden wir uns bereits im Frühstadium mit mehreren wichtigen technischen Punkten befassen. Dies kommt der Entwicklung des Unternehmens zugute, nachdem das Produkt an Volumen zunimmt. Ohne Kontrolle über diese Punkte könnte das Unternehmen, selbst wenn es erfolgreich wäre, heute zu einer Art PC- oder Mobiltelefonunternehmen werden. Das ist vielleicht nicht falsch. Schließlich hat Amazon auch drei Unternehmen übernommen, um ein eigenes Technologiesystem für die Herstellung von Echo aufzubauen. Dies wird jedoch zweifellos die Kosten und Risiken für Startups deutlich erhöhen und dazu führen, dass das Unternehmen über einen langen Zeitraum keine Einnahmen, aber relativ hohe Ausgaben hat. Von hart bis weich Ob von hart nach weich oder von weich nach hart, es bedeutet, dass das Unternehmen selbst keine Produkte herstellt, sondern Dienstleistungen für Unternehmen erbringt, die Produkte herstellen. Von „hart“ zu „weich“ bedeutet, dass das Unternehmen davon überzeugt ist, dass seine Vorteile am Frontend (z. B. Mikrofon-Array) beginnen und sich bis zum Backend (Cloud) erstrecken müssen. Von „weich“ bis „hart“ bedeutet dies, dass das Unternehmen davon überzeugt ist, dass die Cloud der Kern der Intelligenz ist und das Front-End eine niedrigere Priorität hat. Natürlich kann man sagen, dass es am besten ist, an beiden Enden stark zu sein, aber aufgrund begrenzter Ressourcen und des Hintergrunds der Gründer können Startups normalerweise zunächst nur einen Teil betonen. Diese beiden Modi können jeweils in Sprachinteraktion und Computervision unterteilt werden. Da es jedoch schwierig ist, sie klar zusammen zu erklären, werden wir diese beiden Modi zunächst anhand der Sprachinteraktion als Beispiel erläutern und sie dann allgemein analysieren. Es gibt relativ wenige inländische Startups im Bereich der künstlichen Intelligenz für Sprachinteraktion, die den Weg vom Harten zum Sanften gegangen sind. Das typischste dürfte SoundAI Technology sein (dieses Unternehmen ist eines meiner Portfoliounternehmen, daher bin ich relativ vertraut damit). Die SoundAI-Technologie beginnt mit der grundlegendsten akustischen Anordnung und führt zunächst eine Geräuschunterdrückung, Nachhallbeseitigung, Echokompensation usw. durch und berücksichtigt dann ASR usw., was das Gegenteil des von Unisound und anderen eingeschlagenen Weges ist. Der Vorteil dieses Modells besteht darin, dass es an der Spitze der industriellen Kette stehen kann, einfach zu implementieren ist und den einzigen Weg für Daten darstellt. Daten selbst sind die zentrale Antriebskraft zukünftiger ASR und sogar NLU und verfügen daher über großes Potenzial. Der Nachteil besteht darin, dass kurzfristig Hardware benötigt wird, um Kunden zu gewinnen, und die Produktion der Hardware organisiert werden muss, was viel Startkapital erfordert. Man kann sagen, dass es eigentlich zwei externe Voraussetzungen für den Erfolg eines produktbasierten Startups gibt: Zum einen muss ein Trend kommen, zum anderen muss sich das Produkt am Markt bewähren. Für Unternehmen, die von Hard zu Soft wechseln, gelten zudem zwei externe Anforderungen: Zum einen muss der Trend kommen, zum anderen müssen sie über starke Technologie- und Preisvorteile verfügen. Die Kunden, mit denen 2B-Unternehmen konfrontiert sind, sind normalerweise sehr rational und viele ausgefallene Marketingmethoden sind nicht sehr effektiv. Von weich bis hart Ein typisches Startup, das in der Sprachinteraktion von sanft zu hart übergegangen ist, ist Yunzhisheng. Schon im Namen ist diese Modellwahl und Firmenpositionierung erkennbar. Der Vorteil der Umstellung von Soft auf Hard besteht darin, dass vorhandene ausgereifte Computerplattformen leichter abgedeckt werden können. Beispielsweise benötigen alle Apps ihre eigene Siri, sodass Unternehmen wie Unisound nur technische Barrieren aufbauen und warten müssen, bis Ctrip und Toutiao zu ihnen kommen. Die größte Herausforderung in dieser Richtung besteht darin, direkt mit großen Unternehmen (wie Baidu und iFlytek) zu konkurrieren. Unser Hauptaugenmerk in diesem Artikel liegt auf der Implementierung neuer Hardwareprodukte, daher werden wir auf diesen Punkt nicht näher eingehen. Der Nachteil besteht darin, dass die Implementierung auf neuen Hardwareprodukten (Echo, Autos, Roboter, AR usw.) schwierig ist, da zur Implementierung auf neuen Hardwareprodukten die Array-Schicht in der Mitte hinzugefügt werden muss, da sonst der Effekt sehr schlecht ist. Wenn es nicht umgesetzt werden kann, gehen seine technologischen Vorteile schnell zunichte. Die Genauigkeit der Spracherkennung hängt im Wesentlichen von den Daten ab, aber ohne Hardware wie Arrays lässt sie sich offensichtlich nicht implementieren. Ohne Implementierung gibt es keine Daten und es ist schwierig, positives und negatives Feedback zu Daten, Technologie, Genauigkeit und Szenarien zu erhalten. Außerdem ist es nicht einfach, das Problem der Spracherkennungsgenauigkeit in realen Umgebungen zu lösen. Yunzhisheng und andere haben dies offensichtlich erkannt und expandieren daher auch aktiv in diese Richtung. Derzeit stoßen Softwareunternehmen beim Übergang zur Hardwareherstellung normalerweise auf allgemeine Probleme, beispielsweise auf die Unfähigkeit, mit der Lieferkette zu verhandeln, was dazu führt, dass die Kosten für dasselbe Produkt um mehrere zehn Prozent höher ausfallen. Der Unterschied in den Routen ergibt sich aus dem Verständnis der Computerarchitektur Das obige Beispiel verwendet ein Unternehmen für Sprachsemantik, doch tatsächlich gilt das Gleiche auch für Computer Vision, mit der Ausnahme, dass die Details unterschiedlich sein können. Beispielsweise könnte der Chip von Movidus den Bilderkennungsprozess auf dem Terminal durchführen, ohne dass dieser wie ein Mikrofon-Array selbst eine Bildverarbeitung durchführen muss, und die Ergebnisse anschließend an die Cloud übertragen. Der gemeinsame Nenner dieser Modellauswahl sind das Verständnis und die Annahmen zur Computerarchitektur. Bisher gibt es drei Arten solcher Annahmen und Erkenntnisse: Zum einen muss sichergestellt werden, dass die Erfahrung (Geschwindigkeit usw.) und das Ende immer eine wichtige Rolle spielen, und die Cloud wird verwendet, um das Ende bei der Durchführung von Berechnungen zu unterstützen. Alle von uns verwendeten Hardwareprodukte: Mobiltelefone, Pads usw. folgen grundsätzlich diesem Modell. Einer davon ist, dass die Datenverarbeitung größtenteils in der Cloud erfolgen sollte. Das von Google beworbene ChromeBook ist von diesem Modell und auch die Terminals in Banken waren früher von diesem Modell. Eine davon ist die aufkommende Sensor-, Fog-Computing- und Cloud-Architektur. Dies kann als Erweiterung der ersten Architektur angesehen werden. Wenn beispielsweise alle Geräte in einem Smart Home direkt mit der Cloud verbunden sind, ist der Rechenaufwand zu hoch. Besser wäre es, einen Hub zu Hause zu haben, der das verarbeitet, was zuerst verarbeitet werden kann (zum Beispiel bei Kälte die Klimaanlage einschalten, bei Regen die Fenster schließen und nicht in die Cloud übertragen). Wenn das nicht möglich ist, stellen Sie eine Verbindung zur Cloud her. Die ersten beiden Architekturen verursachen in der Realität häufig PK und führen zu schwerwiegenden Folgen. Hier sind zwei Beispiele: Eine PK fand auf einem PC statt. Damals ging es bei dem Netzwerkcomputer, den Oracle und andere zu entwickeln versuchten, im Wesentlichen darum, alle möglichen Berechnungen auf das Backend zu übertragen und das Frontend in ein Eingabe- und Ausgabegerät zu verwandeln. Dieser Versuch scheiterte offensichtlich kläglich, doch interessant ist, dass mehr als 20 Jahre später, als die PC-Kategorie ausgereift genug war, Chromebooks, die immer noch diesem Weg folgten, eine gewisse Hoffnung auf Erfolg hatten. Eines ist mit Native APP und HTML5 passiert. Damals wollte Facebook HTML5 unbedingt vorantreiben. Zuckerberg wollte mit Web Apps das Monopol von iOS und Android brechen, doch tatsächlich wäre Facebook durch diese Entscheidung beinahe gestorben, da das Unternehmen durch diese Entscheidung beinahe das mobile Internet verpasst hätte. Die darauf folgenden Großübernahmen von Instagram und WhatsApp dürften mit dieser Fehlentscheidung zusammenhängen. Mein persönliches Grundverständnis hierzu ist: Wenn eine neue Kategorie von Hardwareprodukten zum ersten Mal erscheint, muss das Ende zunächst einmal leistungsstark genug sein, um das ultimative Erlebnis zu bieten. Mit der schrittweisen Entwicklung von Anwendungen, Bandbreite usw. kann die Rechenleistung am Ende in die Cloud verlagert werden, da dies Kostenvorteile mit sich bringt. Dies erfordert jedoch einen langen Prozess. Es dauerte mehr als 20 Jahre, bis der PC diese Möglichkeit erkannte. Wenn dies zutrifft, bedeutet dies, dass bei neuen Hardwareprodukten zunächst das Modell „Vom Harten zum Weichen“ und nicht „Vom Weichen zum Harten“ eingeführt wird. AR, autonomes Fahren usw. sowie die oben erwähnte Sprachinteraktion müssen zunächst die Probleme auf dem Terminal lösen, damit das Produkt in Echtzeit schnell und präzise reagieren und die Benutzererfahrung sicherstellen kann, bevor andere Dinge besprochen werden. Wir können dieses Thema auch aus einem anderen Blickwinkel betrachten. Bei neuen Produkten ist es wahrscheinlicher, dass zuerst das iPhone und dann das Android-Telefon auf den Markt kommt, und nicht umgekehrt, weil das iPhone einen stärkeren Einfluss auf die Benutzer hat und eher eine neue Kategorie etablieren kann. Das iPhone kann jedoch nicht mit HTML erstellt werden. Allerdings stellt das Modell von „hart zu weich“ komplexere Anforderungen an die Gründer. Chen Xiaoliang von SoundAI Technology ist beispielsweise in erster Linie Akustikexperte und auch Experte für Spracherkennung. Deshalb hat er sich für diesen Weg entschieden, bei dem er beim Frontend anfängt und es mit dem Backend kombiniert. Der CTO von Yunzhisheng ist ein Informatiker, der sich besser mit Algorithmen und Deep Learning auskennt und daher von Natur aus dazu neigt, Daten, neuronale Netzwerkalgorithmen und eine deutlich gesteigerte Rechenleistung (von Cloud Computing bis HPC) zur Lösung von Problemen zu verwenden. Der Wechsel zu einem fokussierteren Ende erfordert die Überwindung sowohl mentaler als auch technischer Barrieren, was möglicherweise nicht einfach ist. Zusammenfassung Die folgenden zwei Dinge sind ziemlich sicher : 1. Die Welle der KI kommt. 2. Es wird definitiv neue Hardwareprodukte geben. Aus dieser Produktlinie werden daher mit Sicherheit neue Einhörner hervorgehen. Wenn Sie der Meinung sind, dass neue Hardwareprodukte von leistungsstarken Endgeräten unterstützt werden müssen, um ein gutes Erlebnis zu gewährleisten, und dass die grundsätzliche Reihenfolge des Auftretens neuer Kategorien darin besteht, dass zuerst das iPhone und dann Android kommt, dann werden Sie vermutlich zustimmen, dass im Modell von der Hardware zur Software zuerst Einhörner auftauchen werden. (Ich habe mit vielen Leuten über diese Ansichten gesprochen, aber zufälligerweise habe ich erst kürzlich eine attraktive Investorin kennengelernt, die die gleichen Ansichten vertrat wie ich. Man würde nicht sagen, dass ich ihre Ansichten plagiiert hätte …) Es muss betont werden, dass dieser Artikel hauptsächlich die möglichen Zustände unter neuen Hardwareprodukten diskutiert. Die Datenanalyse wird in diesem Artikel nicht behandelt (Datenanalyse ist reines Cloud Computing), und Produkte oder Dienste, die hauptsächlich für vorhandene Plattformen (Mobiltelefone, Pads usw.) bestimmt sind, werden in diesem Artikel ebenfalls nicht behandelt. Als Gewinner des Qingyun-Plans von Toutiao und des Bai+-Plans von Baijiahao, des Baidu-Digitalautors des Jahres 2019, des beliebtesten Autors von Baijiahao im Technologiebereich, des Sogou-Autors für Technologie und Kultur 2019 und des einflussreichsten Schöpfers des Baijiahao-Vierteljahrs 2021 hat er viele Auszeichnungen gewonnen, darunter den Sohu Best Industry Media Person 2013, den dritten Platz beim China New Media Entrepreneurship Competition Beijing 2015, den Guangmang Experience Award 2015, den dritten Platz im Finale des China New Media Entrepreneurship Competition 2015 und den Baidu Dynamic Annual Powerful Celebrity 2018. |
<<: „Stabilisierung der Gesamtsituation“ Infiniti beschleunigt den Lokalisierungsprozess weiter
>>: Michigans Regierung nutzt VW-Entschädigung zur Förderung der ZEV-Entwicklung
Ich hatte vor einiger Zeit eine verheerende Inspe...
Nach Angaben des China Manned Space Engineering O...
„In einem Wespennest stochern“ ist für viele Mens...
Heutzutage legen viele Frauen mehr Wert auf die E...
„Wir hoffen, dass in fünf Jahren die Gewinne aus ...
Am diesjährigen Kindertag wurde KFC durch eine En...
Wenn man durch die mit Stahl und Beton gesäumten ...
In den Nachmittagsnachrichten vom 11. Juli, Pekin...
Vor einigen Tagen habe ich am Ende des Artikels „...
Am Abend des 18. Oktober stand Luo Yonghao, CEO v...
Seit 2012 macht Sohu Video immer größere Fortschr...
Anmerkung des Herausgebers: Am 30. Mai öffnet das...
Die Menschen kennen Marie Curie wegen ihres Manne...
In unserem täglichen Leben sehen wir häufig Turmd...