Geschrieben am Tag der Freilassung von Wen Xin Yi Yan

Geschrieben am Tag der Freilassung von Wen Xin Yi Yan

Ich war kürzlich zufällig auf Geschäftsreise, als zwei sehr wichtige KI-Produkte auf den Markt kamen, und daher kam es mir nicht sehr gelegen, einen Artikel zu schreiben. Gestern habe ich meine Mittagspause genutzt, um einen kurzen Artikel über GPT4 zu schreiben. Unerwarteterweise trat bei dem von mir verwendeten Tencent Subscription Account Assistant ein Fehler auf, das Speichern schlug fehl und der Artikel ging verloren. Lassen Sie mich übrigens über Tencents andere App, Miaojian, beschweren, die viele Fehler aufweist und die kreative Effizienz ernsthaft beeinträchtigt.

Kommen wir nun zurück zum Thema und besprechen wir Wenxin Yiyan, das heute von Baidu veröffentlicht wurde. Ehrlich gesagt war die heutige Pressekonferenz kein Erfolg. Während der Pressekonferenz brach der Aktienkurs von Baidu in Hongkong zeitweise um 10 % ein. Und das Problem, über das ich mich in meinem gestrigen Artikel Sorgen gemacht habe, ist tatsächlich aufgetreten. Es gibt einige Themen, die einer Diskussion wert sind. Schauen wir sie uns an.

Mangelnde Aufrichtigkeit gegenüber Benutzern und Followern

Ich verstehe wirklich nicht, warum Direktor Li, ein Veteran der Internetbranche, so unsicher ist. Es ist verständlich, dass es bei Produkteinführungen zu Übertreibungen kommt, aber haben die Herausgeber jemals daran gedacht, dass das von Benutzern und Anhängern im Bereich der KI angesammelte Wissenssystem in den letzten Monaten erhebliche Fortschritte gemacht hat? Sind Ihre kleinen Tricks eine Beleidigung für jedermanns Erkenntnis? Als Praktiker gibt es mehrere Punkte, die mich sehr verwirren. Zunächst einmal handelt es sich bei dem, was dieses Mal veröffentlicht wurde, möglicherweise nicht um ein multimodales Modell, sondern höchstwahrscheinlich nur um ein LLM (Large Language Model). Der Grund, warum es als multimodal bezeichnet wurde, war der plötzliche Rückschlag von GPT 4, und der Begriff „multimodales Modell“ wurde später hinzugefügt. Beispielsweise sollte das Wesentliche bei der Wiedergabe des Sichuan-Dialekts in der Ergänzung des Textes um ein TTS-Modell liegen und nicht in der Generierung durch die Multimodalität selbst. TTS ist eine sehr ausgereifte Technologie, die vor sechs Jahren entwickelt wurde. Die verschiedenen Töne in der Amap-App, die jeder täglich verwendet, werden per TTS (Text-to-Speech) synthetisiert. Was die spätere KI-Videobearbeitung betrifft, scheint es sich um ein Sprachzusammenfassungsmodell plus ein CLIP-Modell zu handeln. Diese Art von Anwendung ist in vielen Videobearbeitungsprogrammen sehr verbreitet. Interessierte können es herunterladen, installieren und die Funktion zum Erstellen von Videos aus Bildern und Texten ausprobieren. Zweitens handelt es sich um ein Halbfertigprodukt, ja, es ist ein Halbfertigprodukt. Die von allen erhoffte Mehrsprachenunterstützung scheint nicht umgesetzt worden zu sein und auch die Unterstützung von Programmiersprachen wird nicht erwähnt. Obwohl Baidu nie eine Gelegenheit ausgelassen hat, sich zu KI-bezogenen Themen zu äußern und sich sehr deutlich dazu geäußert hat, war es dieses Mal äußerst enttäuschend und blieb weit hinter den Erwartungen aller zurück. Auch hier sind individuelle Benutzertests derzeit nicht möglich. Ich glaube, das ist eine magische Operation. Es ist, als würde man vor die beiden negativen Terme einen riesigen Multiplikator setzen. Sind Sie nicht bereit, einzelnen Benutzern auch nur ein paar Minuten GPU-Zeit zu geben? Wenn Sie sich etwas sicherer fühlen, warum geben Sie es nicht zum Testen an einzelne Benutzer frei? Vielleicht ändert sich ja noch alles? Obwohl Google Mitarbeiter entlässt, können KI-Entwickler Colab weiterhin kostenlos nutzen. Wie konnte Baidu so geizig werden? Schließlich gibt es einen Videobericht, in dem es heißt, dass Direktor Li enthüllt hat, dass der Trainingsprozess des großen Wenxin-Modells mithilfe von Kunlun Core abgeschlossen wurde. Ich habe den Originaltext nicht gehört, aber ich glaube, dieser ist am übertriebensten. Aus jeder Perspektive halte ich dies aus vielen Gründen für unmöglich. Die Entwicklung inländischer KI-Chips ist lobenswert, aber es ist langweilig, dies blind zu tun.

Wo sind all die Produktmanager von Baidu hin?

Ich habe mehrere sehr gute Freunde, die als Produktmanager bei Baidu arbeiten. Ich möchte sie nicht kritisieren. Im Gegenteil, sie sind auch sehr gute Produktmanager für Internet und Cloud Computing. Aber kann Direktor Li es Studierenden mit Produktverständnis ermöglichen, ihre Stärken voll auszuspielen? Sie Entscheidungen treffen lassen? Während des gesamten Veröffentlichungsprozesses haben wir festgestellt, dass die neuen Produkte von Baidu aufgrund von Kapital- und Kommerzialisierungsbeschränkungen Probleme hatten. Auch hier gibt es mehrere Punkte zu besprechen: Der erste ist die Auswahl des Benutzerszenarios. Bei der Demonstration im Video geht es um die Generierung von Unternehmenskopien. Basierend auf den derzeit offenen Funktionen muss dies jedoch möglicherweise noch mit der Monetarisierung des bestehenden Werbegeschäfts von Baidu kombiniert werden, was zu voreilig ist. Daher ist es nicht überraschend, dass die endgültigen offenen Anwendungen für kleine und mittlere Unternehmen und nicht für Einzelbenutzer bestimmt sind. Die Erstellung von Unternehmenstexten scheint keine häufig genutzte Funktion zu sein. Warum entscheiden sich Unternehmensbenutzer, die es häufig verwenden, nicht für GPT4? Zweitens: Wenn so viele Einzelbenutzer darauf achten, warum sollte man es nicht für einzelne Benutzer zum Testen öffnen? Befürchten Sie tatsächlich eine Überlastung des GPU-Clusters? Wenn das stimmt, wäre das nicht ein Schlag ins Gesicht der Investoren, die heute Baidu-Aktien mit tatsächlichen Fähigkeiten verkauft haben? Wer weiß, ob die Aktie morgen um einen bestimmten Betrag steigen wird? Und schließlich: Warum müssen wir das PaddlePaddle-Framework bei der Einführungsveranstaltung bewerben? Wenn Ihr Produkt wirklich in ein oder mehrere Benutzerszenarien vordringt, Sie beispielsweise über ein großes Modell verfügen, das bei KI-Entwicklern gefragt ist, werden diese sich dann ganz natürlich in Ihr PaddlePaddle verlieben? Musst du mit so viel Kraft drücken?

Diese Produkte lassen sich mit einem Wort zusammenfassen: Patchwork. Ich hoffe auch, dass die Produktmanager von Baidu den Mut haben werden, ihren Chefs etwas vorzuwerfen. Können wir Produkte herstellen, die aufrichtiger sind?

Wo ist das Vertrauen der Ingenieure von Baidu geblieben?

Die ehemaligen Baidu-Ingenieure waren gottgleiche Figuren im Internet. In meinem Umfeld gibt es viele solcher technischen Experten und sie sind alle sehr gute Freunde. Aber was sind heute diese Nachfolger? Wo ist Ihr Selbstvertrauen geblieben? Ihr Mangel an Selbstvertrauen wurde von Direktor Li über den Live-Übertragungsraum an alle vor dem Bildschirm übermittelt. Wo ist der arrogante Direktor Li von vor ein paar Jahren geblieben?

Warum orientieren Sie sich an Open AI?

Neben Baidu gibt es in China viele Teams, die ihre eigenen multimodalen Großmodelle veröffentlicht haben, darunter: DAMO Academy, Artificial Intelligence Research Institute, Huawei usw. Darüber hinaus werden diese Großmodelle seit mindestens zwei Jahren veröffentlicht und das Training der Großmodelle sollte einfach sein. Doch warum wandten sich alle dem LLM (Large Language Model) zu, nachdem ChatGPT von OpenAI populär wurde? Sind sie nicht zuversichtlich? Noch ironischer ist jedoch, dass wir, als GPT4 die Multimodalität ankündigte, eine Kehrtwende machten und uns erneut um die Multimodalität bemühten. Darf ich fragen, ob wir uns bereits darüber im Klaren sind, welche Art von Produkt wir herstellen möchten? Oder geht es nur um die Veröffentlichung von Artikeln oder PR?

Wenn wir Altman bewundern, haben wir jemals darüber nachgedacht, welche Fähigkeiten er hat?

Zunächst einmal muss klar sein, dass Altman ein Produktmanager mit Programmierkenntnissen, ein Geschäftsgenie, ein versierter Investor usw. ist. Von den heimischen Medien wurde er jedoch als genialer Programmierer dargestellt. Wacht alle auf. Hinter der Popularität von OpenAI stehen Altmans Geschäfts- und Produktdesigns. Nehmen Sie sich die Zeit, Altmans Geschäftsanalyse anzuhören. Wenn man sein Talent und seinen Hintergrund kennt, kann man sicher sein, dass sowohl ChatGPT als auch GPT4 gut durchdachte kommerzielle Produkte sind und nicht nur ein Haufen Technologien.

Baiduers, glaubt ihr nicht mehr an das Internet?

Bevor Wenxin Yiyan veröffentlicht wurde, hatte Baidus Geschäftskarte bereits damit begonnen, für die Unternehmensdienstleistungen von Wenxin Yiyan zu werben. Die heutige Ankündigung ist wirklich umwerfend. Für einen Produkttest im Internet ist das Ausfüllen eines solch komplizierten Registrierungsformulars und das Warten auf die Genehmigung erforderlich? Haben Sie vergessen, wie einfach die Nutzung von Baidu vor zwanzig Jahren war? Braucht er Haustürgeschäfte? Sind die Benutzer bereit, mit Geld nach Peking zu kommen, um Sie zu finden? Und haben Sie heute die Macht des Internets vergessen? Er kann Cloud-Dienste mit Lichtgeschwindigkeit an die Benutzer weitergeben. Warum machen Sie also nicht durch Mundpropaganda Werbung für Ihre Produkte? Werden die Kosten für das Brennen von GPUs höher sein als die Kosten für die Geschäftsförderung und weniger effizient sein? Wie hat Altman das gemacht? Welches Internetprodukt wurde durch Offline-Werbung populär?

Als Gewinner des Qingyun-Plans von Toutiao und des Bai+-Plans von Baijiahao, des Baidu-Digitalautors des Jahres 2019, des beliebtesten Autors von Baijiahao im Technologiebereich, des Sogou-Autors für Technologie und Kultur 2019 und des einflussreichsten Schöpfers des Baijiahao-Vierteljahrs 2021 hat er viele Auszeichnungen gewonnen, darunter den Sohu Best Industry Media Person 2013, den dritten Platz beim China New Media Entrepreneurship Competition Beijing 2015, den Guangmang Experience Award 2015, den dritten Platz im Finale des China New Media Entrepreneurship Competition 2015 und den Baidu Dynamic Annual Powerful Celebrity 2018.

<<:  SAIF und Industriewertpapiere: Forschungsbericht zum chinesischen Kohlenstoffmarktsystem 2024

>>:  LeTV Game Hall bietet eine Vorschau auf das perfekte Cross-Screen-Erlebnis zur Erstellung eines kompletten TV-Spiels

Artikel empfehlen

Welche Übungen sind gut für die Taille?

Die Taille ist der beste Teil, um die schöne Figu...

Der kalte Winter kommt. Wie kann man sich im Winter am besten warm halten?

Die stärkste Kältewelle der zweiten Jahreshälfte ...

Worauf muss ich beim Bergsteigen achten?

Bergsteigen ist bei vielen jungen Leuten beliebt,...

Fitness Kreuzheben Standardaktion

Kreuzheben ist eine gängige Fitnessmethode. Beim ...

Double Eleven-Werbefarce: Ein Biss und ein Biss zurück

Mit dem bevorstehenden Double Eleven bereiten sic...

Warum zucken die Trizeps?

Manchmal kommt es zu Zitterproblemen beim Trizeps...

Drei wichtige Geräte helfen Männern beim Aufbau stolzer Brustmuskeln

Die Sexualität einer Frau hängt von der Größe ihr...

Smart Routing: Der Kampf um den unübersichtlichen „Eingang“

Der Markt für intelligente Router wurde von der A...

Kann Sport den Alterungsprozess verlangsamen?

Wenn wir älter werden. Auch mit unserem Körper ge...

Wie viele Schritte sind nötig, um eine Rakete zu bergen?

Ich sagte, unser Beidou-System sei gebaut worden,...

Können Erwachsene Taekwondo lernen?

Können Erwachsene Taekwondo praktizieren? Viele L...