Verstehen Sie die neuesten Entwicklungen im Bereich KI in einem Artikel! Benutzerhandbuch für Mitarbeiter→

Verstehen Sie die neuesten Entwicklungen im Bereich KI in einem Artikel! Benutzerhandbuch für Mitarbeiter→

Im März 2023 löste die durch GPT-4 repräsentierte KI-Technologie eine Welle des KI-Fiebers aus. Ein halbes Jahr später gibt es viele neue Entwicklungen im Bereich der KI, von denen einige das Leben der „arbeitenden Menschen“ völlig verändern könnten.

Lassen Sie uns als Nächstes eine Bestandsaufnahme der Dinge im Bereich der KI machen, die in den letzten sechs Monaten Ihre Aufmerksamkeit am meisten verdient haben.

GPTs größter Rivale Gemini erscheint

Im Mai 2023 gab Google-CEO Pi Chai auf der Google I/O Developer Conference bekannt, dass Googles Deep Mind das Gemini-Modell trainiert.

Gemini ist ein großes Sprachmodell, das speziell als Konkurrenz zu GPT-4 entwickelt wurde. Laut der Analyse des Halbleiterforschungsunternehmens SemiAnalysis wird die Rechenleistung von Gemini fünfmal so hoch sein wie die von GPT-4.

Darüber hinaus kann Genimi im Vergleich zu GPT-4 multimodale Eingaben besser unterstützen, was bedeutet, dass Gemini neben Textinformationen auch Bilder und Sprachinformationen verarbeiten kann , was die Verwendung von Gemini bequemer macht als das aktuelle GPT-4.

Und vielleicht sehen wir Gemini bald in Aktion. Einem Bericht des ausländischen Technologiemediums „The Information“ vom 14. September zufolge hat Gemini einigen Unternehmen Nutzungs- und Testrechte gewährt. Es dürfte nicht mehr lange dauern, bis Gemini in die Produktmatrix von Google integriert wird und der Öffentlichkeit zur Verfügung steht.

Bildquelle: Internet

Open AI trainiert einen vielseitigeren „GPT-5“

Natürlich wird OpenAI angesichts eines Gegners mit multimodalen Fähigkeiten wie Gemini nicht untätig zusehen.

Tatsächlich hat GPT-4 seine multimodalen Verarbeitungsfähigkeiten bereits auf der GPT-4-Startkonferenz im März dieses Jahres demonstriert. Bei der Pressekonferenz zeichnete der Demonstrator von Hand eine Skizze einer Webseite, machte ein Foto davon und schickte es an GPT-4 mit der Anweisung, eine Webseite entsprechend diesem Layout zu erstellen. GPT-4 hat den Webseitencode sofort geschrieben.

In tatsächlichen Anwendungen nach der Pressekonferenz schienen die Benutzer die multimodalen Verarbeitungsfunktionen von ChatGPT jedoch nicht zu erleben.

Um der Herausforderung von Google Gemini gerecht zu werden, hat OpenAI ChatGPT mit dem neuen Bildgenerierungsmodell DALL·E-3 kombiniert, um GPT „vielseitiger“ zu machen. Nach der Aktualisierung der GPT-4-Version am 25. September war diese auch in der Lage, Sprach- und Bildinformationen zu verarbeiten.

Der folgende Inhalt wird beispielsweise von DALL·E-3 und ChatGPT generiert. GPT kann nicht nur entsprechende Bilder basierend auf Text zeichnen, sondern auch die Informationen auf den Bildern interpretieren und basierend auf der Konversation einige Änderungen an den Bildern vornehmen.

DALLE3 Bilder aus Text erstellt

GPT erklärt, warum der kleine Igel auf dem Bild so gut ist

Bild generiert von DALL·E 3 gemäß der Anforderung „Zeigen Sie, dass der kleine Igel begeistert ist“

Zusätzlich zur Kombination von DALL·E-3 und ChatGPT hat OpenAI auch mit der Bereitstellung von „GPT-5“ begonnen. In der am 25. September veröffentlichten neuen Version von GPT wurden Testfunktionen für Sprachkommunikation und Bilderkennung eingeführt.

Tatsächlich gab es im März dieses Jahres (kurz nach dem Erscheinen von GPT-4) aufgrund von Bedenken hinsichtlich der Informationssicherheit und des Datenschutzes eine Welle von Aufrufen im Internet, die Forschung zu GPT-5 einzustellen. Als CEO von OpenAI versprach Sam Altman zudem, das GPT-5-Modell kurzfristig nicht zu trainieren.

Laut The Information hat OpenAI ein halbes Jahr nach dem Erscheinen von GPT-4 mit der Entwicklung eines neuen Modells mit dem Codenamen „Gobi“ begonnen, das von Beginn seiner Konzeption an über multimodale Fähigkeiten verfügt. Einige Medien behaupten sogar, dass es sich um das zukünftige GPT-5 handeln könnte.

Microsoft veröffentlicht „Worker Benefit Package“ : Microsoft Copilot

Am 21. September hat Microsoft das Paket der Microsoft Copilot-Familie veröffentlicht. Wenn Sie mit Microsoft Copilot nicht vertraut sind, können Sie es folgendermaßen verstehen. Die von uns häufig verwendete Software wie Word, Excel, PPT und der mit Windows gelieferte Browser wird von GPT-4 unterstützt.

Nehmen wir Word als Beispiel, das wir am häufigsten verwenden: Wenn Sie ein Dokument schreiben, können Sie Word direkt ein Thema mitteilen und es automatisch ein Dokument zu diesem Thema erstellen lassen. Gleichzeitig verfügt es auch über die Funktion des Bildabgleichs. Sie müssen nicht einmal Zeit damit verbringen, im Internet nach Bildern zu suchen. Sie können es einfach Bilder basierend auf dem Text generieren lassen.

Was Excel betrifft, müssen Sie sich in der neuen Microsoft Copilot-Familie weder verschiedene Formeln merken noch in Excel programmieren. Sie müssen Excel lediglich Ihr Ziel mitteilen und es übernimmt automatisch die Arbeit des Schreibens von Formeln, des Schreibens von Codes und der Datenanalyse für Sie. Sie müssen nur abwarten und die Ergebnisse sehen.

Darüber hinaus müssen Sie beim Surfen im Internet den Inhalt der Webseite nicht einmal im Detail lesen. Der Browser kann Ihnen direkt dabei helfen, die wichtigen Informationen der aktuellen Seite zusammenzufassen, wodurch Sie viel Zeit sparen.

Dies ist möglicherweise das „freundlichste“ KI-Geschenkpaket für Arbeitnehmer der letzten sechs Monate.

KI hilft Menschen, Gerüche zu verstehen

Neben dem menschlichen Seh-, Hör- und Geruchssinn ist der Geruchssinn möglicherweise viel komplizierter als wir denken.

Für das Sehvermögen können die Farben, die wir sehen, mit der Wellenlänge des Lichts in Verbindung gebracht werden, und für das Hörvermögen hängt der Ton mit der Schwingungsfrequenz von Objekten zusammen. Was den Geruchssinn betrifft, so verfügt der Mensch nicht nur über Hunderte von Geruchsrezeptoren, sondern die üblichen Gerüche des Lebens werden oft durch viele Arten von Geruchsmolekülen gebildet, sodass es schwierig ist, ein einfaches und perfektes mathematisches Modell zu erstellen.

In einem im August dieses Jahres in Science veröffentlichten Artikel wurde darauf hingewiesen, dass Wissenschaftler die KI-Technologie des „Graph Neural Network“ nutzten, um die Beziehung zwischen Gerüchen und Komponenten zu identifizieren und eine Geruchskarte zu erstellen . Basierend auf dieser Karte können wir bekannte Verbindungen verwenden, um den gewünschten Geschmack zu konfigurieren.

Noch wichtiger ist, dass die von der KI erstellte Geruchskarte 500.000 potenzielle Gerüche abdeckt. Das bedeutet, dass wir mithilfe der KI möglicherweise Gerüche wahrnehmen können, die wir uns nie zuvor vorgestellt haben. Dies könnte die aktuelle Situation der Lebensmittel- und Gewürzindustrie grundlegend verändern und unser Leben „geschmackvoller“ machen.

Der Prozess der Geruchsidentifizierung durch KI. Bildquelle: Referenzen

Autonomes Fahren zeigt Ihnen, wie es fährt

Am 14. September veröffentlichte das Unternehmen für autonomes Fahren Wayve den Open-Loop-Tester für autonomes Fahren LINGO-1. Wir können es uns einfach als eine Art Erklärung zum autonomen Fahren vorstellen.

Warum braucht autonomes Fahren einen Dolmetscher? Dies ist tatsächlich eine sehr interessante und wichtige Studie. Stellen Sie sich vor, dass jede Ihrer Entscheidungen und Handlungen beim Autofahren eine Grundlage haben muss. Sie haben beispielsweise das Gefühl, dass das Auto vor Ihnen zu langsam ist und die Spur neben Ihnen frei und sicher ist. Deshalb entscheiden Sie sich, zum Überholen auf die Spur neben Ihnen zu wechseln. Oder Sie bremsen an der Kreuzung ab, weil dort viele Menschen unterwegs sind und Sie die Umgebung sorgfältig beobachten müssen.

LINGO-1 kann das Verhalten des selbstfahrenden Autos auch in einer natürlichen Sprache erklären, die den Menschen vertraut ist, und auf spezifische menschliche Fragen antworten. Wenn das selbstfahrende Auto beispielsweise an einer Kreuzung anhält, können Sie es fragen: „Was beobachten Sie jetzt?“. Wenn jemand in der Nähe Fahrrad fährt, können Sie das selbstfahrende Auto auch fragen: „Wie beurteilen Sie, ob Sie einen Sicherheitsabstand zu diesem Radfahrer einhalten?“

Derzeit liegt die Genauigkeit der Antworten von LINGO-1 bei nur etwa 60 %, aber die Fähigkeiten von LINGO-1 verbessern sich ständig und diese Art der Forschung ist von großer Bedeutung.

Es kann die Erklärbarkeit künstlicher Intelligenz verbessern. In der Vergangenheit waren viele Entscheidungen selbstfahrender Autos für den Menschen eine Blackbox. Wir wussten weder, warum das Auto die Spur wechselte, noch, warum es sich entschied, nicht zu überholen, obwohl es die Möglichkeit dazu hatte. Wenn Ingenieure verstehen, wie KI Entscheidungen trifft, können sie auch autonome Fahralgorithmen besser entwickeln und die Sicherheit autonomer Fahrzeuge kontinuierlich verbessern. Gleichzeitig kann es auch das Verständnis und Vertrauen normaler Benutzer in das autonome Fahren stärken, sodass der Prozess der Entscheidungsfindung durch künstliche Intelligenz keine Blackbox mehr ist.

KI übertrifft Menschen in mehreren Wettbewerben

Am 30. August zeigte ein in Nature veröffentlichter Artikel, dass die KI den Menschen bei Drohnenrennen aus der Egoperspektive überholt hat.

Drohnenrennen aus der Egoperspektive unterscheiden sich von gewöhnlichen ferngesteuerten Flugzeugen. Der Pilot muss die Umgebung aus der Perspektive der mit hoher Geschwindigkeit fliegenden Drohne beobachten und Operationen durchführen. Damit KI die vom Videosensor zurückgesendeten Informationen schnell analysieren und Entscheidungen zur Optimierung der Flugroute treffen kann. Dem Nature-Artikel zufolge ist die Fähigkeit, den menschlichen Champion in diesem Wettbewerb zu schlagen, ein „Meilenstein auf dem Gebiet der mobilen Robotik und der maschinellen Intelligenz“. Diese Errungenschaft könnte für zukünftige selbstfahrende Autos und unbemannte Luftfahrzeuge von großem Wert sein.

Neben dem Drohnenbereich zeigt KI auch im Bereich der Verifizierungscodes erstaunliche Leistungen .

Bestätigungscodes sind in unserem täglichen Leben weit verbreitet. Wenn Sie sich bei Ihrem Konto anmelden möchten, um sich bei einer Webseite anzumelden, werden Ihnen häufig verschiedene Bestätigungscodes angezeigt. Dazu gehören das Erkennen von Buchstaben und Zahlen mit ungewöhnlichen Formen, das Ziehen eines puzzleartigen Schiebereglers oder das Klicken auf ein „Kopf hoch“-Bild. Der Zweck dieser Bestätigungscodes besteht darin, zu verhindern, dass sich Roboter böswillig anmelden und registrieren.

Ein Artikel vom Juli 2023 zeigte jedoch, dass KI möglicherweise besser mit CAPTCHAs umgehen kann als Menschen. Für das Experiment wurden mehr als 1.000 menschliche Tester eingeladen und gebeten, auf 120 gängigen Websites Bestätigungscodes zu verwenden.

Die Ergebnisse zeigen, dass die Genauigkeit von Menschen beim Lösen von CAPTCHA-Problemen zwischen 50 und 80 % liegt. Im Vergleich dazu liegt die Genauigkeit der KI beim Lösen von CAPTCHA-Problemen zwischen 85 % und 100 %, wobei die meisten von ihnen über 96 % liegen. KI verfügt nicht nur über eine höhere Genauigkeitsrate als Menschen, sondern kann CAPTCHAs auch 0,5 Sekunden schneller lösen als Menschen.

Dies bedeutet, dass mit der Weiterentwicklung der KI-Technologie die Wirksamkeit der von Menschen zur Abwehr von KI verwendeten Verifizierungscodes immer geringer werden könnte, was eine sehr ernste Herausforderung für die Netzwerk- und Informationssicherheit darstellt. Wissenschaftler müssen mit der Entwicklung neuer Arten von CAPTCHAs beginnen, die vor KI schützen, Menschen aber nicht verwirren.

Projekt zur Simulation des menschlichen Gehirns „gescheitert“

Obwohl die Technologie der künstlichen Intelligenz in den letzten Jahren große Fortschritte gemacht hat, hat die Menschheit eine verheerende Niederlage erlitten, wenn es darum ging, KI zur Simulation des menschlichen Gehirns einzusetzen.

Im Jahr 2013 starteten europäische Wissenschaftler ein auf zehn Jahre angelegtes „Human Brain Project“. Wissenschaftler planen, mithilfe modernster Computertechnologie innerhalb von zehn Jahren die zig Milliarden Neuronen und ihre Synapsen im menschlichen Gehirn zu simulieren und so die Funktionsprozesse des menschlichen Gehirns wiederherzustellen und die Geheimnisse des menschlichen Gehirns zu lüften.

Der 1. Oktober dieses Jahres ist der „Erfüllungstermin“ für dieses Projekt. Wissenschaftler haben zwar insgesamt 1,3 Milliarden Euro (etwa 10 Milliarden Yuan) investiert, sind aber noch weit vom Ziel entfernt, „das menschliche Gehirn zu simulieren“. Wissenschaftler haben die Komplexität des menschlichen Gehirns stark unterschätzt. Man kann sagen, dass dies ein Scheitern der menschlichen Versuche ist, „künstliche Intelligenz“ zu entwickeln.

Obwohl es den Menschen im Rahmen des Human Brain Project nicht gelungen ist, eine „künstliche Intelligenz“ zu entwickeln, sind derartige Untersuchungen sehr bedeutsam. In diesem Projekt haben Wissenschaftler tatsächlich ein tieferes Verständnis des menschlichen Gehirns gewonnen. So haben Wissenschaftler beispielsweise eine detailliertere Karte des menschlichen Gehirns erstellt und mehrere bislang unbekannte Hirnbereiche im präfrontalen Kortex entdeckt.

Darüber hinaus haben Wissenschaftler eine Verbindung zwischen Genexpression und Gehirnstruktur festgestellt, sodass sie einige mit der Gehirnstruktur zusammenhängende Krankheiten (wie Depressionen) auf genetischer Ebene untersuchen können. Einige digitale Gehirnmodelle wurden auch klinisch bei Krankheiten wie der Parkinson-Krankheit angewendet.

Bildquelle: unsplash.com Fotograf: Xu Haiwei

Neben dem europäischen Human Brain Project gibt es auch in China, den USA, Japan, Südkorea, Australien und anderen Ländern eigene Human Brain Projects. Nur wenn wir die Struktur des menschlichen Gehirns und den Ursprung der Intelligenz besser verstehen, können wir die Technologie der „künstlichen Intelligenz“ besser entwickeln.

Der Bereich der künstlichen Intelligenz entwickelt sich extrem schnell. In nur einem halben Jahr ist GPT-4 auf einen starken Gegner gestoßen, KI hat Menschen dabei geholfen, Geruchskarten und detailliertere Gehirnkarten zu erstellen, und selbstfahrende Autos verfügen auch über „Erklärer“.

Es ist diese rasante technologische Entwicklung, die uns ein sichereres und bequemeres Leben ermöglicht. Ihre Entwicklung ist ein Science-Fiction-Blockbuster, der sich jeden Tag in unserem Leben abspielt.

Verweise

[1] https://www.semianalysis.com/p/google-gemini-eats-the-world-gemini

[2]https://www.theinformation.com/articles/google-nears-release-of-gemini-ai-to-rival-openai

[3] https://openai.com/dall-e-3

[4]https://blogs.microsoft.com/zh/blog/2023/09/21/announcing-microsoft-copilot-your-everyday-ai-companion/

[5] https://sitn.hms.harvard.edu/flash/2023/this-ai-smells-better-than-you/

[6] https://wayve.ai/thinking/lingo-natural-Language-autonomous-driving/

[7] https://www.nature.com/articles/d41586-023-02600-x#ref-CR3

[8] https://arxiv.org/pdf/2307.12108.pdf

[9] https://qz.com/ai-bots-recaptcha-turing-test-websites-authenticity-1850734350

[10] https://www.nature.com/articles/s41586-023-06419-4

Planung und Produktion

Autor: Science Scraps Popular Science Team

Audit丨Yu Yang, Leiter des Tencent Security Xuanwu Lab

Planung von Cui Yinghao

Herausgeber: Lin Lin

<<:  Neben dem Sättigungsgefühl oder dem Übersättigungsgefühl hängt Schläfrigkeit tatsächlich auch damit zusammen, was Sie gegessen haben.

>>:  Das leuchtende Grün ist tatsächlich die Farbe des Todes?

Artikel empfehlen

Nr. 1 bei Trendsuchen! Verärgern Sie das gesamte Netzwerk

Gestern (18.), Thema: „Ist es illegal, jemanden o...

Was sind die Vorteile des Dehnens für Frauen

Mit der Beschleunigung des Lebenstempos der Mensc...

Welche Trainingsmethoden gibt es für das Sprinten?

Heutzutage ist Sprinten bei vielen Sportlern beli...

Wie kann ich durch Seilspringen abnehmen?

Seilspringen ist ein Sport, den viele Menschen li...

Was sind die Unterschiede zwischen einem Heimtrainer und einem Spinningbike?

Abnehmen ist heutzutage der Traum vieler Menschen...

iPhone 6S-Parameter enthüllt: ausgestattet mit 12-Millionen-Pixel-Kamera

In letzter Zeit machten Nachrichtenberichte über ...

Welche Möglichkeiten gibt es, Ihre Muskeln zu trainieren?

Einen starken, muskulösen Körper zu haben, ist wa...

Welche Vorteile hat das Schwimmen?

Sobald der Sommer kommt, sind die Schwimmbäder vo...

Kann Joggen die Beinmuskulatur reduzieren?

Laufen kann uns beim Abnehmen helfen und unseren ...