Nach langer Vorfreude ist Googles mit großer Spannung erwartetes Großmodell Gemini endlich da. Google-CEO Sundar Pichai und Google DeepMind-CEO Demis Hassabis bezeichneten es als „einen riesigen Sprung nach vorn für KI-Modelle“ und sagten, es werde „letztlich fast jedes Produkt bei Google beeinflussen“. Sundar Pichai sagte in einer Erklärung: „Dies sind unsere ersten Modelle, die in die Gemini-Ära eintreten, und die erste Umsetzung der Vision, die wir hatten, als wir Anfang des Jahres Google DeepMind gründeten. Die Modelle dieser neuen Ära stellen eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen unternommen haben.“ Berichten zufolge hat Google drei Modelle herausgebracht : Gemini Nano, Gemini Pro und Gemini Ultra . In, Gemini Nano ist eine leichtere Version, die nativ offline auf Android-Geräten wie dem Pixel 8 Pro läuft; Gemini Pro ist eine leistungsstärkere Version, die bald eine Vielzahl von Google-KI-Diensten unterstützen wird und ab heute in Bard integriert wird. Gemini Ultra ist eine leistungsstärkere Version, das leistungsstärkste große Modell, das Google bisher entwickelt hat. Es ist in erster Linie für Rechenzentren und Unternehmensanwendungen konzipiert und soll nächstes Jahr auf den Markt kommen. In puncto Leistung liegt Gemini in 30 von 32 Benchmarks vor GPT-4 , darunter eine breite Palette allgemeiner Tests wie der Benchmark für das Multitasking-Sprachverständnis sowie Tests seiner Fähigkeit, Python-Code zu generieren. Abbildung | Gemini übertrifft den Stand der Technik bei einer Reihe von Benchmarks, darunter Text und Kodierung. Abbildung | Gemini übertrifft den Stand der Technik bei einer Reihe multimodaler Benchmarks. Darüber hinaus erreichte Gemini Ultra eine Punktzahl von 90,0 % und war damit das erste Modell, das menschliche Experten im MMLU-Test (Massive Multi-Task Language Understanding) übertraf. Dabei werden 57 Fächer, darunter Mathematik, Physik, Geschichte, Recht, Medizin und Ethik, kombiniert, um Weltwissen und Problemlösungsfähigkeiten zu testen. Der offensichtlichste Vorteil von Gemini in diesen Benchmarks liegt in seiner Fähigkeit, Video und Audio zu verstehen und damit zu interagieren. Dies ist größtenteils beabsichtigt: Multimodalität war von Anfang an Teil des Gemini-Plans. Google hat keine separaten Modelle für Bilder und Sprache trainiert, wie OpenAI es bei der Entwicklung von DALL-E und Whisper tat. Stattdessen wurde von Anfang an ein „multisensorisches“ Modell aufgebaut. Demis Hassabis sagte, Google habe sich schon immer für sehr allgemeine Systeme interessiert und sei besonders daran interessiert, alle diese Modi zu mischen – also möglichst viele Daten aus einer beliebigen Anzahl von Eingaben und Sinnen zu sammeln und dann ebenso unterschiedliche Antworten zu geben. Derzeit ist der einfachste Modus von Gemini die Texteingabe und -ausgabe, aber leistungsstärkere Modelle wie Gemini Ultra können Bilder, Videos und Audio verarbeiten. Demis Hassabis sagte , Gemini werde auch über Funktionen wie Bewegung und Berührung verfügen – also eher roboterartige Fähigkeiten – und mit der Zeit mehr Sinne entwickeln, empfindungsfähiger und dabei präziser und fundierter werden , „und diese Modelle werden die Welt um sie herum immer besser verstehen.“ Natürlich erzeugt das Gemini-Modell immer noch Illusionen. Benchmarks sind jedoch nicht alles. Die wahre Bewährungsprobe für die Fähigkeiten von Gemini werden letztlich die alltäglichen Benutzer bestehen, die es zum Brainstorming von Ideen, zur Informationssuche, zum Schreiben von Code und für mehr nutzen möchten. Google scheint insbesondere das Programmieren als die Killer-App von Gemini im Auge zu haben und verwendet ein neues Codegenerierungssystem namens AlphaCode 2, das nach eigenen Angaben 85 % der Teilnehmer an Programmierwettbewerben übertrifft und 50 % besser ist als das ursprüngliche AlphaCode. Für Google ist jedoch ebenso wichtig, dass Gemini eindeutig ein effizienteres Modell ist. Es wurde auf Googles eigenen Tensor Processing Units trainiert und läuft schneller und günstiger als Googles Vorgängermodelle wie PaLM. Zusammen mit der Einführung des neuen Modells brachte Google auch eine neue Version des TPU-Systems auf den Markt – TPU v5p, ein Computersystem, das speziell für Rechenzentren zum Trainieren und Ausführen groß angelegter Modelle entwickelt wurde. Es ist erwähnenswert, dass Gemini derzeit nur auf Englisch verfügbar ist und in Zukunft weitere Sprachversionen eingeführt werden. Sundar Pichai sagte jedoch, dass das Modell letztendlich in die Suchmaschine, Werbeprodukte, den Chrome-Browser und mehr von Google integriert werden werde. Nun, die Ära der künstlichen Intelligenz, die ChatGPT eingeleitet hat, dauert nun schon ein Jahr. Bedeutet die Veröffentlichung von Gemini durch Google, dass Google aufgeholt hat? Mit anderen Worten: Kann Google heute seine Spitzenposition in der Branche der künstlichen Intelligenz zurückerobern? Anbei: Statement von Sundar Pichai, CEO von Google und Alphabet: Jeder technologische Wandel ist eine wichtige Chance für wissenschaftliche Entdeckungen, menschlichen Fortschritt und eine Verbesserung des Lebens. Ich bin fest davon überzeugt, dass der Wandel hin zur künstlichen Intelligenz (KI), den wir derzeit erleben, der tiefgreifendste Wandel sein wird, den unsere Generation je erlebt hat, und dass seine Auswirkungen weit größer sein werden als die Revolutionen des mobilen Internets oder des Webs früherer Generationen. KI wird für die Menschen auf der ganzen Welt nicht nur Möglichkeiten schaffen – vom Alltäglichen bis zum Außergewöhnlichen –, sondern auch neue Wellen des Wissens, Lernens, der Kreativität und der Produktivität in einem Ausmaß anstoßen, wie wir es noch nie zuvor erlebt haben. Das ist es, was mich begeistert: KI für alle Menschen auf der Welt nützlich zu machen. Als Unternehmen, das KI in den Mittelpunkt stellt, sind wir seit fast acht Jahren auf einer Reise. Der Fortschritt verlangsamt sich nicht, sondern beschleunigt sich: Heute nutzen Millionen von Menschen die generative KI in unseren Produkten, um Dinge zu tun, die letztes Jahr noch undenkbar waren, wie etwa die Beantwortung komplexerer Fragen und die Verwendung neuer Tools zur Zusammenarbeit und Innovation. Gleichzeitig verwenden Entwickler auf der ganzen Welt unsere Modelle und Infrastruktur, um neue generative KI-Anwendungen zu erstellen, und Startups und Unternehmen jeder Größe nutzen unsere KI-Tools, um zu wachsen. Es ist eine unglaubliche Dynamik, aber wir haben gerade erst begonnen, die Möglichkeiten zu erkunden. Wir tun dies mutig und verantwortungsbewusst. Das bedeutet, dass wir in unserer Forschung ehrgeizige Ziele verfolgen und Technologien entwickeln, die den Menschen und der Gesellschaft enorme Vorteile bringen können. Gleichzeitig bauen wir Sicherheitsvorkehrungen ein und arbeiten mit Regierungen und Experten zusammen, um die Risiken zu bewältigen, die durch die zunehmenden Fähigkeiten der KI entstehen. Wir investieren weiterhin in die besten Tools, grundlegenden Modelle und Infrastrukturen, um unsere Produkte und Dienstleistungen gemäß unseren KI-Prinzipien zu optimieren. Jetzt machen wir den nächsten Schritt auf unserem Weg mit der Einführung von Gemini, unserem bislang fortschrittlichsten und vielseitigsten Modell, das bei mehreren führenden Benchmarks gute Leistungen erbringt. Unsere erste Version, Gemini 1.0, ist für verschiedene Maßstäbe optimiert, darunter Ultra, Pro und Nano. Dies sind unsere ersten Modelle im Gemini-Zeitalter und die erste Umsetzung der Vision, die wir hatten, als wir Anfang des Jahres Google DeepMind gründeten. Diese neue Modellära stellt eine der größten wissenschaftlichen und technischen Anstrengungen dar, die wir als Unternehmen jemals unternommen haben. Ich bin unglaublich gespannt auf die bevorstehenden Entwicklungen und die Möglichkeiten, die Gemini den Menschen auf der ganzen Welt bieten wird. –Sundar Referenzlinks: https://blog.google/technology/ai/google-gemini-ai/#capabilitieshttps://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf |
<<: Draußen schneit es, aber Ihr Körper ist so munter? | Wissenschaftsmuseum
>>: Wie läuft man am schnellsten auf der Strecke? Die „schnellste Kurve“, die Sie nicht kennen!
Landesweites Laden von Elektrofahrzeugen und Batt...
eMarketer & Forrester prognostizieren, dass U...
Experte dieses Artikels: Pa Lize, Chefarzt für Er...
Laufen erfreut sich zunehmender Beliebtheit als S...
Pilates-Yoga zur Gewichtsabnahme gilt als sehr gu...
Yieldify hat seinen Peak Season Report 2020 veröf...
1. Was ist die Variante JN.1? JN.1 ist der Unterz...
Der Reporter erfuhr am 26. von der Sixth Academy ...
Die OTT-Branche ist erneut zu einem Hotspot gewor...
Fitness ist heutzutage etwas, was viele Menschen ...
Laufen ist gut für die Gesundheit und kann auch b...
In der traditionellen Vorstellung ist die zervika...
Laufen ist eine Sportart und außerdem sehr gut fü...
2015 dürfte ein großes Jahr für das Cloud Computi...
Würde man die Chiphersteller der Welt nebeneinand...