Geschrieben, nachdem DeepSeek populär wurde: Die KI entwickelt sich so schnell, wird sie sich in Zukunft immer schneller entwickeln?

Geschrieben, nachdem DeepSeek populär wurde: Die KI entwickelt sich so schnell, wird sie sich in Zukunft immer schneller entwickeln?

Produziert von: Science Popularization China

Autor: Wang Chen (Doktorand am Institute of Computing Technology, Chinesische Akademie der Wissenschaften)

Hersteller: China Science Expo

Anmerkung des Herausgebers: Um die neuesten Trends in der intelligenten Technologie vorzustellen, hat das Spitzentechnologieprojekt von China Science Popularization eine Artikelserie zum Thema „Künstliche Intelligenz“ veröffentlicht, um einen Einblick in die neuesten Fortschritte der künstlichen Intelligenz zu geben und auf verschiedene Bedenken und Neugierde einzugehen. Lassen Sie uns gemeinsam das intelligente Zeitalter erkunden und begrüßen.

Zuletzt sorgte DeepSeek als „neuer Topstar“ im KI-Bereich mit seinen leistungsstarken Funktionen in den sozialen Medien für hitzige Diskussionen. Manche Leute sagen, es sei ein Produktivitätstool der Zukunft, andere sind neugierig, welche Veränderungen es mit sich bringen kann, und wieder andere befürchten, dass es ihnen ihren Arbeitsplatz wegnimmt …

Damit jeder mehr über diesen mit Spannung erwarteten intelligenten Helfer erfährt, haben wir Wang Chen, einen Doktoranden am Institut für Computertechnologie der Chinesischen Akademie der Wissenschaften, gebeten, anhand von 10 Fragen umfassend auf die Grundprinzipien, Nutzungsfähigkeiten und zukünftigen Trends von DeepSeek einzugehen. Egal, ob Sie ein KI-Neuling oder ein Technologieexperte sind, dieser Artikel kann Ihre Fragen beantworten! Mal sehen, ob dieser „intelligente Helfer“ ein echter Partner in unserem Leben werden kann!

DeepSeek hat während des Frühlingsfests weltweite Aufmerksamkeit erregt. Mittlerweile haben viele Plattformen erklärt, dass sie sich an das große Modell von DeepSeek angeschlossen haben. Was genau ist es?

DeepSeek ist ein Startup für künstliche Intelligenz mit Sitz in Hangzhou. Es wurde im Juli 2023 von Liang Wenfeng, Mitbegründer von Huanfang Quantitative, gegründet und konzentriert sich auf die Forschung und Entwicklung großer Sprachmodelle.

Vor dem Frühlingsfest veröffentlichte DeepSeek zwei Open-Source-Großsprachenmodelle mit demselben Namen: DeepSeek-V3 (26. Dezember 2024) und DeepSeek-R1 (20. Januar 2025). Ihre Leistung ist mit anderen großen Sprachmodellen vergleichbar, beispielsweise den Closed-Source-Modellen GPT-4o und o1 von OpenAI, und die Kosten sind deutlich niedriger als bei anderen Modellen.

Das DeepSeek-V3-Modell ist darauf ausgelegt, kostengünstige Dienste bereitzustellen, die schnell auf Benutzeranforderungen reagieren und die Anforderungen alltäglicher Aufgaben wie die Verarbeitung natürlicher Sprache, die Übersetzung von Frage-Antwort-Systemen und die Inhaltserstellung erfüllen können. Das Modell DeepSeek-R1 konzentriert sich auf komplexe Denkaufgaben, insbesondere in den Bereichen mathematische Probleme, Codegenerierung, logisches Denken usw., aber seine Reaktionszeit ist auch relativ lang.

Warum hat DeepSeek so viel Aufmerksamkeit erregt?

Nachdem DeepSeek-V3 und DeepSeek-R1 vor dem Frühlingsfest veröffentlicht wurden, erregten sie aufgrund ihrer Leistung, die mit den großen Topmodellen von OpenAI vergleichbar ist, und ihrer geringen Trainings- und Inferenzkosten schnell große Aufmerksamkeit auf der ganzen Welt. Die hohe Kosteneffizienz von DeepSeek stellt das Monopol großer amerikanischer Modelle in Frage. Durch die Einführung können mehr Unternehmen und Benutzer die fortschrittlichsten KI-Ergebnisse zu einem niedrigeren Preis erleben.

DeepSeek hat seine technischen Details und Modellgewichte als Open Source freigegeben, sodass mehr Menschen seine Ergebnisse für Innovation sowie Forschung und Entwicklung nutzen können. Gleichzeitig stellte DeepSeek seine Online-Dienste kostenlos zur Verfügung, was zu zahlreichen Benutzererfahrungen führte und einen beispiellosen Hype auslöste. Sieben Tage nach der offiziellen Veröffentlichung von DeepSeek-R1 überholte DeepSeek ChatGPT und führte die Rangliste der kostenlosen App-Downloads im AppStore an. Der Erfolg von DeepSeek stellt für China einen bedeutenden Durchbruch im Bereich der KI dar und stärkt Chinas Position im globalen KI-Technologiewettbewerb. Derzeit haben viele Unternehmen und Universitäten damit begonnen, das DeepSeek-Modell unabhängig einzusetzen, was sein breites Anwendungspotenzial weiter beweist.

Warum können mit so geringen Kosten und so begrenzten Algorithmen so leistungsstarke Funktionen erreicht werden? Ist es nur im chinesischen Ausdruck kraftvoll oder weist es in allen Aspekten eine gute Leistung auf?

DeepSeek kann leistungsstarke Funktionen bei geringen Trainingskosten erreichen, hauptsächlich aufgrund der langfristigen kontinuierlichen Innovation von DeepSeek in der Modellarchitektur und auf Algorithmusebene.

Insbesondere reduziert DeepSeek die Inferenzkosten effektiv durch den Einsatz von Techniken wie Mixture of Experts Architecture (MoE) und Multi-Head Latent Attention (MLA). Gleichzeitig verbessert DeepSeek mithilfe von Datendestillation, verteilter Trainingsoptimierung und Feinabstimmung auf Hardwareebene die Ressourcennutzung weiter und senkt so die Trainingskosten. Durch die Kombination mehrerer innovativer Optimierungstechniken kann DeepSeek eine leistungsstarke Leistung bei gleichzeitig geringen Trainings- und Inferenzkosten bieten.

DeepSeek bietet herausragende Leistungen beim Verstehen und Anwenden von Chinesisch. Es kann nicht nur altes Chinesisch verstehen und Gedichte verfassen, sondern auch die gängigen Internetbegriffe genau erfassen. Im Vergleich dazu wirkt die chinesische Sprache in ChatGPT zwar grammatikalisch flüssig, aber ziemlich steif. Die leistungsstarken Funktionen von DeepSeek sind jedoch nicht auf chinesische Ausdrücke beschränkt. In einer Reihe offizieller Standardbewertungen hat DeepSeek Spitzenniveaus in den Bereichen Englisch, Lexikonwissen, lange Texte, Code, mathematische Fähigkeiten und anderen Bereichen erreicht.

Die Leistung von DeepSeek in verschiedenen Bereichen

(Bildquelle: Referenz 2)

Bedeutet die Verwendung von Chinesisch im Bereich der KI eine höhere Effizienz?

Im Bereich der KI bedeutet höhere „Effizienz“ oft eine schnellere Verarbeitung, eine höhere Genauigkeit beim Verständnis oder eine bessere Qualität der generierten Inhalte.

Zunächst einmal gibt es zwischen Chinesisch und Englisch viele strukturelle Unterschiede. Chinesisch ist eine ideografische Sprache, in der ein Zeichen viele Bedeutungen ausdrücken kann, während Englisch eine alphabetische Sprache ist, in der jedes Wort aus mehreren Buchstaben besteht. Im Vergleich zum Englischen ist Chinesisch prägnanter und effizienter in der Ausdrucksweise und weist eine höhere Informationsdichte auf. Wenn dieselbe Bedeutung ausgedrückt wird, kann der Inhalt im Chinesischen oft prägnanter wiedergegeben werden. Daher kann im Bereich der KI die Verwendung von Chinesisch die Ausdruckseffizienz verbessern und somit die Kosten senken.

Gleichzeitig stellen die vielfältige Semantik und die komplexe Grammatikstruktur des Chinesischen jedoch auch eine Herausforderung für die Verständnisfähigkeit der KI dar. Im Chinesischen kann „花“ beispielsweise sowohl eine Pflanze als auch eine Ausgabe bedeuten, was es für die KI schwieriger machen könnte, den Kontext zu verstehen. Obwohl es auch im Englischen Probleme mit Synonymen und Polysemie gibt, ist seine Struktur möglicherweise klarer. Daher benötigt die KI bei der Verarbeitung von Chinesisch mehr Kontextinformationen, um die Bedeutung genau zu verstehen.

Darüber hinaus sollten auch das Datenvolumen sowie die Modellgestaltung und -optimierung berücksichtigt werden. Wenn ein KI-Modell mit einer großen Menge chinesischer Daten trainiert wird, kann es bei chinesischen Aufgaben bessere Leistungen erbringen. Wenn die Daten hingegen hauptsächlich aus dem Englischen oder anderen Sprachen stammen, kann die KI diese Sprachen möglicherweise effizienter verarbeiten. Einige Modelle sind möglicherweise speziell für eine bestimmte Sprache konzipiert und arbeiten in dieser Sprache natürlich effizienter.

Es besteht kein Konsens darüber, ob die Chinesen im Bereich der KI über nennenswerte Vorteile verfügen. In Zukunft könnte die Frage, wie sich die potenziellen Vorteile der chinesischen Sprache nutzen lassen, eine wichtige Forschungsrichtung werden.

Warum kann DeepSeek bei der Beantwortung von Benutzerfragen seinen „Deep-Thinking-Prozess“ zeigen?

DeepSeek-R1 kann seinen tiefen Denkprozess beim Beantworten von Benutzerfragen demonstrieren, da es die Chain of Thought (CoT)-Technologie verwendet. Die Thought-Chain-Technologie ahmt die menschliche Denkweise nach. Dabei muss das Modell komplexe Aufgaben in einfache Schritte zerlegen und diese dann Schritt für Schritt lösen, wodurch die Fähigkeiten des Modells bei komplexen Denkaufgaben verbessert werden.

Die O-Serienmodelle von OpenAI verwenden ebenfalls Gedankenkettentechnologie, OpenAI hat den Benutzern jedoch nicht die ursprüngliche Gedankenkette des Modells offengelegt, sondern nur eine Zusammenfassung der Gedankenkette bereitgestellt. Als Open-Source-Modell öffnet DeepSeek-R1 die Denkkette vollständig und ermöglicht es Benutzern, beim Lösen von Problemen den gesamten Denkprozess des Modells klar zu erkennen.

Was sind die Merkmale von ChatGPT und DeepSeek? Stellen sie zwei zukünftige Entwicklungsrichtungen großer KI-Modelle dar oder werden sie sich zusammen entwickeln?

ChatGPT basiert auf der GPT-Modellreihe von OpenAI und verwendet für das Training eine große Menge mehrsprachiger Daten. Es unterstützt Mehrsprachigkeit und Multimodalität und kann Dienste über Sprachen und Domänen hinweg bereitstellen. Als Closed-Source-Modell wird es den Benutzern von OpenAI online zur Verfügung gestellt.

DeepSeek ist für die chinesische Sprache optimiert und weist geringere Trainings- und Inferenzkosten auf. DeepSeek ist ein Open-Source-Modell, das Benutzer nach Bedarf bereitstellen und anpassen können. Derzeit unterscheiden sich ihre technischen Architekturen und ihre Marktpositionierung, doch mit der Weiterentwicklung der Technologie könnte es in Zukunft mehr Trends des gegenseitigen Lernens und der Integration geben. Beispielsweise kann DeepSeek von den multimodalen Fähigkeiten von ChatGPT lernen und ChatGPT kann auch seine Lokalisierungsdienste optimieren, um den Herausforderungen von Wettbewerbern wie DeepSeek gerecht zu werden.

DeepSeek hat ein Open-Source-Modell veröffentlicht. Wie soll das Unternehmen seine führende Position nach der Öffnung für die Öffentlichkeit behaupten?

Liang Wenfeng, Gründer von DeepSeek, sagte, dass die derzeitige generative künstliche Intelligenz nicht das Ende sei und das zukünftige Ziel darin bestehe, auf die Realisierung allgemeiner künstlicher Intelligenz hinzuarbeiten. In einer Zeit, in der sich die KI-Technologie rasant weiterentwickelt, verfügt niemand über den technologischen Vorsprung, um seine Konkurrenten zu verdrängen, und selbst Closed-Source-Software kann nicht verhindern, von anderen überholt zu werden. Um diese Herausforderung zu meistern, hoffen sie, durch kontinuierliche Innovation einen Mehrwert in das Wachstum des Teams zu integrieren und die Nase vorn zu behalten. Die Entscheidung für Open Source basiert auf dieser Überlegung. Open Source kann das technologische Monopol aufbrechen, die technologische Schwelle senken und eine breitere technologische Zusammenarbeit und Innovation anregen. Open Source kann mehr Entwickler zur Teilnahme und Mitwirkung bewegen und eine offene und diversifizierte Technologieentwicklungsumgebung schaffen. DeepSeek hofft, auf diese Weise die langfristige Entwicklung der Technologie voranzutreiben, seine führende Position zu behaupten und ein führendes Unternehmen in der KI-Technologie zu werden.

Wenn Sie die Nutzungsseite öffnen, stehen Ihnen die Optionen „Deep Thinking (R1)“ und „Online-Suche“ zur Verfügung. Was ist der Unterschied zwischen den beiden in der Verwendung? Wie können wir dieses große Inferenzmodell besser nutzen?

Nach dem Aktivieren der Option „Deep Thinking“ (R1) wechselt der Hintergrund zum Modell „DeepSeek-R1“, das sich auf Szenarien konzentriert, die komplexes Denken erfordern, wie etwa mathematische oder Programmierprobleme. Es kann den detaillierten Denkprozess darstellen und die Argumentationsschritte sowie die Endergebnisse bereitstellen.

Die Online-Suchoption ermöglicht es dem Modell, Internet-Suchergebnisse in Echtzeit abzurufen. Es eignet sich für zeitkritische Fragen, die aktuelle Informationen erfordern. Das Modell kann basierend auf den Suchergebnissen in Echtzeit aktualisierte Antworten liefern.

Bei Verwendung der Funktion „Deep Thinking“ (R1) müssen Benutzer das Modell beim Stellen von Fragen nicht dazu anleiten, weiter zu denken. Sie müssen ihre Bedürfnisse nur klar zum Ausdruck bringen und vage Ausdrücke vermeiden, damit das Modell sie besser verstehen und präzise Antworten geben kann . Im Deep-Thinking-Modus können Benutzer neben der endgültigen Antwort des Modells auch auf den Denkprozess des Modells achten, um die detaillierten Methoden zur Problemlösung besser zu verstehen.

Welche Arbeitsbereiche werden voraussichtlich am stärksten von DeepSeek beeinflusst oder sogar ersetzt?

Große Sprachmodelle wie DeepSeek können sich auf Branchen auswirken, die auf Informationsabruf, Datenanalyse, hohe Wiederholbarkeit und klare Ziele angewiesen sind. Beispielsweise könnten Bereiche wie Inhaltserstellung, Datenverarbeitung, Korrekturlesen von Übersetzungen, manueller Kundendienst, Personalverwaltung und Finanzprüfung durch automatisierte KI-Technologie ersetzt werden. KI kann von Benutzern angeforderte Aufgaben effizient erledigen und so die Abhängigkeit von manueller Arbeit verringern.

Für einige Berufe, die Kreativität, emotionale Intelligenz und zwischenmenschliche Kommunikation erfordern, ist menschliches Engagement jedoch nach wie vor unverzichtbar. Da sich die KI-Technologie rasant weiterentwickelt, müssen die Menschen diese Fähigkeiten, die nicht so einfach durch KI ersetzt werden können, kontinuierlich verbessern. Diese Fähigkeiten können dem Einzelnen dabei helfen, am Arbeitsplatz wettbewerbsfähig zu bleiben und sicherzustellen, dass Menschen und KI in der zukünftigen Arbeitsumgebung eine bessere Zusammenarbeit und Ergänzung erreichen und gemeinsam den sozialen Fortschritt fördern können.

Warum entwickelt sich KI so schnell? Wird es immer schneller?

Die KI hat sich in den letzten Jahren aufgrund mehrerer Faktoren rasant entwickelt.

Erstens hat die deutliche Verbesserung der Rechenleistung, insbesondere die Entwicklung von Hardwaretechnologien wie GPU, es KI-Modellen ermöglicht, größere Datenmengen zu verarbeiten und komplexere Modelle zu trainieren, wodurch die Gesamtleistung verbessert wurde.

Zweitens hat die rasante Entwicklung der Internettechnologie eine umfangreiche Datenbank für das KI-Training bereitgestellt. Gleichzeitig haben Durchbrüche in der Algorithmenarchitektur im Bereich Deep Learning dazu geführt, dass die Fähigkeiten der KI weiter gesteigert werden konnten. In den letzten Jahren haben Technologieunternehmen und Investoren das Potenzial der KI erkannt und starke finanzielle und technologische Unterstützung geleistet. Gemeinsam haben diese Faktoren die sprunghafte Entwicklung der KI-Technologie gefördert.

Obwohl viele Experten davon ausgehen, dass sich die KI auch in Zukunft rasant weiterentwickeln wird, besteht weiterhin Unsicherheit darüber, ob das derzeitige Tempo beibehalten werden kann. Optimisten glauben, dass der Fortschritt der KI exponentiell zunehmen wird. Mit der zunehmenden Intelligenz der KI wird auch die Iterationsgeschwindigkeit der KI immer höher, und irgendwann wird sie den Menschen völlig übertreffen. Allerdings können Rechenleistung und Daten zu Engpässen werden, die die Entwicklung der KI-Technologie einschränken. Das Training großer Modelle erfordert immer mehr Rechenleistung und die Entwicklung der Rechenleistung reicht derzeit nicht aus, um den Bedarf an KI-Training vollständig zu decken. Gleichzeitig könnten die vorhandenen Daten der Menschheit in den nächsten Jahren erschöpft sein.

Damit die KI-Technologie die Engpässe bei Rechenleistung und Daten überwinden und sich auch in Zukunft rasant weiterentwickeln kann, bedarf es noch immer der gemeinsamen Anstrengung wissenschaftlicher Forscher auf der ganzen Welt. Darüber hinaus haben die ethischen, rechtlichen und sozialen Probleme, die KI mit sich bringen kann, zunehmend die Besorgnis der Menschen geweckt. Einige Wissenschaftler fordern ein Moratorium für die Entwicklung leistungsfähigerer KI-Systeme, bis der Mensch ihre Sicherheit und Kontrollierbarkeit gewährleisten kann.

Quellen:

1.https://en.wikipedia.org/wiki/DeepSeek

2.https://api-docs.deepseek.com/zh-cn/news/news1226

3.https://api-docs.deepseek.com/zh-cn/news/news250120

4. Liu, A., Feng, B., Xue, B., Wang, B., Wu, B., Lu, C., ... & Piao, Y. (2024). Technischer Bericht zu Deepseek-v3. arXiv-Vorabdruck arXiv:2412.19437.

5. Guo, D., Yang, D., Zhang, H., Song, J., Zhang, R., Xu, R., ... & He, Y. (2025). Deepseek-r1: Förderung der Denkfähigkeit in LLMS durch bestärkendes Lernen. arXiv-Vorabdruck arXiv:2501.12948.

<<:  Schwarze Technologie in der Landwirtschaft der Zukunft: Wie können grüne und intelligente Düngemittel dafür sorgen, dass Nutzpflanzen gut ernährt werden und es keine Abfälle gibt?

>>:  Sie denken vielleicht nicht, dass diese Symptome mit Schlafmangel zusammenhängen →

Artikel empfehlen

Wie funktioniert beidhändiges Rudern mit Kurzhanteln?

Rudern ist eine beliebte Rückentrainingsübung. Um...

Wann ist die beste Zeit zum Laufen?

Die beste Zeit zum Laufen ist normalerweise abend...

Wie trainiert man die Brustmuskulatur am besten?

Es gibt viele Muskeltypen im Körper und die Brust...

Welche Wirkung haben 10 Minuten Yoga vor dem Schlafengehen?

Yoga kann uns dabei helfen, Sport zu treiben, uns...

Liegestütz-Übungsmethode

Die meisten männlichen Freunde haben begonnen, au...

Weltlärmtag: Sagen Sie Nein zur „unsichtbaren Verschmutzung“

Lärm nennt man „Der unsichtbare Killer“ Insbesond...

Ältere Menschen sind nur zum Sitzen auf diesem Stuhl geeignet

Yoga steht in der Vorstellung vieler Menschen für...

Schrittgeschwindigkeit nach dem Abendessen

Nach dem Abendessen spazieren zu gehen ist eine g...

Sind Schwimm- und Gymnastikbälle gut für das Training?

Schwimmen und Ballspiele sind sehr verbreitete Sp...