Den Kurs der biologischen Forschung verändern: KI-Modelle entschlüsseln den Code der Lebensinformationen

Den Kurs der biologischen Forschung verändern: KI-Modelle entschlüsseln den Code der Lebensinformationen

Im Bereich der Biowissenschaften gibt es viele Forschungsrichtungen, beispielsweise die Zellbiologie und Molekularbiologie auf mikroskopischer Ebene sowie die Ökologie, die die Beziehung zwischen Organismen und der Umwelt untersucht. Die Forschung, die den Gesetzen der Lebensaktivitäten, den Entwicklungsmechanismen und dem Wesen des Lebens am nächsten kommt, ist die Forschung an biologischen Makromolekülen wie Proteinen und Nukleinsäurestrukturen.

Durch systematische und gründliche Proteinforschung können wir die Zusammensetzung und Funktionsänderungen lebender Organismen auf einer tieferen Ebene interpretieren, die Mechanismen der Lebensfunktionen und -entwicklung umfassender aufdecken und die Entwicklung der Biowissenschaften, der Arzneimittelentwicklung und der synthetischen Biologie vorantreiben. Daher sind Proteinforschung, Proteinstrukturvorhersage usw. Bereiche, in denen Wissenschaft und Industrie stark involviert sind. Im Zeitalter der künstlichen Intelligenz haben wir dank der enormen Verbesserung der Rechenleistung und der Algorithmusmodelle auch den historischen Moment der Vorhersage von Proteinstrukturen erlebt.

Der alle zwei Jahre stattfindende CASP-Wettbewerb ist als „Olympischer Wettbewerb auf dem Gebiet der Proteinstrukturvorhersage“ bekannt. Bei der Bewertung des Protein-Testsatzes auf Grundlage von CASP14 (dem 14. Internationalen Wettbewerb zur Vorhersage von Proteinstrukturen im Jahr 2020) erzielte Tianrang TRFold das beste Ergebnis unter allen öffentlichen Modellen zur Vorhersage von Proteinstrukturen in China und wurde nur von DeepMinds AlphaFold2 übertroffen, das weltweit den ersten Platz belegte. Der CASP-Wettbewerb ist ein sehr prestigeträchtiger Wettbewerb. Das Erzielen hervorragender Ergebnisse bei einem derartigen internationalen Wettbewerb bedeutet auch, dass die heimische Computerbiologie den Durchbruch geschafft und die weltweit erste Liga erreicht hat.

Ob es sich um das weltbekannte AlphaFold2-Modell oder das neue inländische TRFold-Modell handelt, diese hochmodernen KI-Modelle haben der Forschung im Bereich der katalytischen Effizienz der Biowissenschaften einen entscheidenden Beitrag geleistet. Lassen Sie uns im Anschluss an den Wertermittlungsprozess der Proteinforschung einen Blick auf diese Reise der Neugestaltung der Bereiche Biowissenschaften und Medizin werfen.

Eröffnen Sie wissenschaftliche Forschungsideen und Forschungsräume

Wir haben in der Mittelschule eine kurze Einführung zum Thema Protein erhalten. Wir wissen, dass Protein das wichtigste funktionelle Molekül in Zellen ist und an fast allen Zellfunktionen beteiligt ist: zum Beispiel an verschiedenen Enzymen, die die Verdauung von Nahrung katalysieren können; Hämoglobin im Blut transportiert Nährstoffe und Stoffwechselabfälle; es ist an der Regulierung des Stoffwechsels in Organismen beteiligt, beispielsweise Insulin; Myosin wird bei der Bildung des Zytoskeletts verwendet und Proteine ​​sind an der Immunität, Zelldifferenzierung, Apoptose und anderen Prozessen beteiligt.

Damit Proteine ​​an Zellfunktionen teilnehmen können, müssen sie sich in bestimmte Strukturen falten. Allerdings sind ihre Typen aufgrund der unterschiedlichen Anordnung und Position äußerst zahlreich. Es gibt 10^300 Möglichkeiten für Proteine, sich im dreidimensionalen Raum zu falten, und ihre Strukturen sind sehr komplex. Verschiedene Faltungsmethoden machen die Aktivität und die biologischen Eigenschaften von Proteinen unsicher und diese komplexe Eigenschaft erschwert auch den Weg der Proteinforschung.

Zur Beobachtung der Proteinstruktur gibt es drei traditionelle Hauptmethoden: Kernspinresonanz, Röntgenstrahlen und Kryo-Elektronenmikroskopie. Diese Methoden sind jedoch häufig auf teure Geräte und viel Ausprobieren angewiesen, und die Untersuchung jeder Struktur dauert mehrere Jahre. In der Vergangenheit haben manche Wissenschaftler Jahrzehnte damit verbracht, eine klare dreidimensionale Struktur eines Proteins zu erhalten, und die Bestimmung der dreidimensionalen Struktur eines Proteins ist im Bereich der Biologie zu einer sehr schwierigen Forschungsaufgabe geworden. Ohne die Unterstützung der KI-Technologie konnten bisher lediglich 170.000 dreidimensionale Strukturen klar erkannt werden, was im Vergleich zur Gesamtmenge der Proteine ​​eine enorme Lücke darstellt.

Die neuesten Fortschritte bei der Anwendung von KI auf Proteinstrukturen, nämlich das AlphaFold2-Modell und das TRFold-Modell, können Proteinstrukturen mit hoher Zuverlässigkeit in wenigen Tagen oder sogar Minuten vorhersagen, was früher Jahrzehnte dauerte. Im Vergleich zu herkömmlichen Messmethoden ist es nicht nur schnell, sondern auch kostengünstig und eignet sich sehr gut für die Erfassung von Proteinstrukturen im Hochdurchsatzverfahren. Die Studie zeigt, dass, wenn es bei diesem Tempo weitergeht, die Vorhersage von 130 Millionen Proteinstrukturen bis zum Ende dieses Jahres abgeschlossen sein wird, was den Forschungsprozess in den Biowissenschaften völlig verändern könnte.

Dies bedeutet auch, dass die KI-gestützte Vorhersage von Proteinstrukturen im großen Maßstab zu einem wichtigen Werkzeug für wissenschaftliche Forscher wird, das neue wissenschaftliche Probleme aus struktureller Sicht beantworten und neue Ideen für die wissenschaftliche Forschung eröffnen kann. Beispielsweise können Forscher durch Strukturanalysen funktionelle Anmerkungen zu Proteinmolekülen mit unbekannter Funktion oder neu entdeckten Proteinen vornehmen und die Gestaltung biologischer Experimente zur Bestätigung ihrer Funktionen steuern. Darüber hinaus ist es möglich, die Struktur von Proteinen zu analysieren, um funktionelle Einheiten oder Domänen zu identifizieren, Ziele für genetische Manipulationen bereitzustellen und eine zuverlässige Grundlage für die Entwicklung neuer Proteine ​​oder die Modifizierung vorhandener Proteine ​​zu schaffen. KI-Modelle wie TRFold, das vom Tianrang-Team entwickelt wurde, können weiteren Raum für Entdeckungen und die Erforschung innovativer Forschung im Bereich des biologischen Computings eröffnen, wobei der Schwerpunkt auf Fragen der Proteinstruktur und -funktion liegt, und die Entwicklung dieses Bereichs beschleunigen. Neben der Unterstützung im biologischen Aufbau finden KI-Modelle auch im Forschungsprozess der Medizin und Pharmakologie Anwendung.

Schnelle Analyse der Virusstruktur und Einbeziehung der Arzneimittelentwicklungszeit

Die Erforschung und Entwicklung neuer Medikamente ist eines der riskantesten, komplexesten und zeitaufwändigsten technischen Forschungsfelder der menschlichen Entwicklung. Einem statistischen Bericht des Tufts Center zufolge sind für die Entwicklung eines neuen Medikaments, das erfolgreich auf den Markt gebracht werden kann, durchschnittlich 2,6 Milliarden Dollar und etwa zehn Jahre erforderlich. Die hohen Kosten hängen mit der enormen Ausfallrate bei der Arzneimittelforschung und -entwicklung zusammen. Im letzten Jahrzehnt lag die durchschnittliche Erfolgsquote von Arzneimittelentwicklungsprojekten von der klinischen Phase 1 bis zur FDA-Zulassung bei 7,9 %.

Mit der Entwicklung der künstlichen Intelligenz konnten bei der Entwicklung einiger neuer Medikamente unter Einsatz von KI die Kosten um 35 % gesenkt und der Forschungs- und Entwicklungszyklus von 5–10 Jahren auf 1–3 Jahre verkürzt werden. Tatsächlich ist die Arzneimittelentwicklung ein systematisches Projekt. In diesem System kann die KI-Technologie zentrale Schwachstellen wie Screening und Designoptimierung im Arzneimittelentwicklungsprozess gezielt angehen, viel Zeit für Ausprobieren und Nacharbeiten einsparen und die Kosten der Arzneimittelentwicklung senken.

Das TRFold-Modell kann die Strukturen einiger krankheitsrelevanter Proteine ​​kostengünstig vorhersagen und dann durch Arzneimittelneupositionierung, virtuelles Screening und andere Methoden potenzielle Arzneimittel für diese Krankheiten finden. So können sich Pharmaunternehmen beispielsweise bei einigen seltenen Krankheiten wie Albinismus und Osteogenesis imperfecta nicht um die Behandlung kümmern, da die Rücklaufquoten niedrig sind und die meisten Patienten arme Menschen sind. Allein in China leiden mehr als 20 Millionen Patienten an dieser Krankheit. Obwohl vernachlässigte Krankheiten weltweit 12 % aller Krankheiten ausmachen, sind nur 1,1 % der neu entwickelten Medikamente für vernachlässigte Krankheiten bestimmt. Heute geben KI-Modelle wie AlphaFold2 und TRFold Anlass zur Hoffnung für die Entwicklung von Medikamenten gegen solche Krankheiten. Durch die schnelle und genaue Vorhersage von Proteinstrukturen liefern sie geeignete Zielmoleküle und Strukturen für die Entwicklung neuer Arzneimittelmoleküle und ermöglichen so die Entwicklung von Arzneimitteln für Krankheiten, die fast ausschließlich arme Menschen betreffen.

Bei klinischen Tests neuer Medikamente kann das TRFold-Modell auch als „Frühwarnsystem für Toxizität“ dienen. Tiermodelle sind für die Prüfung der Arzneimitteltoxizität sehr wertvoll, wir müssen jedoch die Risiken verringern, wenn wir mit hochriskanten klinischen Studien am Menschen beginnen. Andernfalls werden unerwartete toxische Nebenwirkungen dazu führen, dass das neue Medikament aus der klinischen Forschung genommen wird und alle bisherigen Bemühungen umsonst waren. Die allgemeine Lösung besteht in der Entwicklung von Systemen, die die menschliche Biologie genau nachahmen, doch dies ist nach wie vor schwer zu erreichen. KI-Modelle wie TRFold liefern uns 3D-Modelle menschlicher Proteine, die uns beim Aufbau besserer menschlicher Biosimulationssysteme helfen können.

Natürlich wird das TRFold-Modell auch in der Forschung zu bakteriellen und viralen Proteinstrukturen den Umfang der Funktionsanalyse von Proteintypen und nachgelagerten Anwendungen erweitern, wie etwa in der Forschung zu einigen viralen Infektionskrankheiten, der Entwicklung von Antibiotika und zielgerichteten Medikamenten sowie der Forschung und Entwicklung neuer effizienter Enzyme usw., um zur Arzneimittelforschung und Gesundheit beizutragen.

Es gibt jedoch noch immer viele Forschungsarbeiten, die eine extrem hohe Genauigkeit der Proteinstruktur erfordern. Beispielsweise wird die Verschiebung von Eisenionen im Hämoglobin auf der Skala von einigen Zehntel Angström diskutiert. Bei einer derart detaillierten Analyse struktureller Details kann die vorhergesagte Struktur nicht als Diskussionsgrundlage dienen, da die geringste Unsicherheit zu völlig anderen Schlussfolgerungen führen kann. Es besteht noch Verbesserungsbedarf hinsichtlich der Algorithmus-Universalität und Genauigkeit von KI-Modellen, und Algorithmen in Bereichen wie der komplexen Struktur von Proteinen und ihren Liganden sowie der dynamischen Analyse von Proteinen müssen verbessert werden.

KI-Vorhersagemodell dringt tief in Lebensinformationen ein

Die Verwendung von KI-Modellen zur Vorhersage der Struktursimulation einzelner Proteine ​​ist nur der Anfang. Die Vorhersage der Struktur gibt lediglich die Richtung der Forschung vor. Für den weiteren Fortschritt sind weiterhin Experimente und Brainstorming erforderlich. Darüber hinaus gibt es Strukturen, die sich durch KI-Modelle weder vorhersagen noch entdecken lassen und deren Erforschung weiterhin ein Rätsel bleibt, was auch für Wissenschaftler, Unternehmen und Forschungseinrichtungen viel Spielraum lässt.

Verschiedene Modelle zur Vorhersage von Proteinstrukturen im In- und Ausland werden jeweils ihre eigenen Fachgebiete besetzen und in den weiten Bereichen der Biowissenschaften und Biotechnologie eine Rolle spielen. Der Strukturbiologe und Akademiker der Chinesischen Akademie der Wissenschaften Shi Yigong äußerte sich einmal zum KI-Vorhersagemodell: „Die dreidimensionalen Strukturen von Proteinen, die im menschlichen Proteom vorhergesagt werden können, wurden im Wesentlichen von AlphaFold vorhergesagt. Insgesamt sind die Vorhersageergebnisse glaubwürdig und relativ genau. Dies ist eine sehr bemerkenswerte historische Errungenschaft in der wissenschaftlichen Erforschung der Natur durch die Menschheit und zugleich einer der wichtigsten wissenschaftlichen Durchbrüche der Menschheit im 21. Jahrhundert.“

Es besteht kein Zweifel, dass AlphaFold2 einen großen Durchbruch in der Vorhersage von Proteinstrukturen darstellt. Die hochwertigen Proteinstrukturen, die durch diese Art von KI-Modell vorhergesagt werden, werden die Entwicklung neuer Technologien für ein effizientes Screening von Verbindungen und den gesamten Lebenszyklus der Arzneimittelentwicklung fördern.

Manche Leute fragen sich vielleicht: Die Leistung des AlphaFold 2-Modells ist hoch genug, warum müssen wir dann trotzdem noch Energie und Gehirnschmalz aufwenden, um den Algorithmus selbst zu erstellen? Obwohl Deepmind das AlphaFold 2-Modell als Open Source zur Verfügung gestellt hat, handelt es sich tatsächlich um den Inferenzcode, der Open Source ist, nicht um den Trainingscode. Daher kann der von GitHub heruntergeladene Code tatsächlich nur den AF2-Modellalgorithmus ausführen und die Proteinstruktur direkt vorhersagen. Wenn Sie sich auf Fragen der Proteinstruktur und -funktion konzentrieren oder einen KI-Algorithmus entwickeln möchten, der die Genauigkeitsanforderungen für praktische Anwendungen erfüllen kann, können Sie diese Technologie ohne Erfahrung im Trainieren von Modellen oder ohne die Fähigkeit, die Ergebnisse des AlphaFold 2-Modells zu trainieren, nicht weiterentwickeln, um tiefer liegende Probleme zu lösen.

Ohne grundlegende technische Fähigkeiten zur Vorhersage von Proteinstrukturen wird die Erforschung tieferer Bereiche der Biowissenschaften, genau wie bei Chips, eingeschränkt sein. Die vom Tianrang-Team erstellte TRFold-Algorithmusplattform wurde vollständig im Inland entwickelt und langsam vom untersten Code-Level aus aufgebaut. Es hat bei internationalen Wettbewerben gute Ergebnisse erzielt und liegt nur hinter dem Modell AlphaFold 2.

Während der zweieinhalbjährigen Forschungs- und Entwicklungszeit hat TRFold Dutzende von Iterationsversionen durchlaufen. Die aktuelle Trainingsarchitektur wurde Anfang dieses Jahres entworfen. Die Datenverarbeitung und -schulung sowie die kontinuierliche Iteration und Optimierung dauerten 10 Monate. Die Vorhersagegenauigkeit der neuesten Version kommt der von AlphaFold2 nahe und überwindet den Engpass von AlphaFold2, der eine extrem große Rechenleistung erfordert. Anders als das Modell AlphaFold2 verfügt TRFold über eine eigene Denkweise und ein eigenes Design. TRFold verwendet Gewichtsverteilung, um Rechenleistung zu sparen. Wenn Trainingsressourcen und Rechenleistung begrenzt sind, hat das Tianrang-Team Verbesserungen am Daten- und Netzwerkdesign vorgenommen und verwendet für das Training nur eine kleine Menge realer Daten. Dadurch kann das Modell während des Trainings echte koevolutionäre Informationen besser erkennen und so genauere Vorhersageergebnisse für Aminosäurerestabstände und -koordinaten erzielen.

Der Rechenleistungsbedarf beträgt etwa 1/32 des von AlphaFold2 und die Vorhersage der meisten Proteinketten dauert nicht länger als 16 Sekunden. Verglichen mit den mehr als 70 Sekunden, die AlphaFold2 benötigt, um eine Proteinkette mit etwa 400 Aminosäuren vorherzusagen, bietet es offensichtliche Vorteile beim Training und der Generierung kleiner Stichprobendaten. Im nachfolgenden Prozess der Konstruktion von Protein-Interaktionsnetzwerken, bei dem der Rechenaufwand exponentiell zunimmt, ist die Forschung zur Vorhersage von Proteinstrukturen von weitreichender Bedeutung. Darüber hinaus öffnet es die Tür für eingehende inländische Forschung in Bereichen wie Strukturbiologie und Arzneimittelforschung. Aufgrund technologischer Einschränkungen verlassen wir uns nicht auf andere.

Das TRFold-Modell des Tianrang-Teams hat auch eine eigene Entwicklungsrichtung: Es konzentriert sich auf Probleme der Proteinstruktur und -funktion und ist in der Lage, die Genauigkeitsanforderungen tatsächlicher Anwendungen zu erfüllen und so die Lösung tieferer Probleme zu fördern. Wenn wir beispielsweise die Interaktion zwischen Proteinen untersuchen, können wir die aktuelle Koevolutionsanalyse des gesamten Proteoms verwenden, um eine genaue Verbindung zwischen den Interaktionen zwischen Proteinen herzustellen. Durch die Untersuchung der Wechselwirkungen zwischen Proteinen können Forscher groß angelegte Karten der Interaktionsnetzwerke erstellen, neue Ideen für Wirkstoffbindungsziele und neue Methoden für eine präzise Krankheitsbehandlung finden. Bei der Entwicklung neuer Medikamente, der Antikörpersimulation und der Entwicklung anderer Impfstoffe kann es die Genauigkeit und Erfolgsrate des Proteindesigns verbessern und dazu beitragen, das Proteindesign verschiedener Impfstoffe, wie beispielsweise des neuen Kronenimpfstoffs, zu überprüfen.

Betrachtet man die Geschichte der Wissenschaft, so war jeder größere Fortschritt in der wissenschaftlichen Forschung untrennbar mit der Unterstützung der jeweiligen Technologie verbunden. Ob in den schwierigen Zeiten der Proteinreinigung oder im Zeitalter der Kryo-Elektronenmikroskopie zur Beobachtung von Proteinen mit elektrischen Augen: Die Werkzeuge, die Wissenschaftler für ihre Forschung verwenden, sind auf dem jeweils höchsten technologischen Niveau. Angesichts der kontinuierlichen Durchbrüche in der KI-Technologie können Unternehmen wie DeepMind und Tianrang, die in den tiefen Gewässern und unerforschten Bereichen der hochmodernen Biowissenschaften führend sind, Forscher weiterhin mit KI-Technologie bei ihrer wissenschaftlichen Forschung unterstützen und es ihnen ermöglichen, sich bei der Vorhersage von Proteinstrukturen nicht mehr auf menschliches Vorwissen zu verlassen.

In absehbarer Zukunft wird die Entwicklung dieses Bereichs auf den Schultern der KI-Giganten sicherlich einen qualitativen Sprung machen. Protein ist ein Makromolekül, das den Lebensvorgang beeinflussen kann. Das KI-Algorithmusmodell hat uns eine neue Welt im Bereich der Biowissenschaften eröffnet. Diese massiven Proteinstrukturen werden durch die Technologie freigesetzt und die Interpretation und Analyse, die ihnen zugrunde liegt, enthält eine „reiche Mine“ an Lebensinformationen, die darauf wartet, von uns erforscht und abgebaut zu werden.

<<:  Yan Nings Studierende sprechen darüber: Was muss ich tun, wenn ich mein Promotionsstudium abbrechen möchte? Welchen Weg soll ich nach dem Studium einschlagen?

>>:  Ausführlich | Hat die Konsumrevolution begonnen? Recyclinggeschirr zum Mitnehmen wird in den USA zum Trend

Artikel empfehlen

Welche Art von Aerobic-Übungen kann Ihnen beim Abnehmen helfen?

Heutzutage möchten viele Menschen abnehmen, aber ...

Der neue Asia Dragon von Toyota im mittleren Alter lehnt auch Sport ab

Gemäß Toyotas aktuellem Plan für neue Autos wird ...

„Internet +“ gestaltet Smart Home neu

1. Zusammenfassung des Berichts: Smart Home ist e...

Kein Offline-Geschäft: Kann Internet-TV dem Nischendasein entgehen?

Nach einer Welle der Internetentwicklung geraten ...

So trainieren Sie mit dem Fahrrad

Heutzutage sind Fahrräder nicht nur ein Fortbeweg...

Welche Muskeln werden mit der Armstange trainiert?

Viele Menschen verwenden beim Training normalerwe...

Was beinhaltet Aerobic?

Wie das Sprichwort sagt: „Jeder liebt die Schönhe...

„Chinas Himmelsauge“ hat neue Entdeckungen gemacht!

„Chinas Himmelsauge“ hat neue Entdeckungen gemach...

Welche Gefahren birgt Hula-Hoop?

Mit der Entwicklung der Zeit mögen die Menschen i...