Was ist „Biocomputing“? Warum darf China nicht zurückfallen?

Was ist „Biocomputing“? Warum darf China nicht zurückfallen?

Was ist Biocomputing?

Wenn ein Wissenschaftler erzählt, dass er Proteinstrukturforschung betreibt, haben die meisten Menschen vermutlich folgendes Bild im Kopf: Er trägt einen weißen Kittel, sitzt vor einem Mikroskop und beobachtet aufmerksam. Dies scheint zum Standardbild eines Biochemikers geworden zu sein. Eines Tages gehen Sie jedoch in sein Büro, stellen jedoch fest, dass weder Mikroskope noch Reagenzgläser zu sehen sind. Man sieht ihn nur in lockerer und bequemer Freizeitkleidung, wie er Codes auf seinem Computer eintippt. Diese Szene wird sicherlich viele Leute überraschen. Genauer gesagt handelt es sich bei diesem Wissenschaftler um einen Biocomputationalisten (oder Computerbiologen). Seine Forschungsobjekte sind zwar winzige biologisch aktive Substanzen wie Proteine ​​oder DNA, doch was ihn von traditionellen Biochemikern unterscheidet, ist, dass seine Forschungswerkzeuge nicht Reagenzgläser und Mikroskope sind, sondern Computer.

Viele Menschen empfinden oft großes Ehrfurcht, wenn sie zum ersten Mal Schlagzeilen wie „Unternehmen X steigt in die Bioinformatik ein“ sehen. Einige dachten sogar, das Unternehmen würde zur Herstellung von Computern biologisch aktive Substanzen verwenden, wie etwa das mit Elektroden gefüllte weiche Hirngewebe, das in Science-Fiction-Filmen vorkommt.

Das ist ein riesiges Missverständnis. Was diese Nachrichten tatsächlich aussagen, ist: Ein bestimmtes Unternehmen möchte einen KI-Algorithmus entwickeln, der die dreidimensionale Struktur von Proteinen auf der Grundlage begrenzter Proteininformationen genau zeichnen kann. Bildlich gesprochen ist dieses Unternehmen so etwas wie die Unterstützung der Polizei bei der Entwicklung eines Programms, das anhand der Beschreibung des Opfers das Aussehen des Mörders präzise wiedergeben kann. Das Zeichnen der dreidimensionalen Struktur eines Proteins ist von großer Bedeutung für die Entwicklung neuer Medikamente, beispielsweise für die Entwicklung von Impfstoffen gegen das neue Coronavirus. Allerdings ist dieses Problem auch äußerst schwierig und stellt eine der zahlreichen kritischen Herausforderungen dar, vor denen die Menschheitswissenschaft heute steht. Lesen Sie weiter, um herauszufinden, warum es so schwierig und warum es so wichtig ist.

Das Proteinfaltungsproblem

Aus mikroskopischer Sicht ist Protein eine Gruppe großer organischer Moleküle. Es ist der grundlegende Teil des Lebens. Jedes Protein hat eine spezifische dreidimensionale Struktur, aber diese dreidimensionale Struktur hat eine Besonderheit: Sie muss aus einer langen Kette gefaltet sein. Um zu verstehen, wie die dreidimensionale Struktur von Proteinen aussieht, müssen Sie nur mit einem Kinderspielzeug namens „Magisches Lineal“ spielen, und Sie werden es sofort verstehen. Das magische Lineal besteht aus Abschnitten und jeder Abschnitt kann in verschiedene Winkel gedreht werden. Daher können Sie ein langes Zauberlineal in verschiedene Formen falten. Je mehr Abschnitte das magische Lineal hat, desto mehr Formen können gefaltet werden.

Die Grundeinheit des Proteins ist die Aminosäure, die wie ein „Knoten“ des magischen Lineals ist. Wenn Protein erstmals produziert wird, gleicht es einem langen magischen Lineal mit Dutzenden bis Hunderten von Abschnitten. Anschließend faltet es sich innerhalb weniger Mikrosekunden bis Millisekunden schnell in eine bestimmte Form. Daher sieht jedes Protein unter einem Elektronenmikroskop wie ein Wirrwarr aus.

Was die Eigenschaften und Funktionen eines Proteins bestimmt, ist daher die Aminosäuresequenz, aus der das Protein besteht, und die Form, in die sich das Protein letztendlich faltet. Wenn unser Immunsystem beispielsweise mit Viren und Bakterien infiziert wird, produziert es ein Y-förmiges Antikörperprotein. Sie haben die Form der Klauen eines Greifautomaten und können diese Eindringlinge gezielt angreifen und greifen.

Bild: Antikörper, die das Virus angreifen und erkennen

Zwischen unseren Bändern, Knochen und unserer Haut befindet sich viel Kollagen. Ihre Form gleicht einem Zopf aus drei dicken Seilen, die unserer Haut Spannung verleihen und sie elastisch erscheinen lassen.

Abbildung: Kollagen in verdrehter Form

Beispielsweise verwendet CRISPR, die im Jahr 2020 mit dem Nobelpreis ausgezeichnete Technologie zur ortsspezifischen Genbearbeitung, ebenfalls ein CAS9-Protein, das wie eine Krabbenschere aussieht. Es klammert sich fest an einen bestimmten DNA-Abschnitt im Genom und verursacht so eine Zerschneidung.

Bild: Das krabbenscherenartige CAS9-Protein (orange) klammert die DNA (grün) fest

Daher sind Wissenschaftler vor allem an zwei Informationen über Proteine ​​interessiert: zum einen an der Aminosäuresequenz des Proteins, die man sich als die „Knoten“ des magischen Lineals vorstellen kann; das andere ist die Struktur des Proteins, die nach der Faltung die Form des magischen Lineals hat. Sequenzinformationen sind relativ leicht zu erhalten, Strukturinformationen sind jedoch äußerst schwierig zu bekommen. Noch wichtiger sind jedoch strukturelle Informationen, denn die Kenntnis der Struktur eines unbekannten Proteins kann uns dabei helfen, seine Rolle in der Zelle genauer zu verstehen. Steht dieses Protein im Zusammenhang mit einer bestimmten Krankheit, können Wissenschaftler anhand seiner Strukturform entsprechende Medikamente entwickeln. Im Jahr 1972 stellte der Nobelpreisträger für Chemie Christian Anfinsen eine Hypothese auf: Tatsächlich müssen wir nur eine Information kennen. Denn er fand in seinen Experimenten heraus, dass sich ein Protein, solange sich seine Sequenz nicht ändert und es sich immer in der gleichen chemischen Umgebung befindet, jedes Mal in die gleiche dreidimensionale Struktur falten kann. Daher ist die Information darüber, wie sich ein Protein im dreidimensionalen Raum falten soll, tatsächlich in seiner Aminosäuresequenz enthalten. Mit anderen Worten: Wenn wir die Aminosäuresequenz eines Proteins kennen, sollten wir theoretisch in der Lage sein, auf seine dreidimensionale Struktur zu schließen.

Anfinsens Hypothese wurde von seinen Kollegen auf der ganzen Welt anerkannt. Die Wissenschaftler stellten jedoch bald fest, dass die Kenntnis dieser Theorie scheinbar keinen Nutzen brachte. Um eine beliebte Internetphrase zu verwenden: Es macht keinen Unterschied. Obwohl wir die Aminosäuresequenz eines Proteins im Labor relativ einfach bestimmen können, können wir, sobald uns diese Sequenz vorliegt, aufgrund eines bestimmten physikalischen Gesetzes immer noch nicht genau auf seine dreidimensionale Struktur schließen. Wissenschaftler untersuchen dies seit fast 50 Jahren, haben die Gesetze der Proteinfaltung jedoch bis heute nicht vollständig verstanden. Dieses Problem ist in der Biochemie als „Proteinfaltungsproblem“ bekannt und stellt eine der größten Herausforderungen für die Humanwissenschaften im 21. Jahrhundert dar.

Geldverbrennende Industrie

Die einzige Möglichkeit für Wissenschaftler heute, die dreidimensionale Struktur eines Proteins herauszufinden, besteht darin, enorme Mengen an Arbeitskraft und Material aufzuwenden, äußerst schwerfällige Methoden anzuwenden und eine große Zahl sich wiederholender Experimente durchzuführen, um die dreidimensionale Struktur des Proteins zu ermitteln. Die erforderlichen experimentellen Geräte wie Kryo-Elektronenmikroskop, Röntgenkristalldiffraktometer, Kernspinresonanzgerät usw. sind alle teuer. Beispielsweise kann der Preis eines Kryoelektronenmikroskops zwischen mehreren Millionen und mehreren zehn Millionen RMB liegen. Ob die Strukturanalyse reibungslos verläuft, ist größtenteils Glückssache. Wenn Sie Pech haben, erhalten Sie möglicherweise keine Ergebnisse, selbst wenn Sie das Experiment tausende Male wiederholen. Daher liegen die Kosten für die Aufklärung einer Proteinstruktur normalerweise zwischen Zehntausenden und Hunderttausenden von Dollar.

Seit Ende des letzten Jahrhunderts verfolgen einige Computertechnologieunternehmen unter Führung von IBM eine kühne Idee: Sie wollen Supercomputer nutzen, um die dreidimensionale Struktur von Proteinen anhand ihrer Aminosäuresequenzen vorherzusagen. Dies entspricht der Übertragung des ursprünglich im Reagenzglas durchgeführten Experiments in den digitalen Raum des Computers. Diese Idee war zu ihrer Zeit sehr gewagt und avantgardistisch, da der erforderliche Rechenaufwand für die damaligen Computer astronomisch war. Sie fragen sich vielleicht: Warum erfordert die Vorhersage der Faltung eines Proteins so viel Rechenarbeit? Der Berechnungsvorgang ähnelt grob gesagt der Ziehung eines Gewinns im Lotto. Wenn Sie sich ein Protein mit 100 Aminosäuren als magisches Lineal mit 100 Abschnitten vorstellen, kann es etwa 10^94 verschiedene Formen hervorbringen. Diese Zahl übersteigt bei weitem die Anzahl der Elementarteilchen im gesamten Universum. Was Computer tun, ist eigentlich ein Eliminierungsprozess. Dabei wird nach bestimmten Regeln zunächst ein bestimmter Typ absolut unmöglicher Strukturen schubweise eliminiert und anschließend, basierend auf den Eigenschaften des Proteins, eine nach der anderen. Im Endstadium ist es, als würde man ständig aus einer riesigen Lotterie ziehen, und jede Ziehung erfordert eine enorme Rechenleistung.

IBM investierte fünf Jahre in Forschung und Entwicklung und gab schließlich im Jahr 2004 die Einführung des weltweit größten Supercomputers „Blue Gene“ bekannt. Sein Hauptziel besteht darin, das Problem der Proteinfaltung zu lösen. Allerdings verliefen die Dinge nicht so optimistisch, wie Computerexperten erwartet hatten. Zehn Jahre später, nach drei Generationen von Upgrades für Blue Gene, sind Supercomputer immer noch nicht in der Lage, Reagenzgläser, Röntgenkristallbeugung und Kernspinresonanz zu ersetzen. IBM hat außerdem bedauerlicherweise die Entwicklung der Blue Gene-Reihe eingestellt[1].

Das Scheitern von IBM ist jedoch nicht gleichbedeutend mit dem Scheitern der Computersimulation der Proteinstruktur. Im Gegenteil: Angetrieben von IBM beteiligen sich immer mehr Teams an dieser Herausforderung und die Ergebnisse werden immer zahlreicher. Es tauchen nach und nach verschiedene wunderbare Möglichkeiten zur Lösung des Problems auf und das interessanteste Beispiel ist die Erfindung von Professor David Baker von der University of Washington.

Im Jahr 2008 entwickelte sein Team ein Puzzlespiel namens „Foldit“. Der Inhalt dieses Puzzlespiels besteht darin, dass der Benutzer Proteine ​​nach seinem Gefühl falten und dann nach bestimmten Regeln Punkte bekommen kann. Die Ergebnisse waren sehr ermutigend. Nachdem ein HIV-assoziiertes Protein aus Affen, das Biologen 15 Jahre lang vor Rätsel gestellt hatte, als Puzzle in das Spiel hochgeladen wurde, gelang es den Spielern, seine wahrscheinlichste Faltungsmethode in nur 10 Tagen zu entschlüsseln.

Abbildung: HIV-assoziierte Proteine ​​bei Affen

Seit 1994 gibt es einen internationalen Wettbewerb zur Vorhersage von Proteinstrukturen namens CASP. Die Veranstaltung findet alle zwei Jahre statt und hat immer mehr teilnehmende Teams sowie viele Technologiegiganten aus der ganzen Welt angezogen. Bei diesem Wettbewerb vergeben die Juroren für die von jedem Team vorhergesagte Struktur maximal 100 Punkte. Beim 14. Wettbewerb, der im Dezember 2020 zu Ende ging, gab es eine schockierende Nachricht: Das Künstliche-Intelligenz-Team von Google, das einst das berühmte Go-Programm AlphaGo entwickelte, gewann mit dem von ihnen entwickelten Programm AlphaFold die Meisterschaft und erzielte 92,4 Punkte. Auch in der vorherigen Session war es der Champion, sein Ergebnis lag jedoch unter 60 Punkten. Diese Geschwindigkeit der Verbesserung ist schockierend. Die von AlphaFold vorhergesagte Proteinstruktur kommt den Ergebnissen realer Experimente bereits sehr nahe und der Mensch ist nur noch einen Schritt davon entfernt, das Problem der Proteinfaltung mit Computern zu lösen.

China sollte eintreten

Sie sollten jetzt über ein vorläufiges Verständnis des „Biological Computing“ verfügen. Ich weiß nicht, ob Ihnen aufgefallen ist, dass China im vorherigen Artikel, wo so viel darüber gesprochen wurde, kein einziges Mal erwähnt wurde. Ein so wichtiges wissenschaftliches Unterfangen wurde in den letzten Jahrzehnten im Wesentlichen von Ausländern betrieben, und wir Chinesen hatten damit nichts zu tun. Das macht mir wirklich Sorgen. Was die Zukunft der Entwicklung neuer Medikamente, der Impfstoffentwicklung, der Präzisionsmedizin und anderer biomedizinischer Technologien angeht, kann ich fast mit Sicherheit sagen: Wer die biologische Informatik beherrscht, wird die Welt beherrschen. Das traditionelle Forschungs- und Entwicklungsmodell mit Reagenzglas und Elektronenmikroskop wird letztendlich durch KI ersetzt. Dieses wissenschaftliche Forschungsvorhaben sollte auf die Ebene einer nationalen Strategie gehoben werden.

Quelle

1. https://en.wikipedia.org/wiki/IBM_Blue_Gene

Quelle: Science Voice

Autor: Wang Jie

<<:  Mit nur einem Fünfzigtausendstel der Masse eines Elektrons kann dieser mysteriöse „unsichtbare Mann“ problemlos in unseren Körper eindringen!

>>:  Gibt es neben dem Mausoleum des Han-Kaisers Wen noch andere bedeutende Entdeckungen, die zu einer Neufassung von Schulbüchern geführt haben?

Artikel empfehlen

Wie macht man Sit-ups richtig und wie atmet man richtig?

Sit-ups sind eine Pflichtübung und bei den Mensch...

Manche Menschen sehen stark aus, aber ihre Knochen sind bereits porös!

Dieser Artikel wurde zuerst von „Hunzhi“ (WeChat-...

Krafttrainingsmethode beim Klettern

Vielleicht haben viele unserer Sportler begonnen,...

Worauf sollten Sie beim Training achten?

Fitness ist heutzutage für viele Menschen ein Leb...

Die Wirkung des Seilspringens im Sommer auf die Gewichtsabnahme

Seilspringen ist ein sehr einfacher Sport, den je...

6 Vorteile des Fahrradfahrens im Sommer

Der Redakteur lernte schon in jungen Jahren Fahrr...

Warum gibt es in der Arktis keine Pinguine? Tatsächlich gab es

Warum fressen Eisbären keine Pinguine? Dieses Rät...