KI sagt erfolgreich zig Millionen „Missense-Mutationen“ voraus, was das Problem der menschlichen Genetik lösen dürfte

KI sagt erfolgreich zig Millionen „Missense-Mutationen“ voraus, was das Problem der menschlichen Genetik lösen dürfte

Künstliche Intelligenz (KI) verspricht, eine der größten Herausforderungen der Humangenetik zu lösen.

Gerade erst hat ein Forschungsteam von Google DeepMind AlphaMissense auf Grundlage der AlphaFold-Methode entwickelt . Durch die Nutzung der Proteinsequenzdatenbank und des Hintergrunds zu Variantenstrukturen kann es pathogene Missense-Mutationen und unbekannte pathogene Gene identifizieren.

Es wird berichtet, dass AlphaMissense im Vergleich zu vielen bestehenden ähnlichen Tools (Varianteneffektprädiktoren oder VEPs) überlegene Fähigkeiten aufweist.

Insbesondere konnte AlphaMissense die Pathogenität von 216 Millionen möglichen Veränderungen einzelner Aminosäuren in 19.233 menschlichen Standardproteinen erfolgreich vorhersagen, was zur Vorhersage von 71 Millionen Missense-Mutationen führte. Anschließend konnte AlphaMissense 89 % der Missense-Mutationen erfolgreich vorhersagen, von denen 57 % gutartig und 32 % pathogen sein könnten .

Die zugehörige Forschungsarbeit mit dem Titel „Accurate proteome-wide missense variant effect prediction with AlphaMissense“ wurde in der maßgeblichen wissenschaftlichen Zeitschrift Science veröffentlicht.

In einem gleichzeitigen Meinungsbeitrag kommentierten Joseph A. Marsh, Professor für Computational Protein Biology an der Universität Edinburgh, und Sarah A. Teichmann, Leiterin der Zellgenetik am Wellcome Sanger Institute und Research Fellow an der Universität Cambridge:

„Obwohl diese Forschung zweifellos bei der Interpretation und Priorisierung von Varianten hilft, ist es wichtig, diese Bezeichnungen nicht mit den spezifischen klinischen Definitionen dieser Begriffe zu verwechseln, die auf mehreren Beweislinien beruhen.“

Es ist erwähnenswert, dass Google DeepMind alle AlphaMissense-Vorhersagen der Forschungsgemeinschaft kostenlos zur Verfügung gestellt und den Code des AlphaMissense-Modells als Open Source freigegeben hat .

89 % der Missense-Mutationen erfolgreich vorhergesagt

Eine Missense-Variante ist eine genetische Variation, die die Aminosäuresequenz eines Proteins verändern kann . Pathogene Missense-Varianten können die Proteinfunktion stark stören und die Fitness des Organismus verringern, während gutartige Missense-Varianten nur begrenzte Auswirkungen haben.

Von den mehr als 4 Millionen beobachteten Missense-Varianten wurden nur etwa 2 % klinisch als pathogen oder gutartig eingestuft, und die Klassifizierung der verbleibenden unbekannten Varianten stellt eine große Herausforderung in der Humangenetik dar. Der Mangel an präzisen funktionellen Vorhersagen von Missense-Varianten begrenzt die Diagnoserate seltener Krankheiten sowie die Entwicklung und Anwendung klinischer Behandlungen, die auf die zugrunde liegenden genetischen Ursachen abzielen.

Obwohl Multiplexanalysen von Varianteneffekten (MAVEs) die Auswirkungen von Proteinvarianten systematisch messen und den klinischen Ausgang von Varianten genau vorhersagen können, sind MAVEs-Experimente kostspielig und arbeitsintensiv, sodass proteomweite Untersuchungen der Variantenpathogenität unvollständig bleiben.

Methoden des maschinellen Lernens können diese Lücke bei der Varianteninterpretation schließen, indem sie Muster in biologischen Daten nutzen, um die Pathogenität nicht annotierter Varianten vorherzusagen . Der Erfolg von AlphaFold hat gezeigt, dass es möglich ist, Proteinstrukturen im großen Maßstab und mit hoher Präzision vorherzusagen, indem Proteinsequenzen als Eingabe verwendet werden. Solche Proteinstrukturmodelle können als Grundlage für das Verständnis anderer Aspekte der Proteinbiologie dienen, beispielsweise der Pathogenität von Varianten.

In dieser Studie kombinierte AlphaMissense mithilfe der Methodik von AlphaFold drei Elemente bestehender Strategien :

1) Durch schwach gekennzeichnetes Training auf der Grundlage von Populationshäufigkeitsdaten wird die Verwendung manueller Anmerkungen vermieden und somit Zirkularität vermieden.

2) Erlernen von Aminosäureverteilungen abhängig vom Sequenzkontext durch Verwendung einer unüberwachten Proteinsprachenmodellierungsaufgabe;

3) Integrieren Sie Kontext mithilfe eines von AlphaFold abgeleiteten Systems.

Dem Dokument zufolge ist das Training von AlphaMissense in zwei Phasen unterteilt : strukturelles Vortraining und Feinabstimmung der Variation. Die Vortrainingsphase ist dieselbe wie in AlphaFold beschrieben, jedoch wird dem maskierten Verlust der Rekonstruktion mehrerer Sequenzalignments ein höheres Gewicht hinzugefügt. Während der Feinabstimmung wird das Modell optimiert, um gleichzeitig die Pathogenität der Variante und die Struktur der Referenzsequenz vorherzusagen.

Frühere Studien haben gezeigt, dass gutartige Trainingsvarianten auf Varianten basieren, die häufig bei Menschen und anderen Primatenarten beobachtet werden und die gemäß der PrimateAI-Methode definiert werden, während pathogene Trainingsvarianten aus Varianten stammen, die in der menschlichen Bevölkerung nie beobachtet wurden, wobei die Stichprobengewichte vom Trinukleotidkontext und Gen abhängen.

AlphaMissense sagt nicht die Auswirkungen von Mutationen auf die Proteinstruktur oder andere Auswirkungen auf die Proteinstabilität voraus. Stattdessen wird eine Datenbank mit verwandten Proteinsequenzen und dem strukturellen Kontext der Variante verwendet, um einen Wert zwischen 0 und 1 zu generieren, der die Wahrscheinlichkeit bewertet, dass die Variante wahrscheinlich pathogen ist . Die kontinuierlichen Bewertungen ermöglichen dem Benutzer, einen Schwellenwert auszuwählen, der seinen Genauigkeitsanforderungen für die Klassifizierung einer Variante als pathogen oder gutartig entspricht.

AlphaMissense stufte 89 % der 71 Millionen möglichen Missense-Varianten als wahrscheinlich pathogen oder wahrscheinlich gutartig ein. Im Gegensatz dazu wurden nur 0,1 % der Varianten von menschlichen Experten bestätigt.

AlphaMissense erreicht hochmoderne Vorhersagen für eine breite Palette genetischer und experimenteller Benchmarks, ohne explizit mit solchen Daten trainiert zu werden.

Das Modell übertraf auch andere Computermethoden bei der Klassifizierung von Varianten in ClinVar, einem öffentlichen Datenarchiv über die Beziehung zwischen menschlicher Variation und Krankheit.

Mögliche Lösung für das Rätsel der menschlichen Genetik

Zweifellos klären die Vorhersagen von AlphaMissense die molekularen Auswirkungen von Varianten auf die Proteinfunktion auf, was zur Identifizierung pathogener Missense-Mutationen und unbekannter pathogener Gene beiträgt und gleichzeitig die Diagnoserate seltener genetischer Erkrankungen verbessert. Darüber hinaus wird AlphaMissense die Weiterentwicklung spezialisierter Prädiktoren für Proteinvarianteneffekte erleichtern.

Marsh und Teichmann wiesen auch auf eine Einschränkung von AlphaMissense hin :

Die strukturellen Komponenten seiner Prädiktoren berücksichtigen derzeit nicht, dass sich die meisten Proteine ​​zu Komplexen oder Kondensaten mit unterschiedlichen tetrameren Strukturen zusammensetzen. Mutationen in Proteinen, die Komplexe bilden, können auf eine Weise Krankheiten verursachen, die nicht unbedingt offensichtlich ist, wenn man nur die Monomerstruktur betrachtet.

Darüber hinaus führen viele krankheitsassoziierte Mutationen zu Funktionsverlusten durch Proteininstabilität oder Störung der komplexen Zusammensetzung, in anderen Fällen jedoch verursacht das mutierte Protein Krankheiten durch dominant-negative oder synergistische Effekte.

Daher ist es interessant zu beobachten, wie sich AlphaMissense bei Varianten ohne Funktionsverlust verhält, bei denen es sich typischerweise um kleine Störungen der Aminosäure handelt und die von fast allen bisher getesteten Varianteneffekt-Prädiktoren (VEPs) nur schwer genau vorhergesagt werden können.

Letztendlich könnte die Einbeziehung von Informationen über die Strukturen von Proteintetrameren durch Algorithmen möglich sein, die die Strukturen von Proteinkomplexen vorhersagen, was voraussichtlich zu größeren Verbesserungen im Bereich der Vorhersage von Varianteneffekten führen dürfte.

Referenzlinks:

www.science.org/doi/10.1126/science.adg7492

www.science.org/doi/10.1126/science.adj8672

Autor: Yan Yimi

Herausgeber: Academic

<<:  Wenn Sie diese Symptome während der Herbst-Tagundnachtgleiche bemerken, aber nicht darauf achten, besteht die Gefahr, dass Sie am Sjögren-Syndrom leiden!

>>:  Steckbrief „Pink Killer“: Die Fähigkeit der KI, Bruströntgenbilder zu lesen, ist mit der von Ärzten vergleichbar

Artikel empfehlen

Was sind die zwölf grundlegenden Yoga-Stellungen?

Viele Frauen sind schwach und haben eine sehr ger...

Was sind Latissimus-dorsi-Übungen?

Was sind Latissimus-dorsi-Übungen? Die Trainingsm...

Kann Seilspringen Bauchfett reduzieren?

Jedes Jahr, wenn die Jahreszeiten wechseln, stell...

Ist Bungee-Jumping ein Extremsport?

Manche Leute fragen sich vielleicht, ob Bungee-Ju...

Trainieren Klimmzüge wirklich die Bauchmuskeln?

Klimmzüge sind eine Art Fitnessübung und ein wich...

Kann eine Stunde tägliches Laufen beim Abnehmen helfen?

Laufen ist ein Sport, den wir täglich betreiben. ...

Wie dehnt man den Iliopsoas-Muskel?

Der Iliopsoas-Muskel ist ein Körperteil, dem viel...