Mit einer Genauigkeitsrate von über 98 % ermöglicht KI einen neuen Ansatz zur Krebsfrüherkennung! Kommt die Ära der Krebsfrühbehandlung?

Krebs ist seit jeher eine der größten Herausforderungen für die Menschheit. Jedes Jahr erkrankt er an über 19 Millionen Menschen und führt zu 10 Millionen Todesfällen. Eine frühzeitige Krebserkennung in Kombination mit bestehenden Behandlungen kann die Überlebensraten und Behandlungsergebnisse bei allen Krebsarten deutlich verbessern.

Künstliche Intelligenz (KI) verspricht nun eine Beschleunigung dieses Prozesses und Ärzte könnten KI schon bald nutzen, um bei ihren Patienten Krebs zu erkennen und zu diagnostizieren, was eine frühere Behandlung ermöglicht .

Kürzlich trainierte ein Forschungsteam des Imperial College London und der University of Cambridge ein künstliches Intelligenzmodell namens EMethylNET, das durch Beobachtung der DNA-Methylierungsmuster 13 verschiedene Krebsarten (darunter Brustkrebs, Leberkrebs, Lungenkrebs und Prostatakrebs) von nicht-krebsartigem Gewebe unterschied – mit einer Genauigkeit von bis zu 98,2 % .

Das zugehörige Papier mit dem Titel „Früherkennung und Diagnose von Krebs mit interpretierbarem maschinellem Lernen zur Aufdeckung krebsspezifischer DNA-Methylierungsmuster“ wurde in Biology Methods and Protocols veröffentlicht.

Dem Artikel zufolge basiert das Modell auf Gewebeproben (und nicht auf DNA-Fragmenten im Blut) und befindet sich noch im experimentellen Stadium. Bevor das System in der klinischen Praxis weiter eingesetzt werden kann, sind zusätzliche Schulungen und Tests an vielfältigeren Biopsieproben erforderlich.

Die Forscher sind davon überzeugt, dass die besondere Bedeutung dieser Studie in der Verwendung eines erklärbaren Modells künstlicher Intelligenz liegt, das eine Erklärung für die Logik hinter den Vorhersagen liefert . Die Studie untersuchte auch die Funktionsweise ihres Modells und kam zu dem Ergebnis, dass es zu einem deutlich besseren Verständnis der zugrundeliegenden Prozesse der Karzinogenese beiträgt.

Das Multiklassifizierungsmodell zeigte eine gute Leistung mit einer Genauigkeitsrate von über 98 %.

Krebs war schon immer eine der größten Herausforderungen für die Menschheit. Die Entwicklung von Krebs ist äußerst komplex und die Behandlung wird mit der Zeit immer schwieriger. Eine frühzeitige Krebsvorsorge ist von entscheidender Bedeutung und stellt eine der wichtigen Richtungen dar, an deren Bewältigung die medizinische Gemeinschaft intensiv arbeitet.

Genetische Informationen sind in einem Muster aus vier Basen (A, T, G und C) in der DNA kodiert. Veränderungen in der Umgebung außerhalb der Zelle können dazu führen, dass bestimmte DNA-Basen durch die Hinzufügung von Methylgruppen verändert werden, ein Prozess, der als „DNA-Methylierung“ bezeichnet wird. Jede Zelle verfügt über Millionen dieser DNA-Methylierungsmarkierungen. Die Forscher beobachteten Veränderungen dieser Marker in den frühen Stadien der Krebsentwicklung und glauben, dass sie bei der Frühdiagnose von Krebs hilfreich sein könnten. Die Identifizierung von DNA-Methylierungssignaturen, die für verschiedene Krebsarten spezifisch sind, ist wie die Suche nach der Nadel im Heuhaufen.

In dieser Arbeit verwendete das Forschungsteam Methoden des maschinellen Lernens, um krebsspezifische Veränderungen der normalen gewebespezifischen Methylierung zu identifizieren und nutzte dazu DNA-Methylierungs-Microarray-Daten von 13 Krebsarten und entsprechenden normalen Geweben. Die Methylomdaten basierten auf Illumina Infinium-Arrays und die Daten wurden wie unter „Methoden“ beschrieben extrahiert, bereinigt und verarbeitet. Die Methylierungs-Microarray-Daten wurden mithilfe eines Paars methylierter und unmethylierter Sonden analysiert, um das Verhältnis der Intensität der methylierten Sonde zur Gesamtintensität an einer bestimmten CpG-Position (Beta-Wert genannt) zu bestimmen.

Sie trainierten und evaluierten vier verschiedene Modelltypen: logistische Regression, Support Vector Machine (SVM), Gradient Boosted Decision Tree (XGBoost) und Deep Neural Network (DNN). Für die ersten drei Modelltypen wurden Binär- und Multiklassifizierungsmodelle erstellt.

Da das binäre logistische Regressionsmodell keine signifikant bessere Leistung erbringt als das binäre XGBoost-Modell und der MCC-Score der mehrklassigen logistischen Regression niedriger ist als der von mehrklassigem XGBoost und DNN, konzentriert sich diese Studie bei der Analyse auf XGBoost und DNN.

Beim Testen mit diesen unabhängigen Datensätzen zeigten die meisten binären XGBoost-Modelle (trainiert mit TCGA-Daten) gute Ergebnisse. Um ein robustes Modell zu erstellen und diese Ergebnisse zu verbessern, entwickelten die Forscher EMethylNET, ein Modell, das aus einem DNN-Modell besteht, das mit aus Multi-Class-XGBoost erlernten Funktionen trainiert wurde, um die Leistung weiter zu verbessern.

Abbildung | Methodenübersicht

Durch die binäre Klassifizierung der DNA-Methylierung einzelner Tumor- und Normalgewebe zur Erkennung des Krebsstatus erreichten 5 von 13 Modellen (COAD, KIRC, LUAD, LUSC und UCEC) eine perfekte Testsatzleistung. Über alle Modelle hinweg betrug die durchschnittliche Genauigkeit 98,7 % und der durchschnittliche MCC (eine Leistungskennzahl, die nicht von einem starken Klassenungleichgewicht beeinflusst wird) 91,9 %.

Sie trainierten anhand der gesamten Trainingsdaten ein mehrklassiges XGBoost-Modell, das 13 Krebsarten mit hoher Genauigkeit von normalen Proben unterscheiden konnte, mit einer Gesamtgenauigkeit von 98,2 % und einem Gesamt- MCC von 98,0 % . Gleichzeitig erreicht das Modell eine hohe Genauigkeit bei unabhängigen heterogenen Datensätzen und zeigt auch bei unabhängigen Datensätzen eine gute Leistung.

Abbildung | Leistung binärer XGBoost-Modelle auf unabhängigen Datensätzen

Die Literatur zur Verwendung methylierungsbasierter Ansätze zur Krebserkennung und -klassifizierung ist umfangreich und wächst weiter. Es wird eine vergleichende Analyse zwischen EMethylNET und anderen verwandten Studien durchgeführt, die zeigt, dass EMethylNET im Vergleich zu ähnlichen Arbeiten eine konkurrenzfähige Testsatzleistung erzielt.

Tisch | Zusammenfassung der zugehörigen Forschung

Mehrere Gentypen stehen in engem Zusammenhang mit krebsbedingten Prozessen

Ein wesentlicher Vorteil der Verwendung interpretierbarer Methoden wie XGBoost ist die Möglichkeit, Merkmale für die Klassifizierung zu identifizieren , und das Forschungsteam untersuchte PCC anhand eines mehrklassigen XGBoost-Modells (d. h. der Eingabemerkmale von EMethylNET). PCCs können proximalen Genen zugeordnet werden – Genen, deren Genkörper oder Promotorregionen (als 1500 Basenpaare großes Fenster vor der Transkriptionsstartstelle) sich mit PCCs überschneiden, und Genen, die durch die Zuordnung mehrerer Klassen von PCCs zu proximalen Genen gewonnen werden, werden als „Multiklassengene“ bezeichnet.

Sie führten eine funktionelle Anreicherungsanalyse an mehreren Genkategorien durch und fanden heraus, dass diese eine Anreicherung an Genen aufwiesen, die zur Karzinogenese und zu transkriptionellen regulatorischen Merkmalen beitragen, sowie an krebsbezogenen Signalwegen und Netzwerken. Der multiklassige Gensatz besteht aus 229 bekannten Tumorsuppressoren und Onkogenen sowie 546 Transkriptionsregulatoren und ist an einer breiten Palette krebsbezogener Signalwege und Prozesse beteiligt.

Darüber hinaus stellten sie fest, dass die Genliste viele nichtkodierende RNA-Gene enthielt, die hauptsächlich aus lncRNAs bestanden. Dies steht im Einklang mit der Ansicht, dass eine wachsende Zahl von Studien gezeigt hat, dass lncRNA und andere nichtkodierende RNAs eine Schlüsselrolle bei der Karzinogenese spielen.

Im Vergleich zu ähnlichen Studien ist diese Studie die erste, die eine eingehende Signaturanalyse bereitstellt, bei der CpGs vom Modell frei ausgewählt wurden, ohne dass zuvor eine Merkmalsauswahl vorgenommen wurde, die die Ergebnisse der Signaturanalyse möglicherweise verzerrt hätte.

Steht die KI -Krebsvorhersage unmittelbar bevor?

„Durch besseres Training anhand vielfältigerer Daten und strenge Tests in der Klinik werden rechnergestützte Ansätze wie dieser letztlich KI-Modelle hervorbringen, die Ärzten bei der Früherkennung und Früherkennung von Krebs helfen können“, sagte Shamith A. Samarajiwa, korrespondierender Autor des Artikels. „Dies wird zu besseren Behandlungsergebnissen führen.“

Dieser Ansatz kann je nach Verfügbarkeit von Trainingsdaten erweitert werden, um Hunderte von Krebsarten zu erkennen. Zu den zukünftigen Anwendungen gehört die Ausweitung dieses Ansatzes auf DNA-Methylierungsdaten aus zellfreier DNA mit dem ultimativen Ziel, mithilfe von Flüssigbiopsie-Ansätzen eine frühzeitige Erkennung mehrerer Krebsarten zu ermöglichen.

Darüber hinaus ist eine klare klinische Anwendung dieses Ansatzes das Screening auf bestimmte Krebsarten oder Krebsarten unbekannter Herkunft, und obwohl das aktuelle Modell für diesen Zweck nicht optimiert ist, besteht in diesem Bereich noch Raum für Erweiterungen.

Referenzlinks:
https://academic.oup.com/biomethods/article/9/1/bpae028/7696058

<<: Die Datierung des Liujiang-Menschen bringt uns dem Ursprung des modernen Menschen in Ostasien einen Schritt näher!

>>: Etwas Entspannenderes als „20 Minuten im Park“, zum Nulltarif! Sie werden sofort glücklich sein, nachdem Sie es getan haben

Hundeschwänze können mit Ihnen „sprechen“

Artikel

Werden die Menschen angesichts der zunehmenden globalen Erwärmung und der steigenden Niederschläge im Norden dazu führen, dass mehr Menschen im Norden bleiben?

Artikel

Haben Sie Probleme mit Ihrem Gedächtnis? 6 Möglichkeiten, Ihr Gedächtnis zu verbessern →

Artikel

So trainieren Sie die Rückenmuskulatur

Artikel

Li Ziqi hatte durch die Dreharbeiten zum Video eine schwere Allergie und fühlte sich rundum unwohl! Warum entwickeln Menschen eine Farballergie?

Artikel

Bei einer Frau wurde die Diagnose nach Erhalt eines Kuriers gestellt und zwei wichtige Maßnahmen bewahrten ihre Familie vor Infektionen! Wie kann die Sicherheit beim Empfang einer Expresslieferung gewährleistet werden?

Artikel

Was würde passieren, wenn Sie jeden Tag eine Schachtel Blaubeeren essen würden? Wird die Haut wirklich weißer? Wird sich die Sehkraft wirklich verbessern?

Artikel

State Post Bureau: Das nationale Express-Liefervolumen während des „Double 11“-Zeitraums im Jahr 2021 erreichte 6,8 Milliarden Sendungen

Überwachungsdaten des State Post Bureau zeigten, ...

Wie begann die Plattentektonik? Stammt es aus Geothermie?

Vorwort Die Meere trocknen aus, die Felsen zerbrö...

Kalt, kalt, kalt! Die Temperatur sank stark um fast 16 °C! Eine neue Kaltfront kommt an und in diesen Gebieten wird es heftig schneien

Am 1. Dezember herrschte in den meisten Teilen de...

Mit einer Genauigkeitsrate von über 98 % ermöglicht KI einen neuen Ansatz zur Krebsfrüherkennung! Kommt die Ära der Krebsfrühbehandlung?

Hundeschwänze können mit Ihnen „sprechen“

Werden die Menschen angesichts der zunehmenden globalen Erwärmung und der steigenden Niederschläge im Norden dazu führen, dass mehr Menschen im Norden bleiben?

Haben Sie Probleme mit Ihrem Gedächtnis? 6 Möglichkeiten, Ihr Gedächtnis zu verbessern →

So trainieren Sie die Rückenmuskulatur

Li Ziqi hatte durch die Dreharbeiten zum Video eine schwere Allergie und fühlte sich rundum unwohl! Warum entwickeln Menschen eine Farballergie?

Bei einer Frau wurde die Diagnose nach Erhalt eines Kuriers gestellt und zwei wichtige Maßnahmen bewahrten ihre Familie vor Infektionen! Wie kann die Sicherheit beim Empfang einer Expresslieferung gewährleistet werden?

Wie trainiert man die Gesichtsmuskeln?

Eine Woche intensiver Erfahrung mit Xiaomi MIX: Wie ist die Anwendung?

Yiche Research Institute: Marktbericht zum Thema selbstfahrende Autos (Ausgabe 2022)

Was würde passieren, wenn Sie jeden Tag eine Schachtel Blaubeeren essen würden? Wird die Haut wirklich weißer? Wird sich die Sehkraft wirklich verbessern?

Artikel empfehlen

Die heimische Big-Data-Industrie wird behindert. Alibaba plant, in drei Jahren 50.000 Fachkräfte auszubilden

Es hat tatsächlich Vorteile, das Abendessen auszulassen! Und auch für das Abendessen gibt es einiges zu beachten!

Was sind Nackenübungen?

Was ist so magisch an „Orangenschalen“, dass sie getrocknet besser sind als frisch?

Dieses Ding kann die Gebärmutter einer Frau ernähren

Testergebnisse zur Akkulaufzeit des Xplay 3S veröffentlicht

Forschungsbericht zur künstlichen Intelligenz 2017

Welche Möglichkeiten gibt es, nur den Bizeps zu trainieren?

Wann kann ich den Kot vom letzten Jahr ausscheiden?

Welche Tabus gelten beim Praktizieren von Qigong zur Bekämpfung des Alterns?

Welche Art von Bewegung ist gut für Ihre Nieren?

Der Fahrdienst-Gigant Lyft kündigt an, sich der Forschung und Entwicklung im Bereich des autonomen Fahrens anzuschließen

State Post Bureau: Das nationale Express-Liefervolumen während des „Double 11“-Zeitraums im Jahr 2021 erreichte 6,8 Milliarden Sendungen

Wie begann die Plattentektonik? Stammt es aus Geothermie?

Kalt, kalt, kalt! Die Temperatur sank stark um fast 16 °C! Eine neue Kaltfront kommt an und in diesen Gebieten wird es heftig schneien