Mit einer Genauigkeitsrate von über 98 % ermöglicht KI einen neuen Ansatz zur Krebsfrüherkennung! Kommt die Ära der Krebsfrühbehandlung?

Mit einer Genauigkeitsrate von über 98 % ermöglicht KI einen neuen Ansatz zur Krebsfrüherkennung! Kommt die Ära der Krebsfrühbehandlung?

Krebs ist seit jeher eine der größten Herausforderungen für die Menschheit. Jedes Jahr erkrankt er an über 19 Millionen Menschen und führt zu 10 Millionen Todesfällen. Eine frühzeitige Krebserkennung in Kombination mit bestehenden Behandlungen kann die Überlebensraten und Behandlungsergebnisse bei allen Krebsarten deutlich verbessern.

Künstliche Intelligenz (KI) verspricht nun eine Beschleunigung dieses Prozesses und Ärzte könnten KI schon bald nutzen, um bei ihren Patienten Krebs zu erkennen und zu diagnostizieren, was eine frühere Behandlung ermöglicht .

Kürzlich trainierte ein Forschungsteam des Imperial College London und der University of Cambridge ein künstliches Intelligenzmodell namens EMethylNET, das durch Beobachtung der DNA-Methylierungsmuster 13 verschiedene Krebsarten (darunter Brustkrebs, Leberkrebs, Lungenkrebs und Prostatakrebs) von nicht-krebsartigem Gewebe unterschied – mit einer Genauigkeit von bis zu 98,2 % .

Das zugehörige Papier mit dem Titel „Früherkennung und Diagnose von Krebs mit interpretierbarem maschinellem Lernen zur Aufdeckung krebsspezifischer DNA-Methylierungsmuster“ wurde in Biology Methods and Protocols veröffentlicht.

Dem Artikel zufolge basiert das Modell auf Gewebeproben (und nicht auf DNA-Fragmenten im Blut) und befindet sich noch im experimentellen Stadium. Bevor das System in der klinischen Praxis weiter eingesetzt werden kann, sind zusätzliche Schulungen und Tests an vielfältigeren Biopsieproben erforderlich.

Die Forscher sind davon überzeugt, dass die besondere Bedeutung dieser Studie in der Verwendung eines erklärbaren Modells künstlicher Intelligenz liegt, das eine Erklärung für die Logik hinter den Vorhersagen liefert . Die Studie untersuchte auch die Funktionsweise ihres Modells und kam zu dem Ergebnis, dass es zu einem deutlich besseren Verständnis der zugrundeliegenden Prozesse der Karzinogenese beiträgt.

Das Multiklassifizierungsmodell zeigte eine gute Leistung mit einer Genauigkeitsrate von über 98 %.

Krebs war schon immer eine der größten Herausforderungen für die Menschheit. Die Entwicklung von Krebs ist äußerst komplex und die Behandlung wird mit der Zeit immer schwieriger. Eine frühzeitige Krebsvorsorge ist von entscheidender Bedeutung und stellt eine der wichtigen Richtungen dar, an deren Bewältigung die medizinische Gemeinschaft intensiv arbeitet.

Genetische Informationen sind in einem Muster aus vier Basen (A, T, G und C) in der DNA kodiert. Veränderungen in der Umgebung außerhalb der Zelle können dazu führen, dass bestimmte DNA-Basen durch die Hinzufügung von Methylgruppen verändert werden, ein Prozess, der als „DNA-Methylierung“ bezeichnet wird. Jede Zelle verfügt über Millionen dieser DNA-Methylierungsmarkierungen. Die Forscher beobachteten Veränderungen dieser Marker in den frühen Stadien der Krebsentwicklung und glauben, dass sie bei der Frühdiagnose von Krebs hilfreich sein könnten. Die Identifizierung von DNA-Methylierungssignaturen, die für verschiedene Krebsarten spezifisch sind, ist wie die Suche nach der Nadel im Heuhaufen.

In dieser Arbeit verwendete das Forschungsteam Methoden des maschinellen Lernens, um krebsspezifische Veränderungen der normalen gewebespezifischen Methylierung zu identifizieren und nutzte dazu DNA-Methylierungs-Microarray-Daten von 13 Krebsarten und entsprechenden normalen Geweben. Die Methylomdaten basierten auf Illumina Infinium-Arrays und die Daten wurden wie unter „Methoden“ beschrieben extrahiert, bereinigt und verarbeitet. Die Methylierungs-Microarray-Daten wurden mithilfe eines Paars methylierter und unmethylierter Sonden analysiert, um das Verhältnis der Intensität der methylierten Sonde zur Gesamtintensität an einer bestimmten CpG-Position (Beta-Wert genannt) zu bestimmen.

Sie trainierten und evaluierten vier verschiedene Modelltypen: logistische Regression, Support Vector Machine (SVM), Gradient Boosted Decision Tree (XGBoost) und Deep Neural Network (DNN). Für die ersten drei Modelltypen wurden Binär- und Multiklassifizierungsmodelle erstellt.

Da das binäre logistische Regressionsmodell keine signifikant bessere Leistung erbringt als das binäre XGBoost-Modell und der MCC-Score der mehrklassigen logistischen Regression niedriger ist als der von mehrklassigem XGBoost und DNN, konzentriert sich diese Studie bei der Analyse auf XGBoost und DNN.

Beim Testen mit diesen unabhängigen Datensätzen zeigten die meisten binären XGBoost-Modelle (trainiert mit TCGA-Daten) gute Ergebnisse. Um ein robustes Modell zu erstellen und diese Ergebnisse zu verbessern, entwickelten die Forscher EMethylNET, ein Modell, das aus einem DNN-Modell besteht, das mit aus Multi-Class-XGBoost erlernten Funktionen trainiert wurde, um die Leistung weiter zu verbessern.

Abbildung | Methodenübersicht

Durch die binäre Klassifizierung der DNA-Methylierung einzelner Tumor- und Normalgewebe zur Erkennung des Krebsstatus erreichten 5 von 13 Modellen (COAD, KIRC, LUAD, LUSC und UCEC) eine perfekte Testsatzleistung. Über alle Modelle hinweg betrug die durchschnittliche Genauigkeit 98,7 % und der durchschnittliche MCC (eine Leistungskennzahl, die nicht von einem starken Klassenungleichgewicht beeinflusst wird) 91,9 %.

Sie trainierten anhand der gesamten Trainingsdaten ein mehrklassiges XGBoost-Modell, das 13 Krebsarten mit hoher Genauigkeit von normalen Proben unterscheiden konnte, mit einer Gesamtgenauigkeit von 98,2 % und einem Gesamt- MCC von 98,0 % . Gleichzeitig erreicht das Modell eine hohe Genauigkeit bei unabhängigen heterogenen Datensätzen und zeigt auch bei unabhängigen Datensätzen eine gute Leistung.

Abbildung | Leistung binärer XGBoost-Modelle auf unabhängigen Datensätzen

Die Literatur zur Verwendung methylierungsbasierter Ansätze zur Krebserkennung und -klassifizierung ist umfangreich und wächst weiter. Es wird eine vergleichende Analyse zwischen EMethylNET und anderen verwandten Studien durchgeführt, die zeigt, dass EMethylNET im Vergleich zu ähnlichen Arbeiten eine konkurrenzfähige Testsatzleistung erzielt.

Tisch | Zusammenfassung der zugehörigen Forschung

Mehrere Gentypen stehen in engem Zusammenhang mit krebsbedingten Prozessen

Ein wesentlicher Vorteil der Verwendung interpretierbarer Methoden wie XGBoost ist die Möglichkeit, Merkmale für die Klassifizierung zu identifizieren , und das Forschungsteam untersuchte PCC anhand eines mehrklassigen XGBoost-Modells (d. h. der Eingabemerkmale von EMethylNET). PCCs können proximalen Genen zugeordnet werden – Genen, deren Genkörper oder Promotorregionen (als 1500 Basenpaare großes Fenster vor der Transkriptionsstartstelle) sich mit PCCs überschneiden, und Genen, die durch die Zuordnung mehrerer Klassen von PCCs zu proximalen Genen gewonnen werden, werden als „Multiklassengene“ bezeichnet.

Sie führten eine funktionelle Anreicherungsanalyse an mehreren Genkategorien durch und fanden heraus, dass diese eine Anreicherung an Genen aufwiesen, die zur Karzinogenese und zu transkriptionellen regulatorischen Merkmalen beitragen, sowie an krebsbezogenen Signalwegen und Netzwerken. Der multiklassige Gensatz besteht aus 229 bekannten Tumorsuppressoren und Onkogenen sowie 546 Transkriptionsregulatoren und ist an einer breiten Palette krebsbezogener Signalwege und Prozesse beteiligt.

Darüber hinaus stellten sie fest, dass die Genliste viele nichtkodierende RNA-Gene enthielt, die hauptsächlich aus lncRNAs bestanden. Dies steht im Einklang mit der Ansicht, dass eine wachsende Zahl von Studien gezeigt hat, dass lncRNA und andere nichtkodierende RNAs eine Schlüsselrolle bei der Karzinogenese spielen.

Im Vergleich zu ähnlichen Studien ist diese Studie die erste, die eine eingehende Signaturanalyse bereitstellt, bei der CpGs vom Modell frei ausgewählt wurden, ohne dass zuvor eine Merkmalsauswahl vorgenommen wurde, die die Ergebnisse der Signaturanalyse möglicherweise verzerrt hätte.

Steht die KI -Krebsvorhersage unmittelbar bevor?

„Durch besseres Training anhand vielfältigerer Daten und strenge Tests in der Klinik werden rechnergestützte Ansätze wie dieser letztlich KI-Modelle hervorbringen, die Ärzten bei der Früherkennung und Früherkennung von Krebs helfen können“, sagte Shamith A. Samarajiwa, korrespondierender Autor des Artikels. „Dies wird zu besseren Behandlungsergebnissen führen.“

Dieser Ansatz kann je nach Verfügbarkeit von Trainingsdaten erweitert werden, um Hunderte von Krebsarten zu erkennen. Zu den zukünftigen Anwendungen gehört die Ausweitung dieses Ansatzes auf DNA-Methylierungsdaten aus zellfreier DNA mit dem ultimativen Ziel, mithilfe von Flüssigbiopsie-Ansätzen eine frühzeitige Erkennung mehrerer Krebsarten zu ermöglichen.

Darüber hinaus ist eine klare klinische Anwendung dieses Ansatzes das Screening auf bestimmte Krebsarten oder Krebsarten unbekannter Herkunft, und obwohl das aktuelle Modell für diesen Zweck nicht optimiert ist, besteht in diesem Bereich noch Raum für Erweiterungen.

Referenzlinks:
https://academic.oup.com/biomethods/article/9/1/bpae028/7696058

<<:  Die Datierung des Liujiang-Menschen bringt uns dem Ursprung des modernen Menschen in Ostasien einen Schritt näher!

>>:  Etwas Entspannenderes als „20 Minuten im Park“, zum Nulltarif! Sie werden sofort glücklich sein, nachdem Sie es getan haben

Artikel empfehlen

Ist Hot Yoga gut für die Haut?

Hot Yoga erfordert mehr Körperflexibilität als no...

Wie funktioniert die Morgengymnastik?

Bewegung ist eine sehr gute Möglichkeit, gesund z...

Maschinelles Lernen: Die Nadel im Heuhaufen finden

Schnelle Radioblitze (FRBs) sind eine Art außerge...

Wie kann man nach dem Fitnesstraining am besten entspannen?

Fitness ist ein extrem heißes Thema. Mittlerweile...

Teilen und verbreiten! Geh nicht, geh nicht!

„Hochbezahlte Stellenangebote im Ausland“ und „Mo...

Wie versteht man ein berühmtes Buch?

Gemischtes Wissen Speziell entwickelt, um Verwirr...

Kann Badewasser in meine Ohren gelangen?

Schwimmen ist ein sehr gesunder Sport und jeder, ...

SAVILLS: Marktbericht Industrielogistik China Januar 2023

2023 Zu Beginn stabilisierte und erholte sich Chi...