Krebs ist seit jeher eine der größten Herausforderungen für die Menschheit. Jedes Jahr erkrankt er an über 19 Millionen Menschen und führt zu 10 Millionen Todesfällen. Eine frühzeitige Krebserkennung in Kombination mit bestehenden Behandlungen kann die Überlebensraten und Behandlungsergebnisse bei allen Krebsarten deutlich verbessern. Künstliche Intelligenz (KI) verspricht nun eine Beschleunigung dieses Prozesses und Ärzte könnten KI schon bald nutzen, um bei ihren Patienten Krebs zu erkennen und zu diagnostizieren, was eine frühere Behandlung ermöglicht . Kürzlich trainierte ein Forschungsteam des Imperial College London und der University of Cambridge ein künstliches Intelligenzmodell namens EMethylNET, das durch Beobachtung der DNA-Methylierungsmuster 13 verschiedene Krebsarten (darunter Brustkrebs, Leberkrebs, Lungenkrebs und Prostatakrebs) von nicht-krebsartigem Gewebe unterschied – mit einer Genauigkeit von bis zu 98,2 % . Das zugehörige Papier mit dem Titel „Früherkennung und Diagnose von Krebs mit interpretierbarem maschinellem Lernen zur Aufdeckung krebsspezifischer DNA-Methylierungsmuster“ wurde in Biology Methods and Protocols veröffentlicht. Dem Artikel zufolge basiert das Modell auf Gewebeproben (und nicht auf DNA-Fragmenten im Blut) und befindet sich noch im experimentellen Stadium. Bevor das System in der klinischen Praxis weiter eingesetzt werden kann, sind zusätzliche Schulungen und Tests an vielfältigeren Biopsieproben erforderlich. Die Forscher sind davon überzeugt, dass die besondere Bedeutung dieser Studie in der Verwendung eines erklärbaren Modells künstlicher Intelligenz liegt, das eine Erklärung für die Logik hinter den Vorhersagen liefert . Die Studie untersuchte auch die Funktionsweise ihres Modells und kam zu dem Ergebnis, dass es zu einem deutlich besseren Verständnis der zugrundeliegenden Prozesse der Karzinogenese beiträgt. Das Multiklassifizierungsmodell zeigte eine gute Leistung mit einer Genauigkeitsrate von über 98 %. Krebs war schon immer eine der größten Herausforderungen für die Menschheit. Die Entwicklung von Krebs ist äußerst komplex und die Behandlung wird mit der Zeit immer schwieriger. Eine frühzeitige Krebsvorsorge ist von entscheidender Bedeutung und stellt eine der wichtigen Richtungen dar, an deren Bewältigung die medizinische Gemeinschaft intensiv arbeitet. Genetische Informationen sind in einem Muster aus vier Basen (A, T, G und C) in der DNA kodiert. Veränderungen in der Umgebung außerhalb der Zelle können dazu führen, dass bestimmte DNA-Basen durch die Hinzufügung von Methylgruppen verändert werden, ein Prozess, der als „DNA-Methylierung“ bezeichnet wird. Jede Zelle verfügt über Millionen dieser DNA-Methylierungsmarkierungen. Die Forscher beobachteten Veränderungen dieser Marker in den frühen Stadien der Krebsentwicklung und glauben, dass sie bei der Frühdiagnose von Krebs hilfreich sein könnten. Die Identifizierung von DNA-Methylierungssignaturen, die für verschiedene Krebsarten spezifisch sind, ist wie die Suche nach der Nadel im Heuhaufen. In dieser Arbeit verwendete das Forschungsteam Methoden des maschinellen Lernens, um krebsspezifische Veränderungen der normalen gewebespezifischen Methylierung zu identifizieren und nutzte dazu DNA-Methylierungs-Microarray-Daten von 13 Krebsarten und entsprechenden normalen Geweben. Die Methylomdaten basierten auf Illumina Infinium-Arrays und die Daten wurden wie unter „Methoden“ beschrieben extrahiert, bereinigt und verarbeitet. Die Methylierungs-Microarray-Daten wurden mithilfe eines Paars methylierter und unmethylierter Sonden analysiert, um das Verhältnis der Intensität der methylierten Sonde zur Gesamtintensität an einer bestimmten CpG-Position (Beta-Wert genannt) zu bestimmen. Sie trainierten und evaluierten vier verschiedene Modelltypen: logistische Regression, Support Vector Machine (SVM), Gradient Boosted Decision Tree (XGBoost) und Deep Neural Network (DNN). Für die ersten drei Modelltypen wurden Binär- und Multiklassifizierungsmodelle erstellt. Da das binäre logistische Regressionsmodell keine signifikant bessere Leistung erbringt als das binäre XGBoost-Modell und der MCC-Score der mehrklassigen logistischen Regression niedriger ist als der von mehrklassigem XGBoost und DNN, konzentriert sich diese Studie bei der Analyse auf XGBoost und DNN. Beim Testen mit diesen unabhängigen Datensätzen zeigten die meisten binären XGBoost-Modelle (trainiert mit TCGA-Daten) gute Ergebnisse. Um ein robustes Modell zu erstellen und diese Ergebnisse zu verbessern, entwickelten die Forscher EMethylNET, ein Modell, das aus einem DNN-Modell besteht, das mit aus Multi-Class-XGBoost erlernten Funktionen trainiert wurde, um die Leistung weiter zu verbessern. Abbildung | Methodenübersicht Durch die binäre Klassifizierung der DNA-Methylierung einzelner Tumor- und Normalgewebe zur Erkennung des Krebsstatus erreichten 5 von 13 Modellen (COAD, KIRC, LUAD, LUSC und UCEC) eine perfekte Testsatzleistung. Über alle Modelle hinweg betrug die durchschnittliche Genauigkeit 98,7 % und der durchschnittliche MCC (eine Leistungskennzahl, die nicht von einem starken Klassenungleichgewicht beeinflusst wird) 91,9 %. Sie trainierten anhand der gesamten Trainingsdaten ein mehrklassiges XGBoost-Modell, das 13 Krebsarten mit hoher Genauigkeit von normalen Proben unterscheiden konnte, mit einer Gesamtgenauigkeit von 98,2 % und einem Gesamt- MCC von 98,0 % . Gleichzeitig erreicht das Modell eine hohe Genauigkeit bei unabhängigen heterogenen Datensätzen und zeigt auch bei unabhängigen Datensätzen eine gute Leistung. Abbildung | Leistung binärer XGBoost-Modelle auf unabhängigen Datensätzen Die Literatur zur Verwendung methylierungsbasierter Ansätze zur Krebserkennung und -klassifizierung ist umfangreich und wächst weiter. Es wird eine vergleichende Analyse zwischen EMethylNET und anderen verwandten Studien durchgeführt, die zeigt, dass EMethylNET im Vergleich zu ähnlichen Arbeiten eine konkurrenzfähige Testsatzleistung erzielt. Tisch | Zusammenfassung der zugehörigen Forschung Mehrere Gentypen stehen in engem Zusammenhang mit krebsbedingten Prozessen Ein wesentlicher Vorteil der Verwendung interpretierbarer Methoden wie XGBoost ist die Möglichkeit, Merkmale für die Klassifizierung zu identifizieren , und das Forschungsteam untersuchte PCC anhand eines mehrklassigen XGBoost-Modells (d. h. der Eingabemerkmale von EMethylNET). PCCs können proximalen Genen zugeordnet werden – Genen, deren Genkörper oder Promotorregionen (als 1500 Basenpaare großes Fenster vor der Transkriptionsstartstelle) sich mit PCCs überschneiden, und Genen, die durch die Zuordnung mehrerer Klassen von PCCs zu proximalen Genen gewonnen werden, werden als „Multiklassengene“ bezeichnet. Sie führten eine funktionelle Anreicherungsanalyse an mehreren Genkategorien durch und fanden heraus, dass diese eine Anreicherung an Genen aufwiesen, die zur Karzinogenese und zu transkriptionellen regulatorischen Merkmalen beitragen, sowie an krebsbezogenen Signalwegen und Netzwerken. Der multiklassige Gensatz besteht aus 229 bekannten Tumorsuppressoren und Onkogenen sowie 546 Transkriptionsregulatoren und ist an einer breiten Palette krebsbezogener Signalwege und Prozesse beteiligt. Darüber hinaus stellten sie fest, dass die Genliste viele nichtkodierende RNA-Gene enthielt, die hauptsächlich aus lncRNAs bestanden. Dies steht im Einklang mit der Ansicht, dass eine wachsende Zahl von Studien gezeigt hat, dass lncRNA und andere nichtkodierende RNAs eine Schlüsselrolle bei der Karzinogenese spielen. Im Vergleich zu ähnlichen Studien ist diese Studie die erste, die eine eingehende Signaturanalyse bereitstellt, bei der CpGs vom Modell frei ausgewählt wurden, ohne dass zuvor eine Merkmalsauswahl vorgenommen wurde, die die Ergebnisse der Signaturanalyse möglicherweise verzerrt hätte. Steht die KI -Krebsvorhersage unmittelbar bevor? „Durch besseres Training anhand vielfältigerer Daten und strenge Tests in der Klinik werden rechnergestützte Ansätze wie dieser letztlich KI-Modelle hervorbringen, die Ärzten bei der Früherkennung und Früherkennung von Krebs helfen können“, sagte Shamith A. Samarajiwa, korrespondierender Autor des Artikels. „Dies wird zu besseren Behandlungsergebnissen führen.“ Dieser Ansatz kann je nach Verfügbarkeit von Trainingsdaten erweitert werden, um Hunderte von Krebsarten zu erkennen. Zu den zukünftigen Anwendungen gehört die Ausweitung dieses Ansatzes auf DNA-Methylierungsdaten aus zellfreier DNA mit dem ultimativen Ziel, mithilfe von Flüssigbiopsie-Ansätzen eine frühzeitige Erkennung mehrerer Krebsarten zu ermöglichen. Darüber hinaus ist eine klare klinische Anwendung dieses Ansatzes das Screening auf bestimmte Krebsarten oder Krebsarten unbekannter Herkunft, und obwohl das aktuelle Modell für diesen Zweck nicht optimiert ist, besteht in diesem Bereich noch Raum für Erweiterungen. Referenzlinks: |
Hot Yoga erfordert mehr Körperflexibilität als no...
Jeder kann an Krebs erkranken. Bedeutet das, dass...
Am 25. Juli schloss Indiens Raumsonde Chandrayaan...
Originaltitel: Erstmals Grundzustand einer Quante...
Gutachter dieses Artikels: Chen Sijiao, Chefarzt ...
Bewegung ist eine sehr gute Möglichkeit, gesund z...
Schnelle Radioblitze (FRBs) sind eine Art außerge...
Fitness ist ein extrem heißes Thema. Mittlerweile...
Prüfungsexperte: Li Guangwang Direktor der Abteil...
„Hochbezahlte Stellenangebote im Ausland“ und „Mo...
Gemischtes Wissen Speziell entwickelt, um Verwirr...
Schwimmen ist ein sehr gesunder Sport und jeder, ...
2023 Zu Beginn stabilisierte und erholte sich Chi...
Diese industrielle Internetplattform in Chongqing...
Ich sagte, das Karussell auf dem Jahrmarkt am Son...