Ein 21-jähriger Student hat das Geheimnis einer 2.000 Jahre alten Schriftrolle gelüftet: Mithilfe von KI konnte er den „verlorenen“ Text reproduzieren

Ein 21-jähriger Student hat das Geheimnis einer 2.000 Jahre alten Schriftrolle gelüftet: Mithilfe von KI konnte er den „verlorenen“ Text reproduzieren

Der alte Schriftrollentext, der vor über 2.000 Jahren „verschwand“, wurde nun mithilfe künstlicher Intelligenz reproduziert.

Kürzlich nutzte ein 21-jähriger Informatikstudent die Technologie künstlicher Intelligenz (KI), um das erste Wort einer ungeöffneten Herculaneum-Schriftrolle zu entdecken.

Luke Farritor von der University of Nebraska-Lincoln hat einen Algorithmus für maschinelles Lernen entwickelt, der griechische Buchstaben auf gerolltem Papyrus erkennen kann, darunter πορphiυρας (porphyras), was „lila“ bedeutet.

Indem er subtile, kleine Unterschiede in der Oberflächenstruktur nutzte, um ein neuronales Netzwerk zu trainieren und die Tinte hervorzuheben, konnte Luke erfolgreich mehr als 10 Zeichen auf einer Fläche von 4 Quadratzentimetern entziffern und lesen und gewann den Hauptpreis „First Letters“ in Höhe von 40.000 US-Dollar.

Abbildung|Luke Farritors erster Beitrag

„Als ich das erste Bild sah, war ich schockiert, dass ich tatsächlich etwas aus dem Inneren der Schriftrolle sehen konnte“, sagt Federica Nicolardi, Papyrologin an der Universität Neapel in Italien und Mitglied des akademischen Ausschusses, der Farritor’s Arbeit begutachtete.

Bei den Herculaneum-Rollen handelt es sich um antike Schriftrollen, die in einer Privatbibliothek in der Nähe von Pompeji gesammelt und beim Ausbruch des Vesuvs im Jahr 79 n. Chr. verschüttet und verkohlt wurden. Fast 2.000 Jahre lang war diese einzige erhaltene antike Bibliothek unter 20 Metern Vulkanschlamm begraben. Sie wurden im 18. Jahrhundert ausgegraben und sind, obwohl sie bis zu einem gewissen Grad erhalten sind, sehr zerbrechlich und zerfallen zu Staub, wenn sie nicht sachgemäß behandelt werden .

Wie liest man eine Schriftrolle, die nicht geöffnet werden kann? Diese Frage blieb Hunderte von Jahren unbeantwortet.

Im Jahr 2019 bildete Professor Brent Seales vom EduceLab der University of Kentucky die Herculaneum-Schriftrollen in einem Teilchenbeschleuniger ab und erstellte 3D-CT-Scans mit einer Auflösung von bis zu 4 µm. Sein Team scannte und fotografierte außerdem abgetrennte Schriftrollenfragmente mit sichtbarer Tinte und lieferte so einen Ground-Truth-Datensatz. Stephen Parsons, ein Doktorand von Professor Seales, arbeitete an der Verwendung von Modellen des maschinellen Lernens zur Erkennung von Tinte in CT-Scans und konnte die Fragmente erfolgreich trennen.

Dieser Erfolg erregte die Aufmerksamkeit der Technologieunternehmer Nat Friedman und Daniel Gross, die die Vesuvius Challenge ins Leben riefen, um den Fortschritt zu beschleunigen. Sie starteten im März 2023 einen offenen Wettbewerb, der neben einem Hauptpreis von 700.000 US-Dollar auch mehrere kleinere Preise für die Entwicklung von Open-Source-Tools und -Technologien bot.

Später begann eine kleine Gruppe von Forschern, die 3D-Struktur der Schriftrolle mithilfe von Tools abzubilden, die ursprünglich von EduceLab entwickelt und von der Community verbessert wurden. Bis Juli dieses Jahres wurden Hunderte Quadratzentimeter der Schriftrolle zerteilt und „fast plattgedrückt“.

Anfang August schrieb der ehemalige JPL-Startup-Gründer Casey Handmer einen Blog-Beitrag über die Entdeckung eines „Rissmusters“, das wie Tinte aussah. Casey ist der erste Mensch seit 2.000 Jahren, der Tinte und einen Brief in einer ungeöffneten Schriftrolle findet.

Abbildung | Anmerkungen, die die Tintenpositionen zeigen (Quelle: Caseys Blogbeitrag)

Luke Farritor, ein College-Student und Sommerpraktikant bei SpaceX, erfuhr von der Vesuvius Challenge durch Dwarkesh Patels Podcast-Interview mit Nat.

Die Rissmuster, die er bei Casey sah, wurden in Discord besprochen und er begann spät in der Nacht, ein maschinelles Lernmodell anhand der Rissmuster zu trainieren. Mit jedem neu entdeckten Riss verbessert sich das Modell und es können mehr Risse auf den Rollen angezeigt werden.

Luke fand Dutzende von Tintenstrichen und einige vollständige Buchstaben, die beschriftet und als Trainingsdaten verwendet werden konnten. Bald darauf zeigten sich auf der Schriftrolle Risse, die mit bloßem Auge nicht zu erkennen waren. Bald begannen sich aus den Spuren Andeutungen von Buchstaben und richtigen Wörtern zu bilden.

Ein anderer Konkurrent, Youssef Nader, ein ägyptischer Biorobotik-Student in Berlin, verfolgte unterdessen einen anderen Ansatz. Inspiriert von den Erkenntnissen von Casey und Luke sichtete er die Gewinnerbeiträge für den Ink Detection Prize auf Kaggle, bei dem es um die Verbesserung von Stephen Parsons‘ maschinellem Lernansatz zur Trennung von Fragmenten ging. Er passte diese Modelle mithilfe einer Domänenübertragungstechnik an Schriftrollen an: unbeaufsichtigtes Vortraining anhand von Schriftrollendaten und anschließende Feinabstimmung anhand von Clipbeschriftungen.

Er reichte die Idee für den „Ink Detection Followup Prize“ ein und gewann einen kleinen Preis. Einige Wochen später reichte Youssef seine Arbeit beim First Letter Prize ein. Er sah die ersten Ergebnisse, die Luke auf Twitter und Discord geteilt hatte, und beschloss, sich auf denselben Bereich in der Schriftrolle zu konzentrieren.

Abbildung|Youssef Naders letzte Einreichung

Obwohl er sich überhaupt nicht auf Caseys manuelle Methode zum Auffinden von Rissen verließ, gelang es ihm, mithilfe eines modifizierten Modells aus einem Kaggle-Wettbewerb einige Buchstaben zu finden. Anschließend versah er die Etikettendaten mit Anmerkungen, die wie Buchstabenformen aussahen.

Die Segmentierungsteams und Teilnehmer machen weiterhin Fortschritte und vor einigen Tagen produzierte Youssefs Modell ein neues Bild von erstaunlicher Klarheit und Größe (siehe unten).

Thea Sommerschield, Historikerin für Altgriechisch und Altrömisch an der Universität Ca’ Foscari in Venedig, erklärte gegenüber Nature, die Entdeckung könne „unser Verständnis der antiken Geschichte und Literatur revolutionieren“.

Referenzlinks:

https://www.nature.com/articles/d41586-023-03212-1

https://scrollprize.org/firstletters

https://people.com/21-year-old-wins-usd40k-after-using-ai-to-read-first-word-on-2-000-year-old-papyrus-scroll-8358107

Autor: Yan Yimi

Herausgeber: Academic

<<:  [Welttag der Wirbelsäule] Übungen zur Linderung von Schmerzen im unteren Rücken und in der Taille können helfen

>>:  Ist eine „Weltraumbestattung“ tatsächlich möglich?

Artikel empfehlen

Obwohl er den Mathematikpreis verpasste, bereute er die Entscheidung nie|Time Letter

Im Alter von 31 Jahren schlug er die „Wu-Formel“ ...

Warum gibt es dieses Jahr so ​​viele schlechte einheimische Filme?

Die Diskussion über die Qualität eines Films ist ...

Adobe: Bericht zu Web-Kundenerfahrungstrends 2020

Adobe hat den „Web Customer Experience Trends Rep...

So trainieren Sie Muskelkraft

Es gibt viele Möglichkeiten, Muskelkraft zu train...

Verschiedene Sportmethoden für junge Leute

Heutzutage treiben viele junge Leute aus privaten...