Vom Digi­ta­lisat zu struk­tu­rierten Daten: Histo­ri­sche Quellen mit LLMs erschließen


Vortragsreihe: Von Büchern zu Bytes. Die digitale Transformation in der Geschichtswissenschaft.

Termin23. Januar 2026
Vortra­gendeSarah Kiener (Zentral­bi­blio­thek Zürich)
OrtOnline (Zoom)
Webseitehttps://4memory.de/aktivitaeten/veranstaltungsreihen/von-buechern-zu-bytes/

Biblio­theken und Archive verfügen heute über riesige Bestände digi­ta­li­sierter Doku­mente. Doch oft bleiben die darin enthal­tenen Infor­ma­tionen in Bild­da­teien “einge­schlossen” und sind nur schwer zugäng­lich. Gründe dafür sind unter anderem alte Schriften, mangel­hafte Druck­qua­lität und histo­ri­sche Schreib­weisen, die die auto­ma­ti­sche Texterken­nung (OCR) erschweren. Mit ihrer visu­ellen Kompo­nente und ihrer “Intel­li­genz” haben multi­mo­dale große Sprach­mo­delle (LLMs) das Poten­zial diese Lücke zu füllen. Sie können nicht nur Texte aus Scans extra­hieren und präzise tran­skri­bieren, sondern auch Inhalte inter­pre­tieren, klas­si­fi­zieren und in struk­tu­rierte Formate wie JSON oder CSV überführen.

Am Beispiel der Zürcher Nacht­zedel – Gäste­listen der Zürcher Hotels aus den Jahren 1780 bis 1792 – wird aufge­zeigt, wie sich LLMs für die Aufbe­rei­tung histo­ri­scher Quellen in maschi­nen­les­bare Daten­sätze einsetzen lassen.

Der Work­shop führt in die Grund­lagen des Promp­tings ein und vermit­telt bewährte Stra­te­gien, wie LLMs effektiv zur Gewin­nung struk­tu­rierter Daten aus Digi­ta­li­saten genutzt werden können. Die Teil­neh­menden entwi­ckeln eigene Prompts zur Extrak­tion von Infor­ma­tionen aus den Nacht­ze­deln und erhalten hilf­reiche Tipps für eine erfolg­reiche Promptgestaltung.

Einwahl­daten:

Teil­nah­me­link: https://uni-trier.zoom‑x.de/j/69148560192?pwd=ZUVjclY2V1JibXhFYVk1VGgrdE9qdz09

Meeting-ID: 691 4856 0192

Kenn­code: M0gcpwTh

Weitere Infor­ma­tionen zur Veran­stal­tungs­reihe finden Sie hier.

Die Univer­sität Trier ist Co-Appli­cant und Parti­ci­pant im NFDI-Konsor­tium 4Memory. Die Veran­stal­tungs­reihe wird orga­ni­siert von der Task Area „Data Literacy“, die von Ursula Lehm­kuhl (Univer­sität Trier, Geschichte), Marina Lemaire (Univer­sität Trier, Service­zen­trum eSci­ence) und Stefan Schmunk (Hoch­schule Darm­stadt) geleitet wird.

Top