Publications

2016

Thomas Stäcker, Elisa Herrmann: „Kooperationsprojekt zur Weiterentwicklung von OCR-Verfahren“. Lecture at the 12th workshop „Texterkennung in historischen Dokumenten“, 09/02/2016 in Rostock.

Elisa Herrmann: „OCR-D: Koordinierungsprojekt zur Weiterentwicklung von OCR-Verfahren“. Lecture at the Philtag 13, 25–26/02/2016 in Würzburg.

Matthias Boenig, Kay-Michael Würzner, Arne Binder, Uwe Springmann: „Über den Mehrwert der Vernetzung von OCR-Verfahren zur Erfassung von Texten des 17. Jahrhunderts“. Lecture at the DHd 2016, 07–12/03/2016 in Leipzig.

2017

Elisa Herrmann: „Aktuelle OCR-Entwicklungen und ihr Einsatz in der Praxis“. Lecture at the „Berliner Bibliothekswissenschaftlichem Kolloquium“, 17/01/2017 in Berlin.

Thomas Stäcker, Elisa Herrmann: „OCR-D: Koordinierte Förderinitiative zur Weiterentwicklung von OCR für historische Dokumente“. Lecture at the 106th Bibliothekartag, 30/05–02/06/2017 in Frankfurt a. Main. urn:nbn:de:0290-opus4-30040.

Kay-Michael Würzner: „(Open-Source-)OCR-Workflows“ Lecture at the DH-colloquium at the BBAW, 04/08/2017 in Berlin. https://edoc.bbaw.de/frontdoor/index/index/docId/2786.

Kay-Michael Würzner, Matthias Boenig: „Perspektiven der automatischen Texterfassung als Grundlage wissenschaftlicher Editionen am Beispiel der Brief- und Schriftenausgabe der Bernd Alois Zimmermann-Gesamtausgabe“. Workshop of the „AG eHumanities Mainz. Geisteswissenschaftliche Forschungsdaten. Methoden zur digitalen Erfassung“. Preparation and presentation, 18–20/10/2017 in Mainz.

Kay-Michael Würzner, Matthias Boenig: „Compilation of a Large Ground-Truth Data Set: Using Transkribus“. Presentation at the Transkribus User Conference 2017, 02–03/11/2017 in Wien.

Thomas Stäcker, Elisa Herrmann: „OCR-D – Koordinierte Förderinitiative zur Weiterentwicklung von OCR-Verfahren“. Bibliotheksdienst 05/12/2017, Vol. 52 (1). München: De Gruyter Saur.

2018

Matthias Boenig, Maria Federbusch, Elisa Herrmann, Clemens Neudecker, Kay-Michael Würzner: „Ground Truth: Grundwahrheit oder Ad-Hoc-Lösung? Wo stehen die Digital Humanities?“. Lecture at the DHd 2018, 28/02/2018 in Köln.

Elisa Herrmann: „Wie gut sind 85%?“. Lecture at the MWW / DARIAH-DE expert workshop „Suchtechnologien“, 24/05/2018 in Weimar. https://docs.google.com/presentation/d/1zoa7z2oj2KY5cIM88-1QzEh53YAj5tX5P9iaF46oqhU/edit#slide=id.p1.

Konstantin Baierer, Kay-Michael Würzner: „An open-source framework for integrating multi-source layout and text recognition tools into scalable OCR workflows“. Lecture at the Bibliotheca Baltica Symposium, 04–05/10/2018 in Rostock, https://ocr-d.github.io/2018-10-05-baltica/index.html#/.

Stefan Weil: „126 Jahre Zeitung online – Fundgrube für historisch Interessierte und Motor für die Bibliotheks-IT“. Lecture at the 107th Bibliothekartag, 15/06/2018 in Berlin. https://madoc.bib.uni-mannheim.de/46507/.

Klaus Schulz, Florian Fink: “Novel software fro cleansing digitised historical texts”. Scientia 28/11/2018. https://doi.org/10.26320/SCIENTIA278

2019

Elisa Herrmann: „Von der Vision zur Umsetzung: Der aktuelle Entwicklungsstand von OCR-D“. Lecture at the 7th Bibliothekskongress, 18/03/2019 in Leipzig. https://www.researchgate.net/publication/332173701_Von_der_Vision_zur_Umsetzung_Der_aktuelle_Entwicklungsstand_von_OCR-D.

Matthias Boenig: „OCR-D in der Praxis: Ein gemeinsamer Ausblick mit Dienstleistern und Anwendern“. Public working session at the 7th Bibliothekskongress, 18/03/2019 in Leipzig. https://opus4.kobv.de/opus4-bib-info/frontdoor/index/index/searchtype/collection/id/17097/docId/16357/start/0/rows/20.

Stefan Weil: „Hands-On Lab digital / Vom Bild zum Text. Automatisierte Texterkennung in historischen Drucken mit der freien Software Tesseract“. Lecture at the 108th Bibliothekartag and the 7th Bibliothekskongress, 18/03/2019 in Leipzig https://nbn-resolving.org/urn:nbn:de:0290-opus4-163511.

Konstantin Baierer, Matthias Boenig, Volker Hartmann, Elisa Herrmann: „Vom gedruckten Werk zu elektronischem Volltext“. Workshop at the DHd 2019, 25/03/2019 in Mainz. http://kba.cloud/2019-03-25-dhd/.

Jan Kamlah, Stefan Weil: „Forschungsdaten aus Digitalisaten“. Presentation at the „E-Science-Tage“, 28/03/2019 in Heidelberg. https://heibox.uni-heidelberg.de/d/31bb269467/files/?p=%2FVortr%C3%A4ge%2FC3_2019-03-28-Kamlah-Weil.pdf.

Nikolaus Weichselbaumer, Mathias Seuret, Saskia Limbach, Vincent Christlein, Andreas Maier: „Automatic Font Group Recognition in Early Printed Books“. Lecture at the DHd 2019, 25–29/03/19 in Mainz und Frankfurt a. Main.

Matthias Boenig, Konstantin Baierer, Volker Hartmann, Maria Federbusch and Clemens Neudecker: „Labelling OCR Ground Truth for Usage in Repositories“. Lecture at the DATeCH 2019. 3rd International Conference on Digital Access to Textual Cultural Heritage 2019, 09/05/2019 in Brüssel.

Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Hermann, Volker Hartmann: „OCR-D: An end-to-end open-source OCR framework for historical documents“. Lecture at the DATeCH 2019. 3rd International Conference on Digital Access to Textual Cultural Heritage 2019, 09/05/2019 in Brüssel. https://www.slideshare.net/cneudecker/ocrd-an-endtoend-open-source-ocr-framework-for-historical-printed-documents.

Tobias Englmeier, Florian Fink, Klaus Schulz: “A-I-PoCoTo - Combining automated and interactive OCR postcorrection”. Lecture at the DATeCH 2019. 3rd International Conference on Digital Access to Textual Cultural Heritage 2019, 09/05/2019 in Brüssel.

Stefan Weil: „Tesseract OCR – News“. Lecture at the ELAG 2019, 09/05/2019 in Berlin. https://www.elag2019.de/talks/2019-05-09-tesseract-elag.pdf.

Noah Metzger, Stefan Weil: „Optimierter Einsatz von OCR-Verfahren – Tesseract als Komponente im OCR-D-Workflow“. Workshop at the MAD HD, 30/07/2019 in Heidelberg.

Clemens Neudecker, Konstantin Baierer, Maria Federbusch, Kay-Michael Würzner, Matthias Boenig, Elisa Herrmann, Volker Hartmann: „OCR-D: An end-to-end open source OCR framework for historical documents“. EuropeanaTech Insight 31/07/2019, Issue 13. https://pro.europeana.eu/page/issue-13-ocr#ocr-d-an-end-to-end-open-source-ocr-framework-for-historical-documents.

Noah Metzger: „Projektabschlusspräsentation“. University library Mannheim, 19/09/2019 in Mannheim. https://madoc.bib.uni-mannheim.de/52213/.

Konstantin Baierer, Rui Dong, Clemens Neudecker. „okralact – a multi-engine Open Source OCR training system”. Lecture at the 5th International Workshop on Historical Document Imaging and Processing HIP 2019 as part of the ICDAR 2019, 20/9/2019 in Sydney https://hackmd.io/@kba/SyiQKUCUH#/.

Mathias Seuret, Saskia Limbach, Nikolaus Weichselbaumer, Andreas Maier and Vincent Christlein. „Dataset of Pages from Early Printed Books with Multiple Font Groups”. Lecture at the 5th International Workshop on Historical Document Imaging and Processing HIP 2019 as part of the ICDAR 2019, 20/9/2019 in Sydney.

Konstantin Baierer, Elisabeth Engl, Michael Luetgen. “OCR(-D) und Kitodo”. Presentation at the Kitodo user meeting 2019, 19/11/2019 in Hamburg https://hackmd.io/@kba/S1peIVxhH#/.